1& D" O7 `( D |) h! T0 `; L
光学神经网络简介0 _" Z# S$ g. Q O
深度学习与光电子技术的结合为使用光学平台实现神经网络提供了新的研究方向。虽然深度学习已广泛应用于解决光电子技术问题,但反向应用——利用光电子系统实现深度学习在速度和能源效率方面具有独特优势。主要优势来自利用光进行大规模并行互连的能力,有望实现以光速运行且能耗极低的神经网络运算[1]。
% V# L' m7 `5 B( ^4 |3 N# ~% O
3ituvnx45zp6401346842.png
* D. ]1 G2 `! X
图1展示了人工智能发展的历史时间线,以及光学和光电子实现的重要里程碑,从早期光学神经网络到近期光电子平台的发展历程。
6 k* e# U4 m% ?$ c4 C+ _0 `$ `7 Q% A+ e/ w: G$ a$ m
2
8 l" m& r' `( \: ^光电子线路实现
% A3 ^. f- k, Y8 x% e实现光学神经网络的基本原理是通过光在介质中的传播来执行矩阵乘法运算。这构成了通用线性光学的基础,可编程光电子集成芯片能够实现光学模式之间的任意线性变换。
2 [8 m) |" |! t) h" Z
& ~/ P2 f. {" E2 ~; l: P9 x关键构建模块是马赫-曾德尔干涉仪(MZI),用于执行光学模式之间的2x2幺正变换。通过在网格网络中排列多个MZI,可以实现更高维度的变换。
; Q" m9 O3 ~+ `" D: [3 a1 S7 m( o
kpifxbf4tsr6401346942.png
5 t9 t( a7 Q# |. V! u图2展示了实现幺正变换的两种常见分束器排列方式,以及在集成光电子平台中使用MZI的实际实现方案。3 M! _7 g6 z# ~: a) {
, v( R3 X/ _4 {在实现通用神经网络运算时,架构包括执行矩阵乘法的光学干涉单元(OIU)和光学非线性单元(ONU)。
! o5 c, }3 d: A
gn0ds5w4igk6401347043.png
9 P+ V2 h. B# B- b图3展示了使用级联光学层实现人工神经网络的方案,每一层包含用于线性和非线性运算的OIU和ONU。2 p: t0 f& F* y
1 I/ F. @; x1 @9 z& l9 \' ]3
% C/ \4 u; `7 I- O: {! }! I实验验证
5 v. D8 v- Q# F4 F一项开创性的实验使用光电子线路实现了元音识别。该系统采用了56个MZI组成的可编程线路。
: d D& ^ \: p* Z+ H
fjntq2kof4a6401347143.png
8 m& W; J J3 v( |5 D/ U
图4展示了实验工作流程和线路的光学显微照片,突出显示了用于不同矩阵运算的MZI排列。" w5 A) C4 K- ]$ b7 l r( Q
5 J/ H1 ?6 Y( x. g6 y, C& w% c/ i/ U0 X
非线性激活函数通过可饱和吸收体实现,其响应特性由以下公式描述:
$ u3 a% O- o# C, P- m! a
qv005c0nrih6401347243.png
; }6 C3 o* N' X j- j) A$ K图5展示了用于激活的可饱和吸收体的输入-输出非线性关系。
' E3 j" z8 |: Z' s: S1 P# `2 P9 s% }* t! V% e! V/ V9 ?
实验结果在元音识别任务中达到了76.7%的分类准确率:
% H& z n: y1 `1 A) n8 e7 M! w
a0earehbgkn6401347343.png
0 ?+ D# Y3 Z( F6 s* X/ [8 o# B
图6通过混淆矩阵比较了光电子实现与传统电子神经网络的性能。' L% H$ C; q- u3 O
; v* P- {, N, I4
7 V1 n: f ]/ n5 |- J衍射深度神经网络
7 e' f$ ^0 C) N: k另一种方法是通过衍射深度神经网络(D2NNs)使用自由空间光学。理论基础在于波传播现象与线性运算之间的自然对应关系。+ N+ K' c& G2 K2 w" k$ o
52rwnwdm0pd6401347444.png
' ]3 U8 `6 r8 c/ J7 [1 P
图7说明了波传播和光-物质相互作用如何对应于神经网络中使用的基本矩阵运算。
/ u3 w' O* ~0 P/ D2 z; P% @/ j7 u
* ]- }4 p. A( |* r+ a+ L6 r, KD2NN架构由多个衍射层组成,每个点作为一个"神经元"通过波传播和干涉与相邻层连接。 |3 a$ _+ }9 d5 Q9 v G
2snxxumehsd6401347544.png
2 {, Z/ p' F4 n
图8详细说明了D2NNs的运行原理,展示了光场如何通过连续层传播及其数学表示。
, |/ R( Z A1 d/ m' ]: ?, V( r" g& j- x$ K
5
8 {; C- Q9 y! Z( D3 `& m实验实现: S3 W x' A) W
使用3D打印相位掩模已经实现了实验验证:6 @# ?1 _0 X2 o% _# }& t$ A7 I
yyebteqlpdw6401347645.png
# M4 m- s* e- _6 A: C4 j7 @
图9展示了用于分类和成像应用的D2NN器件。
3 ]/ l) _1 J% L7 Q7 N
$ I* C. [- X* L+ ~该系统在手写数字分类任务上进行了测试:
( J u& ], t- u! Z3 \
xaela0yi3aw6401347746.png
3 l p# V2 { v6 g
图10展示了使用D2NN平台进行手写数字识别的实验设置和分类结果。
1 X# A' @: T F. Y* D% C
# m5 ?4 g1 ]" K- t6- t }6 b1 j1 @4 t. L6 ~
原位训练能力
' d! a" z; v; z* C9 a L6 s* _" Y$ ?虽然大多数演示依赖于芯片外训练,但最近的发展实现了光学神经网络的原位训练。一种方法使用伴随法直接在光学域中实现反向传播。$ i. ?" S8 A! x3 ~
de34ezqvqqy6401347846.png
1 g& Z1 T) I8 g: o$ P+ |; q图11说明了通过前向和后向光传播在光学神经网络中进行原位梯度测量的程序。2 x6 `2 a$ `* n0 H, T$ l& @
- b0 \: B- r0 }8 I! f$ S% n7 q
这种方法通过光学测量实现梯度的并行计算,为光学神经网络提供了高效的训练方案。该方法已经在数值和实验上得到验证,在自适应光学网络和光量子技术处理应用方面显示出良好的应用前景。; Z$ o9 D1 b% ~9 a/ z+ m, S6 q4 Y! F
. t2 k/ m& D( `76 l) o6 Y/ o5 l0 c0 Y( `7 U
结论
) {7 k8 S2 }8 d% }光电子技术和光学平台实现神经网络代表了新一代人工智能硬件的重要研究方向。光电子集成线路和自由空间衍射系统在处理速度和能源效率方面具有独特优势。尽管在系统扩展和实现高效非线性方面仍存在挑战,但在制造技术、架构设计和原位训练方案方面的最新进展已经证明了光学神经网络的可行性。随着该领域的持续发展,我们期待看到性能提升、更大规模的实现,以及充分利用光学系统固有并行性和波动物理特性的新应用。光电子技术与深度学习的融合不仅提供了替代计算平台,还为克服传统电子处理器局限性的混合系统开辟了新途径。
( m, C! _% C/ z) }
1 V# ~2 \2 Q( g& e! Q5 D" e8 i& H参考文献/ Y! x' O2 r* ^4 c6 g- K
[1] K. Yao and Y. Zheng, "Nanophotonic Devices and Platforms," in Nanophotonics and Machine Learning, Springer Series in Optical Sciences vol. 241, Cham: Springer Nature Switzerland AG, 2023.7 P% B+ W+ O; M% b9 z
END
6 T: f/ o+ Y- i: E9 ~3 ` d9 G5 {
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。, ? r) c$ n! K: E7 e
点击左下角"阅读原文"马上申请
9 _+ O0 S8 `3 l, A8 R
/ v1 Y: r o3 o. \7 U* @. d欢迎转载
% `3 O- ~( W4 |! u+ G& E4 Y I( p8 q4 O* t
转载请注明出处,请勿修改内容和删除作者信息!4 B" W( F" [5 I; s
7 Z# x( I% A% m% C4 A# s& J O: [$ ?7 f( T! D6 I7 S
# u* [* a# g# Y
evz115qqedx6401347946.gif
7 r' o) V- m" I& p$ Y7 E7 l* }% r _- r
关注我们: a1 Z1 j Y) [. E
' o6 e1 L$ j1 k
. o; f* d- l* D8 v0 x9 q4 o
zvcargrn1px6401348046.png
$ A6 _3 R/ q7 g+ K9 ^7 d/ H% V3 n
|
9 g+ ^7 _7 W; O/ B) j
ig22tra54426401348146.png
( a9 e- ^8 h$ j: T0 N
|
3 O) u. _% x8 q
oqse011opid6401348246.png
5 j0 U/ @- K/ N' ]- Z1 _
| , M! h! d3 _. ]; j0 u' m( H
2 H! H2 f; r5 b, A3 B8 d5 g3 @1 @- |. K0 {, E2 {4 U& K
5 V$ a: o! T) c/ S关于我们:, }2 e* W+ B% r1 D
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。1 t6 h: G. h! v" i8 C( F
4 g2 }/ I r+ J% {2 U Whttp://www.latitudeda.com/
; r7 Z8 \6 d1 w* u" j9 c7 {(点击上方名片关注我们,发现更多精彩内容) |