|

引言
7 g0 l* B. _3 n0 ]4 x8 x可编程光电子线路是量子信息处理、机器学习加速和光信号处理等多种应用的关键技术。随着这些线路不断扩大以满足更复杂任务的需求,面临着与其基本构建模块——相移器——相关的独特挑战。与电子线路中的晶体管不同,相移器无法在不影响性能的情况下任意缩小。本文探讨了优化多端口干涉仪以实现相位高效可编程光电子技术的最新进展,推动这些系统向信息理论极限迈进[1]。) w7 W! t, g/ H9 y0 g
1 {* k# {. W7 G: W8 r
ojmq2yldduo64068665417.png
/ Y( `) s( v2 c2 R+ X! O
9 s+ W3 w' a6 ~8 W9 Y( y理解挑战 Y! z* T, F8 L8 } O
传统的光电子线路扩展方法主要集中在器件级改进上,如减少马赫-曾德尔干涉仪(MZI)和相移器的功耗和占用面积。然而,最新研究表明,系统和架构级的选择对整体性能和可扩展性同样有重大影响。
Q8 N) v6 N( S6 O1 ?, ?) ]1 D& \! Z. g+ q
主要挑战在于相移器设计中固有的权衡。例如,热光相移器通常需要约20 mW的功率才能实现π相移。降低功耗往往会以降低速度或增加尺寸和插入损耗为代价。相变材料(PCM)和金属氧化物半导体电容器(MOSCAP)等替代技术虽然功耗低,但会引入与相位相关的光学损耗。9 T4 `3 `2 d- w4 ~! M" |$ B
n2 a J& M6 n. ?这些权衡因素对可编程光电子线路的扩展构成了实际限制,导致现实实现的线路比光波长设定的理论最小值大10-100倍。
1 J' I0 N0 c, H" J+ Y2 R7 A6 ?
追求相位效率1 _0 _/ e& J3 o( Q; o X7 H
为应对这些挑战,研究人员开始探索"以少胜多"的方法,创建能够最小化大型线路中每个元件平均相移的架构。这种方法旨在绕过实现大相移相关的权衡,同时保持线路的功能性和可编程性。! ^ N8 w; U* Z; }
& [: G/ }- Z2 g信息理论界限6 F2 d4 p. P5 e9 V4 Y) E: @/ }* m
在深入探讨具体架构之前,了解多端口干涉仪中相位效率的基本限制很重要。研究人员利用信息理论推导出了光电子线路通用性所需的平均相移下限。# _: Y; O2 L9 [& P
, m0 T) f9 [8 c8 s$ N( G `; P5 _
z0cqiceuhwq64068665517.png
* e! b/ T8 h, C* s3 f图1:多端口干涉仪实现的映射 f : ψ → U 的可视化,其中单位体积 dVψ 映射到由梯度向量 ?ψm f 张成的平行六面体,体积为 dVU = |?(U)/?(ψ)|dVψ。4 T$ n& N! v4 \$ l
; F0 J+ u0 n3 ~这个界限随着干涉仪输入和输出模式数 N 的增加而按 O(1/√N) 缩放。这个缩放定律为优化线路架构提供了目标,并为评估不同设计的效率设定了基准。! G; R) V! o3 `6 u
- g/ b0 N' V9 F3 J& u1 XMZI网格:起点" H9 Q; r) F& F
构建通用多端口干涉仪的传统方法使用马赫-曾德尔干涉仪(MZI)网格。虽然有效,但这种架构在相位效率方面未能达到理论界限。, l. E/ l& N% }; v
$ t/ S* F H) ^; f5 G
egcuzkpdzyi64068665618.png
" S' W' c$ G% J( s' ]/ f" V
图2:(a) 8 × 8 Clements网格,由可调交叉点的矩形阵列组成(相位屏幕为清晰起见省略)。(b) MZI交叉点及其由2 × 2矩阵T(方程(10))表示的分裂比s。(c) 对于Haar均匀分布的酉矩阵,等级为1、3、5和7的MZI的P(s),显示分布如何随着向网格中心移动而集中。; n2 r" v; a5 A X- s8 J
]3 m( i7 t1 ?, ?在MZI网格中,随着线路规模的增加,平均相移保持恒定(O(1)),与信息理论界限预测的O(1/√N)缩放显著偏离。这种低效限制了基于MZI的线路随规模增大而扩展的能力。/ z! q/ c/ R& a* [/ O( N' y( ]. j
6 L) N3 v: w4 e7 g3-MZI:迈向效率的一步; G, L$ c2 ]* m; F0 ?$ [
为解决标准MZI网格的局限性,研究人员提出了一种称为3-MZI的替代设计。这种架构由标准MZI加上一个包围外部相移器的额外50:50分束器组成。
' q+ j, [: ~8 n( J3 B3 T6 d: I4 l4 R- }& Z+ {
s22ihnm3op564068665718.png
$ e; P3 j% M9 L& f4 @) K图3:(a) 标准MZI交叉点,通过极坐标将(θ, φ)映射到s。绘制了N = 16网格的概率P(s),显示了靠近s = 0的浓度。(b) P(θ, φ)随网格大小变化的概率,显示θ受限但φ不受限。(c) 3-MZI交叉点,在s = 0附近的映射在局部上是笛卡尔的,并且限制了θ和φ。(d) 利用制造过程中引入的相位偏移将分布P(θ, φ)集中在零附近。( G: f: m& c2 f- F* u
' x1 l5 s! N/ p' i; g4 Q) V$ z2 C3-MZI设计提供了几个优势:; ~; ?2 Y( e3 ~, S
1. 改进的缩放:3-MZI网格中的平均相移按O(1/√N)缩放,与理论界限相匹配。: i8 |) _! j& B
2. 受限分布:内部(θ)和外部(φ)相移都紧密地限制在其交叉状态值附近。
- y+ [0 G! x4 V+ a3. 制造优化:通过在制造过程中应用物理相位偏移,可调相移器只需实现小的残余项。
; K2 y6 d0 Q+ ~- Y/ @3 W" U+ E8 {9 `& D) F
数值模拟和理论分析表明,3-MZI架构接近信息理论界限的2-3倍以内,相比标准MZI网格有显著改进。; \* G- l3 X2 [* S; {0 _
) k% Z8 y% ~, e/ j
bvodq4gmqxv64068665818.png
' B- e# K$ s* F5 _/ _图4:(a) 大小为N = 4-1024的网格可视化,编程实现特定Haar均匀采样矩阵,其中MZI根据平均相移|ψ| ≡ 1/2(|θ| + |φ|)着色。(b) 相移矩作为网格大小的函数图(左)和每种矩类型的MZI/3-MZI比率(右),说明了后者网格类型的优势。(c) MZI和3-MZI网格的每自由度熵,与信息理论界限比较。绘制了通用和推拉(PP)界限。(d) 相移矩与界限的比较。
/ S1 ~: N0 @3 {/ w' U8 [5 P+ e- J1 D3 g; p1 k" U! H3 u
对于实际网格大小(N ≈ 256),3-MZI设计在平均相移方面比标准MZI网格减少了10-20倍,具体取决于所选择的优化指标。
9 y; o4 k' U. P0 J1 Z' @) c# G% P# z8 S- q! a3 F, \* L
# W2 Y3 r! V. z3 F0 E# s超越酉矩阵:高斯分布
! c8 ^0 V2 |4 o( H& C) `围绕多端口干涉仪的大部分理论都集中在酉矩阵上,但许多实际应用涉及非酉变换。研究人员已将分析扩展到涵盖高斯分布的目标矩阵,这在信息处理任务中很常见。9 l X: e9 k2 `7 J5 x3 L
; S$ Y! c& y# h0 Y
对于这些非酉应用,基于交叉架构的设计,如菱形和PILOSS(路径无关损耗)设计显示出了前景。当与3-MZI交叉单元结合时,这些架构可以对小条目的高斯分布矩阵达到信息理论界限。8 U- {- @! {% U! f$ x/ o8 R( ]
2 U2 G ^0 ^) ?6 ~* s0 k5 v
x1cl35h2rav64068665918.png
- ?! y' X8 J' m
图5:具有高斯随机目标矩阵的非酉网格。(a) 菱形和PILOSS网格的相移Δθ, Δφ,目标矩阵随机采样,σ/σmax = 0.8。(b) 相移分布作为网格大小的函数,显示与?ψ? ∝ 1/√N一致的方差减小。(c) L2平均相移作为σ/σmax的函数,与(推拉)信息理论界限?ψ?2 ≥ 2σ比较。
3 Q# g* ]& e" \6 x" P4 A4 [0 T+ x' {" j( \1 ~# X2 d
这些结果表明,相位高效设计不限于酉变换,可以扩展到与实际应用相关的更广泛的矩阵操作类别。5 A% s1 `! \6 ~0 b
3 j2 s. l; e7 d5 K0 o& @1 ^
实际意义:L∞约束下的神经网络训练
2 \* ?/ ?5 i2 Q, V平均相移是整体效率的重要指标,但许多实际实现面临着每个元件可达到的最大相移的"硬"上限。这种约束在光学深度学习应用中尤为相关。. {/ L# l$ M4 f0 F6 h0 [8 d
& R7 |- [* ^, M" e
为探究这些约束的影响,研究人员调查了L∞约束下光学神经网络的训练,其中最大相移被限制在一小部分弧度内。2 o) Y( U6 _9 B# l7 W) Y$ U' M
" L( a3 L" B; ` [
besu5x1pahn64068666018.png
( b; i; Y* Z4 ^5 z) G! {6 r% m图6:相位约束ONN训练。(a) ONN架构。FFT和裁剪是预处理步骤,而N × N可训练层U1和U2用Clements网格实现。(b) MNIST、FMNIST和KMNIST分类准确率作为层大小N和最大相位||ψ||∞的函数。(c) U1的矩阵范数中非对角元素贡献的分数,作为||ψ||∞的函数。MNIST,N = 64;U2的曲线类似。(d) 来自(c)的代表性矩阵,显示当||ψ||∞较小时,反对角线周围的聚集增加。
+ ~ L a+ Q7 G/ i" u# p
' w8 l& }" P9 P# f4 k令人惊讶的是,这些研究表明,即使最大相移被限制在一小部分弧度内,光学神经网络也能训练到达到与无约束模型相当的准确度。这一发现表明,L∞约束训练可能对使基于网格的光学神经网络能够扩展很重要,特别是在面临严重VπL权衡的快速平台(如LiNbO3或压电光机械系统)中。' R( a' U4 [. ]
. P# H$ ?5 r2 T! l( T& g6 y
未来方向和开放问题/ o R+ O# ?4 I9 k
随着可编程光电子技术领域的不断发展,出现了几个开放问题和未来研究方向:
1 }& a( H. D$ _/ _" t1. 过完备基:将信息理论分析扩展到相移器数量多于严格必要的系统。
* `+ u4 Q6 i/ A/ a2. 替代架构:探索非MZI基础设计(如MPLC、FFT和其他新型方法)的相移统计。
: a5 z7 i0 @& s: L3. 连续系统:研究多模波导的使用,以及它们如何突破集中元件相移器的假设。
; O5 \" R: G/ v* C7 j4. 硬件缺陷:研究相位高效设计与现实、不完美硬件的错误纠正策略之间的相互作用。
z8 w2 l1 G: z9 S3 N: ^, s4 g C! b, `
结论
3 b7 q: x: @! g0 M, d追求相位高效的可编程光电子技术代表了扩展光信息处理系统方法的重大转变。通过将相移视为需要节约的资源,研究人员发现了新的线路设计范式,有望推动大规模光电子系统的可能性边界。
3 ^# `2 f1 [' a( x+ w+ C2 o1 Z% M3 U: p6 o' V
特别是3-MZI架构已成为通用多端口干涉仪的近乎最优解决方案,与传统设计相比,在相位效率方面提供了数量级的改进。当与用于非酉操作的基于交叉架构的布局结合时,这些进展为能够处理日益复杂的量子计算、机器学习和信号处理任务的新一代光电子线路奠定了基础。9 u ^. ]' P" e
4 g, h! f$ L) Z; J+ A3 s
随着该领域不断发展,理论界限、架构创新和实际约束之间的相互作用将推动向真正大规模可编程光电子技术的进一步进展。通过推动相位效率的极限,研究人员正在为光信息处理开辟新的可能性,有朝一日可能在功率和能力方面与电子对应物相媲美或超越。% q) @+ E7 N. w' _
6 P1 N" g) l2 ^0 e
( d$ }: a$ y) F. w参考文献
) i' g, d8 j; o[1] R. Hamerly, J. R. Basani, A. Sludds, S. K. Vadlamani, and D. Englund, "Towards the Information-Theoretic Limit of Programmable Photonics," arXiv:2408.09673v1 [physics.optics], Aug. 2024.7 @1 @/ o( ]8 s- }* }
" O3 X1 ?( v0 {
- END -
) \& U: F5 }' O9 G& D& c- X# |$ X
# t9 V0 i2 [$ d- R( k' }' s软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。8 p% y3 w# V1 H" f
点击左下角"阅读原文"马上申请
' P5 G& p) A) ~/ Q5 F% q$ n8 W" g$ e, P
欢迎转载
2 S/ U) ], [7 p
; q \7 @ ? s( h) X$ p转载请注明出处,请勿修改内容和删除作者信息!
" A a$ b/ h2 ?& d4 x2 N; F1 F/ h8 |5 G- S7 e; j; V* W
0 c7 X1 Q, Y: O, c2 d5 o. v7 S, i; p9 I- `
zsg4i5k1vpl64068666119.gif
5 v! r* q0 l8 |5 t B. g% d" Q* b% l5 O: P. U8 N G; Y
关注我们 m1 q8 ^$ p% i9 k
; ?9 O9 J% o: L: [# M3 m+ p3 W2 N
et4ge1d5qtz64068666219.png
T# r7 X1 H+ ^) q: Z9 y | " j6 W$ d" _( q0 q
3xvdetv15p564068666319.png
( S) b. \/ b( R |
; b4 I6 I: _: b3 Y. |
ntjcpczmhzs64068666419.png
2 Y$ h2 e3 V' t" L | . S5 C& x& c- g' z3 c a
; X0 k7 i, F- t+ L: O
9 J4 u; K: ]" D3 [
+ f: T" g9 f- y" u U* e
关于我们:+ t% |4 j0 U9 V) @$ }2 n2 N# N
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。7 \2 g5 x" S: N; D* P; V% ]
" H# h! o1 y1 p2 @! w Whttp://www.latitudeda.com/
8 ?: V8 }8 U) m* {8 A! u(点击上方名片关注我们,发现更多精彩内容) |
|