电子产业一站式赋能平台

PCB联盟网

搜索
查看: 16|回复: 0
收起左侧

IEEE SiPhotonics2025 | 高可扩展性集成硅基光电子神经网络架构

[复制链接]

1194

主题

1194

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
13095
发表于 3 天前 | 显示全部楼层 |阅读模式
引言8 }- O. K# H" g  s2 U5 b; w2 G
光学神经网络(ONNs)因其超低延迟、超低功耗、高带宽和并行处理能力而成为下一代计算架构的优秀候选。光子作为计算媒介在执行线性代数矩阵运算方面具有显著优势,这对神经网络处理至为基础。然而,传统光计算架构面临严重的可扩展性挑战。
4 I' Z( c  ~+ U7 _; s# W! j0 u+ {- o( s/ R. f' o0 p% A/ U
本文探讨了密歇根大学研究人员提出的一种创新方法,该方法在光学神经网络中实现了卓越的可扩展性。该架构采用产品量化(Product Quantization, PQ)技术压缩基于马赫-曾德干涉仪(MZIs)的光子计算矩阵,当扩展到784 × 784网络(适用于MNIST数据集处理)时,实现了芯片尺寸332倍的显著减小[1]。
6 [/ H2 q  S9 ~& D) O

ke1ec3lf2p26401745754.png

ke1ec3lf2p26401745754.png
; X# y% R8 f; _5 g3 }
# B' m& `& v  Y0 Y( x' n% c$ L
1) P. }. {5 a3 N1 [
产品量化方法2 ~5 S- d" G+ ~$ K4 y5 s! S! \* {
PQ压缩方法是该架构创新的核心。这种技术将全连接神经网络层中复杂的矩阵向量乘法转换为高效的查找操作。该方法牺牲一些准备时间来最小化矩阵向量乘法的占用空间,同时加速计算速度。
# }% t9 h( {, U0 r
( v5 d: k% X& n( j: L该方法包括三个关键阶段。首先,在预处理K-均值阶段,标准K-均值聚类算法计算所有段的质心集。每个段获得的K个质心形成相应的码本。这一预处理步骤的计算复杂度为O(C * MaxIter * Len * N)。
: L; u# G6 ^7 V$ k) f
9 v, j; f/ N1 l4 {接下来,在预处理查找表阶段,矩阵向量乘法被分成几个可并行计算的独立向量向量乘法。对于每个向量向量乘法,所有K2种可能的结果都被预先计算并存储在查找表中。非线性激活函数也可以嵌入到这些结果中。预计算的复杂度为O(K2N)。8 K. R& I* T7 W$ w
) P# w. G8 q6 V0 v/ H* P( p; t
最后,在处理中的查找操作阶段,该架构执行简单的查找操作,而不是复杂的矩阵向量乘法。单个查找操作的计算复杂度为O(K * N/C) + O(M)。
) W4 s) m# Z( E5 D: D; v! m/ O# n
该架构实现了O(X√X)的计算复杂度,其中X = max(N, M),当N和M具有相似量级时,这比传统方法的O(NM)复杂度效率高得多。5 @+ e( ]9 D: M& ~; ]0 B# U5 {

hmrmes5al3i6401745854.png

hmrmes5al3i6401745854.png
1 H6 N0 g; o8 E& X2 Z& }  w
图1:紧凑型全芯片计算架构,显示了三个主要区域:信号生成(区域1)、信号编码和初步处理(区域2)以及查找操作(区域3)。
8 N% L: D: M* y$ Y/ r% _  p" W
( L( Y: l& L; c4 m7 ?& v2! W) V  P$ o) }3 Z' c) o" u4 Y3 z
集成平台
  W6 f2 E6 v$ d6 C* s该架构的实现依赖于先进的异构III-V-on-silicon光电子集成平台,该平台提供多功能和高密度能力。该平台包含几个关键构建模块,使全集成神经系统成为可能。
) J" ^# \; j' W

4vzl3n0ggze6401745954.png

4vzl3n0ggze6401745954.png

9 ]- a: E2 t4 F$ m6 g  R图2:关键构建模块的横截面视图,包括(a)量子点激光器、雪崩光电探测器、半导体光放大器,(b)金属氧化物半导体电容-微环谐振器、内存谐振器、非侵入式监视器,以及(c)量子阱电吸收调制器。- G. M' N+ _! ?! o4 x" G( @3 X

" m% C6 |  P6 L1 Y' j% G3 P: MPQ压缩架构将K个波长编码到单个传播路径中,并并行计算C个量化。系统由几个协同工作的组件组成。信号生成部分使用具有K个不同波长的激光器,每个支持40个输入。光被均匀分配到C个不同的码本量化中。1 D2 j5 s7 h6 p* h) ]1 U2 M8 X

7 n  F; h" }; L0 U1 G* ^在信号编码和初步处理部分,系统计算输入向量段与质心之间的欧几里得距离,使用绝对值作为近似:||vi - wordj||2 ≈ |vi - wordj|。最小信号组件然后使用监视器识别最小光强度的索引(包含原始波长信息)。
$ x6 Y+ z5 k4 `% g/ V" x
4 b, m9 ~0 j6 C- U" Z, z, }) I' F9 P查找操作部分采用成组的微环谐振器(MRRs)列来对所有输出光强度进行求和。来自码本的C个不同结果被求和以产生最终结果。
: Q/ Z! h) Z/ g2 _: b& q* L3 U2 G7 R# Y* t0 e
34 ^6 f/ H2 ~6 z& x. [/ U
性能和可扩展性2 @  w: O) w) C. |( i- p
随着I/O连接数量的增加,该架构展示了显著的可扩展性优势。虽然由于初步处理部分所需的空间,它在小I/O数量时可能在占用空间方面没有竞争力,但在大规模时提供显著优势。
- p' T4 k8 i" t7 @7 v$ l( a$ _

mgbgf3kwmag6401746054.png

mgbgf3kwmag6401746054.png

0 R( ^; g. \6 i图3:架构尺寸比较,显示不同方法的芯片占用空间与I/O数量的关系。PQ压缩架构(绿线)相比MRR和MZI方法展示了优越的可扩展性。
, x$ |. Y: D7 V/ C5 T2 u" N* {8 ^8 e. N) r: C8 i! `( W/ P9 `
对于网络尺寸N = M = 784(适用于MNIST数据集处理),压缩比达到与传统基于MZI的方法相比的332倍。此外,PQ压缩架构有潜力支持132.2 TOPS/mm2的吞吐量,代表了计算密度方面的显著进步。
$ v2 t& ?0 D" [4 a  `; _; D, P: s( {3 _/ E
4
' F# U5 Q% U3 W: k# j0 c# j: Q实验结果% c$ ^& ]- W+ K5 N0 Z$ W- A1 m
通过随机化权重矩阵W ∈ R^(784×784),打乱MNIST数据集并选择1,000个向量进行测试,评估了该架构的性能。对于每个向量v,执行了精确的向量矩阵乘法(Wv)和近似版本(Wv?)。- E0 z+ X7 g. h* T& B! U0 l
: O6 e) ]- u; e- m& `  ?
实验测量显示相对误差为0.1072,意味着近似引入了与原始结果相比约±10.7%的误差。然而,该方法实现了0.9998的余弦相似度,表明向量方向几乎完全对齐。结构相似性指数(SSIM)测量为0.8705,显示近似结果和原始结果之间的高结构相似性。这些指标表明,尽管通过近似引入了一些误差,但可以通过训练有效缓解,使该架构适用于实际神经网络实现。
8 t: ?; }- ^5 m
5 c$ A! H6 i- Q5
3 R. G# O* V# a0 t组件需求
# D: A/ P3 O$ S9 [& zPQ压缩架构的实现需要特定数量的各种光子器件。对于参数为N=M=784、C=64和K=4的网络,实现需要K个量子点分布反馈激光器(每个尺寸为6μm × 800μm),KN个可变光衰减器(VOA)(每个尺寸为10μm × 10μm),以及KN个电吸收调制器(EAM)(每个尺寸为90μm × 10μm)。此外,还需要CM + KN + KC个微环谐振器(每个尺寸为10μm × 10μm)和M个量子点雪崩光电探测器(APD)(每个尺寸为3μm × 30μm)来完成实现。
" Q3 U* h+ s; w. I& O8 a) y- K4 |, b: |5 J
6! Z' Y  L3 n' A
结论
' T8 F; A+ c0 @1 [8 ^7 D本文介绍的高可扩展性光学神经网络架构代表了光子神经网络领域的显著进展。通过利用产品量化将复杂的矩阵向量乘法转换为高效的查找操作,该架构在保持可接受精度的同时,实现了大规模网络芯片尺寸减小332倍。
/ m9 b5 B$ R, e* M
6 W* z5 r7 n% G; W8 l  S% j该架构在具有先进构建模块的异构III-V-on-silicon光电子平台上的集成,使得全芯片实现能够利用光计算的优势:超低延迟、超低功耗、高带宽和并行处理能力。
) z! u4 }0 N/ e& q7 T/ z  A5 Z! _# q. Y5 C8 {
参考文献+ L: k' n  o+ Q' K# z
[1] L. Duan, Y. Lan and D. Liang, "A Highly-Scalable Integrated Silicon Photonics Neural Network Architecture," in IEEE SiPhotonics 2025.
' Y9 l4 P, `4 r1 ^1 _END# ~% m* m5 o3 A. G: j$ }
软件试用申请欢迎光电子芯片研发人员申请试用PIC Studio,其中包含:代码绘版软件PhotoCAD,DRC软件pVerify,片上链路仿真软件pSim,光纤系统仿真软件pSim+等。更多新功能和新软件将于近期发布,敬请期待!
+ A$ r. r5 f, v/ A% B" t; c' I点击左下角"阅读原文"马上申请
2 K9 }: `2 q7 J% X0 N, e3 u6 [' |
欢迎转载
" _0 w  q! v1 [1 H; I
( |3 Z6 a7 X7 A7 Y8 s' |) H1 f$ y转载请注明出处,请勿修改内容和删除作者信息!5 b" j' I) \3 w

7 n/ j* X) k5 q
- z) C/ t! a  b. E& _- o
3 `) y8 g/ _* t5 i: Q+ A4 A' O; [

thavlpzsnck6401746154.gif

thavlpzsnck6401746154.gif

2 O  ~+ K5 b: _: a
8 G% w: C$ z7 O( }6 ?关注我们
4 J2 A8 `2 U6 V# W5 d
* P9 T% O! N/ g" ?* R7 o0 o" l

3 z4 b! l# m9 F# M" Z* _* d9 o7 B- C

kvoisslpv4n6401746254.png

kvoisslpv4n6401746254.png
/ m/ X9 ^0 ?( I7 m" G, T. {

& \! n& K+ K( v9 o8 a

v5tt5kepvnd6401746354.png

v5tt5kepvnd6401746354.png

7 c; L. K) \$ `8 @
. j3 G* H8 k: ~) z* p

10xqm1ehkkc6401746454.png

10xqm1ehkkc6401746454.png
8 D6 M1 j# |9 V6 E% R0 B5 R& B
                     
9 O% c, W8 }' L- u: N. n; A
; Q" T! `' e/ F( q+ R, p

3 E4 n# q/ i( W/ {! _. V! A, |; K" H. i. [. D' ^
关于我们:* x( o: ?. }2 n4 I' q  m7 A# V, [
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。. L  A( @, c. G, K2 c

0 s1 n  c/ D+ R/ Phttp://www.latitudeda.com/, E- z& L" B. ]- v" d0 A
(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条


联系客服 关注微信 下载APP 返回顶部 返回列表