电子产业一站式赋能平台

PCB联盟网

搜索
查看: 245|回复: 0
收起左侧

光学片上网络的激光调制方案

[复制链接]

1076

主题

1076

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11451
发表于 2024-9-18 08:00:00 | 显示全部楼层 |阅读模式
引言1 l7 {' s( Y" o) t0 f
随着硅晶体管缩放接近极限,研究人员正在探索新技术以继续提高处理器性能和效率。有前途的方向是使用片上光学网络(也称为光学片上网络或光学NoC)来替代传统的电气互连。与电气网络相比,光学NoC在带宽、延迟和功耗方面具有潜在优势。然而,有效管理光学NoC的功耗带来了新的挑战[1]。
! j4 C7 Q  ?1 d( a" W
9 d$ u+ p% ]7 {$ N* G9 Q0 z本文将探讨用于最小化光学NoC静态功耗的激光调制方案。我们将介绍基于网络活动动态调制激光功率的关键概念、架构和预测技术。
$ O5 u2 y- y% R& e' Y: n2 K' }2 Z& |$ A: K7 h3 h- o7 K: T" B

! W' Q5 s2 R8 f7 ~. A1 {背景
. i+ K# I+ d; ^5 W, t光学NoC使用光来传输芯片上组件之间的数据。基本构建模块包括:1 [. v* m( |1 |# `0 Q
  • 激光器:光源,可以是片外或片上
  • 调制器:将电信号转换为光信号
  • 波导:在芯片上引导光
  • 光电探测器:将光信号转换回电信号
    6 Y/ N1 Q( D  k& t" W1 ]
    : i# M' p& ?, w: a$ B
    光传输本身非常高效,但产生光的激光器消耗大量功率。一个关键挑战是光子不能像电荷那样容易存储。这意味着激光器通常需要持续供电,即使不主动传输数据时也是如此。这种静态功耗可能占光学NoC总功耗的80-90%。
    " m( I8 |3 @) q6 O; t1 A% p9 g% Y! J* q4 H2 O5 L. _  L% [! l
    为解决这个问题,研究人员开发了激光调制方案,旨在根据预测的网络活动动态调整激光功率。一般方法包括:1 M5 ^5 c% j8 J9 }6 E: [* ~) v
  • 监控网络活动指标
  • 预测未来活动
  • 相应调整激光功率
  • 重新配置网络
    & Z8 W  X: E/ q. j4 F4 E, W5 b

    - ?5 h3 r9 s  m' [1 c9 C# c+ k* Z2 \让我们看看为不同类型处理器提出的一些具体方案。5 w+ z8 X4 g! f, i2 ], `9 \0 N

    ; d$ Y- C! m( J8 F6 `多核CPU设计中的激光调制方案: M0 J( }3 K; B* B
    Probe
    / f( z5 _& ]1 ]0 `1 t: r4 e最早提出的激光调制方案之一是Probe。使用64核架构,核心分组为4x4块。每个块都有专用的片外激光器,可以使用单写多读(SWMR)总线广播消息。4 Y+ V! t  f6 {+ h
    6 _. b3 C2 j& P4 ~( Y! j6 g5 s; e
    Probe根据链路利用率和缓冲区利用率指标预测未来活动。使用两种类型的预测器:
  • 用于低流量变化:过去和当前利用率的加权平均
  • 用于高变化:由利用率水平索引的模式历史表* y0 d8 H/ P8 h1 k, p
    [/ol]! p; _+ R, ]2 {
    锦标赛预测器根据最近的准确性在两者之间选择。: @% c$ J* F& d' u) d$ [
    / A2 E6 P! d3 w- j- f
    ColdBus6 X4 ~) M+ I+ }4 H. h
    ColdBus采用不同的方法,基于L1缓存未命中预测活动。关键洞察是在共享内存系统中,大部分网络流量来自L1未命中。
    4 ^( F" L; V. p6 y% Z
    3 D+ T7 n9 y$ o# O使用类似于分支预测器的基于PC的预测器来识别可能导致未命中的指令。然后,一个时期预测器估计这些未命中何时发生。
    % M& ]  J1 M, W7 F+ Z7 T$ M& L0 Z7 u( l
    ColdBus还引入了一个"额外波导",为需要的站点提供应急功率。
    # g+ s* |2 `& j/ |- Q; ]+ z+ {0 B) o( V) Z/ W# {
    PShaRe
    ; N0 D0 U( ^! PPShaRe在之前工作的基础上有几个关键创新:
  • 一致性和非一致性流量的独立网络
  • 基于神经网络的非线性预测器
  • 站点之间的功率共享
  • 重用浪费的光功率进行热调谐
    $ V; `  k: b- A[/ol]7 b5 d7 v/ |: L2 t
    图1显示了整体架构:& n1 ^0 _$ h+ ?6 R

    / q! |4 Y5 T0 u" `

    v0i132opydn64034878813.png

    v0i132opydn64034878813.png

    * r, J& _0 z2 J7 o图1:PShaRe架构,显示连接光学站点的功率和数据波导。7 J8 g# r! `7 P1 q% [
    * c6 \8 H  P  F9 @- Z6 J
    神经网络预测器使用14个性能计数器输入,对每个站点在下一个时期的活动进行二元预测。
    2 N- e2 E, ]5 n/ J. O1 i9 N1 n
    5 ~! V& p0 M; _8 sBigBus8 u" n5 e0 j& f2 j
    对于非常大的核心数(500+),需要像BigBus这样的设计。BigBus使用分层架构,将块簇组成更大的单元。
    4 Y2 t* e% R- A" r  I& q
    ; P% D- R# r6 O图2说明了BigBus设计:' E  d( F5 o8 Q. g* q" C; |2 t

    5 Z" y7 z( i6 j4 O2 h1 r% W) @  k- u

    2lsssyofp4g64034878913.png

    2lsssyofp4g64034878913.png

    7 ]3 G5 h, H7 l2 b! S. h1 n6 u+ g图2:BigBus架构,显示由蛇形光链路连接的核心和缓存库的分层组织。
    3 Y, R  c" s: L! h
    2 F0 J1 f* }( g& cBigBus使用两阶段预测过程:
  • 每个站点根据等待时间和待处理事件决定是否增加/减少令牌
  • 激光控制器将当前预测与历史数据结合
    " G) Q% ^% k  v4 \! P2 v  h[/ol]. N; y( z' }  l! C7 d. W7 o( }' h8 c
    这允许在当前条件的响应性和稳定性之间取得平衡。: a( `8 G" J$ o2 ^" e: T

    2 n9 u% n8 n  K! ^$ `

    7 g9 u  |8 \9 \( }' j6 M3 D多插槽系统(MULTI-SOCKET SYSTEMS)中的激光调制方案
    , Z4 O! j- t. Y' Q/ u1 W) {: t' C对于像服务器这样的多芯片系统,像Nuplet这样的设计将光网络扩展到插槽之间。Nuplet同时使用片内和片间光网络。% R  \* W- \) m3 _! \7 G
    : A% Y2 m$ K9 j) Q
    片间预测机制旨在确定要流通的仲裁令牌数量。它考虑:
  • 发送到片间光学站(ICOS)的消息
  • ICOS队列中的待处理事件. f$ g1 j: v+ G8 u7 F9 v# u
    [/ol]8 w9 w5 i0 o: d! w; ?2 n& I5 E% Q
    功率请求表(PRT)存储历史令牌计数。预测将PRT值与当前流量趋势和队列状态结合。' e$ R/ m0 Q3 q
    - z& C0 D6 p/ p. R$ j6 _! a0 P. |
    GPU设计中的激光调制方案7 K, {; G8 q; `, w) T3 B# y
    由于GPU侧重于内存带宽而非延迟,因此带来了独特的挑战。GPUOpt设计将光学NoC适配于GPU架构。& T, X9 _0 V# B1 G4 l

    ' b9 I" ]9 m6 x  Z* p' z图3显示了GPUOpt的整体架构:1 z6 C! c: q5 L3 q
    ! {9 ^/ @7 a9 h5 Y" N3 }

    m5tbfrm3byw64034879013.png

    m5tbfrm3byw64034879013.png
    0 S; z) }0 x2 g3 b) p8 W7 f
    图3:GPU光学NoC的架构,显示由光网络连接的SM和LLC集群。3 }5 T% E: h8 J& B0 I

    4 h# P& l% V* o+ NGPUOpt对流式多处理器(SM)站点和最后级缓存(LLC)站点使用不同的预测机制:3 @  g9 S- E# C! a: D
    1. SM站点使用基于以下因素的受限预测器(Restr_Pred):
      N. e4 a" g3 l/ M9 W
  • 接收的消息
  • 发送的消息
  • 等待时间
      ?& J1 i: h8 R: V/ e2 S

    2 a- E6 B9 x- u) O1 Q2 n5 h2. LLC站点使用考虑以下因素的灵活预测器(Flex_Pred):
    4 p4 {. u1 j$ I; i& ^
  • 接收的消息
  • 发送的消息
  • 待处理事件1 P3 q5 x% W  q" P
    + i2 x1 \' o% ~$ \; k  |
    激光控制器将这些预测结合起来,确定整体功率需求。, N" L9 d' Z0 ]: Z( R
    1 O% p! o2 I  S

    . D- F( a8 I5 _2 n9 y关键概念和趋势/ V6 }8 ~5 c. \- n9 l
    虽然具体方案各不相同,但一些共同主题和最佳实践浮现出来:
    2 v, T2 m' E3 U0 G  r) U6 C+ w/ m' A% \" E& d. ~
    1.将时间划分为固定时期进行预测和重新配置( M& o' B; D( C/ H
    2. 使用多个输入指标:
    ; D" w" c9 \. x! j3 Z
  • 网络利用率
  • 缓冲区占用率
  • 缓存未命中率
  • 指令类型
  • 待处理事件& g2 l' c+ ~2 k3 v/ V
    3. 将当前指标与历史数据结合! k0 P5 E, K8 R  y$ H2 l
    4. 使用非线性预测函数(如神经网络)捕捉复杂关系
    5 l/ c' u! u( z5 W; ~5. 对不同流量类型进行单独预测(如一致性与非一致性)
    6 e$ e9 n& o/ M9 B5 ?- R6. 分层设计以实现可扩展性
    . q! A) c6 i7 s7. 尽可能重用未使用的光功率# @4 Z+ V( o2 q+ [. R: N& t
    8. 为特定架构经验性地调整预测参数3 c5 C! C/ F, u) p
    0 w, ]% B5 [$ |- o+ L: c" ^
    图4说明了有效激光调制可能带来的功率节省:9 |1 n+ R) Y9 J/ c

      ~# z( c1 X% p4 J

    om02xkr3dhc64034879113.png

    om02xkr3dhc64034879113.png
    9 L! Z! I" y5 A
    图4:ideal、Probe和ColdBus方案在各种基准测试中的相对激光功耗。
    * ^# H  ?: a5 G# E+ ?) |7 g# r7 E! t8 V1 u
    0 H/ q$ P" M# F1 p9 R2 M/ W: Y
    未来方向2 A" O# E, M  j* i2 C* {! Y3 y) V  n
    随着光学NoC从研究转向实际实施,可以期待这些技术的进一步完善。方向包括:
    ( @- r  w$ E4 Y8 f' D
  • 用于更准确预测的机器学习技术
  • 与应用层知识的集成
  • 在运行时调整参数的自适应方案
  • 考虑电气和光网络的整体优化
  • 针对新兴工作负载(如AI加速)的专门化
    * X0 h: X6 u' D

    2 S% G$ ?- b- }7 C

      Q3 Z+ }1 f' _, q: D  X结论
    ' \5 p- b6 k% w$ k2 [+ K# P5 ]+ L3 n: X" _有效的激光调制对实现光学片上网络的潜在优势非常重要。通过准确预测网络活动并相应调整激光功率,可以在保持性能的同时最小化静态功耗。随着处理器架构继续发展,激光调制方案需要适应新的设计约束和流量模式。该领域的持续研究有望为未来计算系统解锁新的能效水平。
    * ~8 e8 @: }  |! H' u* F5 j
    # Q2 r- w: L" M- R
    4 W9 O8 y6 z$ a' n4 m
    参考文献0 ~5 E0 {# H+ \: R
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.; |2 O3 R: ^6 K2 ~( r3 u% ?  a
    * v. ^2 F% i( v4 S2 b2 O. \
    - END -
    # e5 q7 L. ~3 L9 p6 P  r
    ) I" K5 I" J: G( G. m. _软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
    # p# f) {, v1 T5 O; c点击左下角"阅读原文"马上申请6 A; K: K( {# Q- z6 T
    9 ]' r" L$ k! p. t- N+ R
    欢迎转载
    ! N+ R$ ?1 x5 C0 u+ K2 w% B& j* F0 m9 m+ \7 `. s2 a
    转载请注明出处,请勿修改内容和删除作者信息!- b0 v# S% D. C  M

    $ t( F. C: l. R: Q4 W
    & F# g, `0 q7 m6 O% s
    5 k0 m1 ~. _7 l; W' p

    tlesfwadvw464034879213.gif

    tlesfwadvw464034879213.gif

    0 N7 Y' [8 `) @! C. r3 O) C/ e
    , x, f8 j5 z5 z; r9 l" ~6 l关注我们
    8 E8 U5 {( X0 c( e# k+ b# L6 z# Q8 F! F- U# G

    2 ^, ~* o) A1 @

    0rzxntnecf364034879313.png

    0rzxntnecf364034879313.png

    , J5 A* R* x2 r* t2 a) `

    - E' l, I1 H) m0 y

    wklhaednp3g64034879413.png

    wklhaednp3g64034879413.png
    / w/ T. Q- _: i7 p0 ]8 S) a# x
    4 e0 `: ]. W% L+ l9 Z  w5 k: n

    v05awecejyj64034879513.png

    v05awecejyj64034879513.png

    0 n7 o2 W# k4 y/ B# t% s9 D
                          6 O" w! P4 ~" J  @) B; J

    % e3 w4 n" ^, J' T! z( G' h9 {

    . l; ]0 |9 ~0 d+ V  ^. I5 U4 R4 {$ C
    9 h2 a) l+ T$ N2 h" d# K关于我们:
    * m. F; r5 C3 e0 q7 K/ a" n9 r深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
    2 A- T; }, ~7 C/ p* Q/ q: k6 X' j7 h# ]& j! b& k" H
    http://www.latitudeda.com/
    7 M6 i  l8 T* o; H# V(点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表