电子产业一站式赋能平台

PCB联盟网

搜索
查看: 355|回复: 0
收起左侧

光学片上网络的激光调制方案

[复制链接]

1076

主题

1076

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11451
发表于 2024-9-18 08:00:00 | 显示全部楼层 |阅读模式
引言
$ y; s/ E# F6 u9 N随着硅晶体管缩放接近极限,研究人员正在探索新技术以继续提高处理器性能和效率。有前途的方向是使用片上光学网络(也称为光学片上网络或光学NoC)来替代传统的电气互连。与电气网络相比,光学NoC在带宽、延迟和功耗方面具有潜在优势。然而,有效管理光学NoC的功耗带来了新的挑战[1]。
2 k3 m/ h! d$ f  l0 J7 u5 S* Z; c! }
本文将探讨用于最小化光学NoC静态功耗的激光调制方案。我们将介绍基于网络活动动态调制激光功率的关键概念、架构和预测技术。
- _& v, _2 j9 @' M$ W+ h, ?: L* H: w6 `# O  [) h
5 C9 r4 F' h+ n& x' m! s; ]! x
背景; H7 K- S" g4 Q& Y. e
光学NoC使用光来传输芯片上组件之间的数据。基本构建模块包括:
1 |8 t- p6 A3 L
  • 激光器:光源,可以是片外或片上
  • 调制器:将电信号转换为光信号
  • 波导:在芯片上引导光
  • 光电探测器:将光信号转换回电信号* u" ~: Q% D5 S1 |. A8 K

    * a( a# n7 ]" f& m6 ^  V! H光传输本身非常高效,但产生光的激光器消耗大量功率。一个关键挑战是光子不能像电荷那样容易存储。这意味着激光器通常需要持续供电,即使不主动传输数据时也是如此。这种静态功耗可能占光学NoC总功耗的80-90%。
    . H7 z. m8 Y* }1 r& S: i
    % e* d' j6 k6 f- j( x" C为解决这个问题,研究人员开发了激光调制方案,旨在根据预测的网络活动动态调整激光功率。一般方法包括:
    5 x  E" s' Q/ r, t  f
  • 监控网络活动指标
  • 预测未来活动
  • 相应调整激光功率
  • 重新配置网络4 |0 }( b1 l( s9 A
    : s. v7 {$ D( O% _- L9 {2 `
    让我们看看为不同类型处理器提出的一些具体方案。
    - t6 T/ R* j- d' g- Q+ Y8 ~3 {& U( x) ]% c8 X
    多核CPU设计中的激光调制方案- @) B9 K7 k  Z) e
    Probe, T: P5 F1 T/ h5 J" h" @' I+ L
    最早提出的激光调制方案之一是Probe。使用64核架构,核心分组为4x4块。每个块都有专用的片外激光器,可以使用单写多读(SWMR)总线广播消息。
      E1 k* ~  ]. l8 }. T' n! }; i$ }, ^: ?$ K# v
    Probe根据链路利用率和缓冲区利用率指标预测未来活动。使用两种类型的预测器:
  • 用于低流量变化:过去和当前利用率的加权平均
  • 用于高变化:由利用率水平索引的模式历史表4 N$ ^/ U! w% I' w  ]6 d% r
    [/ol]% b4 z6 p( _2 V4 t8 E; }" `
    锦标赛预测器根据最近的准确性在两者之间选择。; q" [9 B" t  M

    : m6 o7 C% Z+ Y% R$ r* s3 d' EColdBus3 x' ^: I7 y' p/ v$ E# Q2 C
    ColdBus采用不同的方法,基于L1缓存未命中预测活动。关键洞察是在共享内存系统中,大部分网络流量来自L1未命中。
    * S' ~) q, F8 n/ H
    0 T+ [% i* G8 L) r( a2 ]  c使用类似于分支预测器的基于PC的预测器来识别可能导致未命中的指令。然后,一个时期预测器估计这些未命中何时发生。1 J# h3 P# Y" i* D' l* a  J. N2 ]! e# q) b

    : M/ u6 o& v7 x" ?7 I* m+ y  FColdBus还引入了一个"额外波导",为需要的站点提供应急功率。
    7 K* m; ?# q1 `9 w( e1 e( h2 I) i# Q' o" g8 I- o
    PShaRe) ]7 a; w1 X9 a4 ~
    PShaRe在之前工作的基础上有几个关键创新:
  • 一致性和非一致性流量的独立网络
  • 基于神经网络的非线性预测器
  • 站点之间的功率共享
  • 重用浪费的光功率进行热调谐: [/ a, j  P" |
    [/ol]
    , k3 i. X; V: \9 B% r: J图1显示了整体架构:; O0 N4 _# X0 Y/ G! }% N( e

    $ V' y3 k1 J  x' H! V

    nltekny5u1g64015584757.png

    nltekny5u1g64015584757.png
    * k8 p8 f( a( X. u8 r. Z' S
    图1:PShaRe架构,显示连接光学站点的功率和数据波导。
    ( e; T- v( E/ s6 X3 P: X" z& C' w1 e" P+ {) j  O
    神经网络预测器使用14个性能计数器输入,对每个站点在下一个时期的活动进行二元预测。8 j3 F7 q( p* {+ J  N& p" E
    : o6 d& S; W! R4 G$ g6 X
    BigBus& j8 {) T/ g+ f1 e6 \
    对于非常大的核心数(500+),需要像BigBus这样的设计。BigBus使用分层架构,将块簇组成更大的单元。4 B, s0 h+ e7 e3 n" N9 @/ T
    4 o0 T6 i+ p# a  c  d  x/ q( z
    图2说明了BigBus设计:
    ! {& P$ K- ]& Y8 b. i! `  L1 k7 x# G

    4dtw2bmj0vp64015584857.png

    4dtw2bmj0vp64015584857.png

    0 ~; K. k0 K1 U图2:BigBus架构,显示由蛇形光链路连接的核心和缓存库的分层组织。
    0 h. J! @8 o( R- {3 q+ n
    9 k5 G2 z5 {/ d2 a% P! S, @BigBus使用两阶段预测过程:
  • 每个站点根据等待时间和待处理事件决定是否增加/减少令牌
  • 激光控制器将当前预测与历史数据结合
    " c( V. ?1 U& L# x[/ol]
    0 V+ L) q$ B# B* _% y* n7 E2 W0 j这允许在当前条件的响应性和稳定性之间取得平衡。
    " V, f/ D& d$ c# g0 L7 G" ?0 r$ r# S( [7 E

    9 [! M5 B; E7 m8 r多插槽系统(MULTI-SOCKET SYSTEMS)中的激光调制方案# l. ^* c# h0 A' V$ Z+ ]  _  d
    对于像服务器这样的多芯片系统,像Nuplet这样的设计将光网络扩展到插槽之间。Nuplet同时使用片内和片间光网络。
    ' C+ g* C* O% J1 G
    6 y& j' E' A: R# S片间预测机制旨在确定要流通的仲裁令牌数量。它考虑:
  • 发送到片间光学站(ICOS)的消息
  • ICOS队列中的待处理事件9 `- E1 Y4 g9 Q) w# o+ r, P
    [/ol]
    ' g$ K( M3 X1 z/ |  f功率请求表(PRT)存储历史令牌计数。预测将PRT值与当前流量趋势和队列状态结合。3 o: i9 {: m. `0 \

    4 F& h+ a) l3 i, u0 MGPU设计中的激光调制方案
    5 P' ]' ~1 H( i' S6 y' y由于GPU侧重于内存带宽而非延迟,因此带来了独特的挑战。GPUOpt设计将光学NoC适配于GPU架构。+ ~% q/ n' h- x" T1 C$ K

    * a! Q7 i7 z2 _6 K. i" w图3显示了GPUOpt的整体架构:
    7 T8 A  G( y% r9 V5 x9 F0 M/ e
    8 m2 L) }9 [& B

    nhvur1armwm64015584957.png

    nhvur1armwm64015584957.png

    ) N. ~  ~- S7 w: ?图3:GPU光学NoC的架构,显示由光网络连接的SM和LLC集群。
    5 F4 m; q0 r0 ?: c- m4 e6 t0 n# Y' q: j# X- p
    GPUOpt对流式多处理器(SM)站点和最后级缓存(LLC)站点使用不同的预测机制:1 d; L* i1 ^$ t) i
    1. SM站点使用基于以下因素的受限预测器(Restr_Pred):/ S3 O2 E$ ?6 s' r3 D; r  }& U
  • 接收的消息
  • 发送的消息
  • 等待时间+ x+ {. @. x1 p' T6 K3 D
    1 ?3 f$ u- ?# S2 i3 [- }% T5 w
    2. LLC站点使用考虑以下因素的灵活预测器(Flex_Pred):
    $ ?: p- s( h$ y- ~* a
  • 接收的消息
  • 发送的消息
  • 待处理事件
    9 P1 ~  x  M) k( I$ y5 d2 P
    ; N/ B7 e' W* O
    激光控制器将这些预测结合起来,确定整体功率需求。
    6 e- N5 F" n8 Y8 @( C: I- ?4 r+ F, L  p& k
    2 s# z/ s: ?: T! w
    关键概念和趋势
    , l0 O+ V* M' g" e. A6 b虽然具体方案各不相同,但一些共同主题和最佳实践浮现出来:- ^7 ^- m+ g0 @% L; O

    0 L# n9 [, s# s  g1.将时间划分为固定时期进行预测和重新配置& l0 ?8 r7 T0 |% U+ v( w
    2. 使用多个输入指标:
    6 d* }+ W3 a2 M4 @- C+ V
  • 网络利用率
  • 缓冲区占用率
  • 缓存未命中率
  • 指令类型
  • 待处理事件) ~+ x$ c* q$ Y9 z4 _* [! v1 W8 F
    3. 将当前指标与历史数据结合( ]3 N+ E1 t% U2 d' K, n' `
    4. 使用非线性预测函数(如神经网络)捕捉复杂关系% W, |. _+ m/ `; X
    5. 对不同流量类型进行单独预测(如一致性与非一致性)
    - ^6 r' }% f) k9 N* k) p4 C" @  _6. 分层设计以实现可扩展性' P, X# |. k& H7 Z7 k+ ^2 C( c+ w
    7. 尽可能重用未使用的光功率5 \1 R% U0 M# o6 Z8 x. X# z
    8. 为特定架构经验性地调整预测参数
      [9 R9 s; l7 f$ Z: l/ g' h; X
    , o" o; [6 z! a& O: s# Z图4说明了有效激光调制可能带来的功率节省:
    % ~7 O4 b7 A9 {& |% g" m! f' {; D# b  T7 \( n7 ?& u

    lkotyjfobgw64015585058.png

    lkotyjfobgw64015585058.png
    8 x% r4 L/ n; G4 Y3 i
    图4:ideal、Probe和ColdBus方案在各种基准测试中的相对激光功耗。( Y7 ~/ S1 R$ T8 X$ t
    $ T) Z; q. v. w4 [% |

    " j; z1 C: m( ?未来方向/ T* V! f% L3 s8 i& ^, z, @
    随着光学NoC从研究转向实际实施,可以期待这些技术的进一步完善。方向包括:
    - d8 F- J: R: c: J7 o5 I0 J1 n2 o
  • 用于更准确预测的机器学习技术
  • 与应用层知识的集成
  • 在运行时调整参数的自适应方案
  • 考虑电气和光网络的整体优化
  • 针对新兴工作负载(如AI加速)的专门化  I* C) c/ V: c" H+ q

    ' B' x9 l  Q: q$ d& F; B* V

    0 r! i+ k3 R- n+ C结论5 {; T1 x  m' W& B
    有效的激光调制对实现光学片上网络的潜在优势非常重要。通过准确预测网络活动并相应调整激光功率,可以在保持性能的同时最小化静态功耗。随着处理器架构继续发展,激光调制方案需要适应新的设计约束和流量模式。该领域的持续研究有望为未来计算系统解锁新的能效水平。7 }! p: w  W# x4 d+ d9 v" I% x- G  j& u, U
    & l% O9 {. i2 |! S' f) W1 O8 M7 e6 q

    ' v0 \; g$ @8 i0 N( o* M( f参考文献
    & P% x- v! g$ J9 s3 P. h! C; K[1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.2 ]- C! A; q5 U& }4 Z1 \  M: x* H, m
    & {9 t5 x# g% G0 O
    - END -
      r! S7 @% @( v& L  Q( w9 |: ]* s; Y+ [+ w$ g. X
    软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
    0 z! w4 ^7 p/ }. o1 X$ u, n点击左下角"阅读原文"马上申请
    # t5 I6 {- b5 c8 z, S6 _5 K5 p) b5 m0 `& Z0 u
    欢迎转载" C* r0 d$ {! r
    6 d4 O% c1 |3 s8 d) l: h: H! `
    转载请注明出处,请勿修改内容和删除作者信息!
    1 O9 U8 H1 {+ c. Z
    & ^& ?+ D, w9 h& T: o. x! z) c' F/ X3 q  S4 c$ Y
    8 h) o+ Z2 u5 R4 H7 [7 U

    h15zec0g0gj64015585158.gif

    h15zec0g0gj64015585158.gif
    4 Z* m" F3 [% }  G: N7 P$ g" \& O6 R) N

    ' |! E6 B) ?. E关注我们6 T& W6 D9 @7 q
    " r; J9 z5 G" x2 ]# }
    + s7 \' j% f. ~# h- k: W

    o2gci22howu64015585258.png

    o2gci22howu64015585258.png
    7 Q! O( e' w4 a: Q

    1 t" j" D; X6 x$ H

    cxsfmyb44sa64015585358.png

    cxsfmyb44sa64015585358.png

    ' k) X. [$ p5 C+ {: b- ?4 @' f7 V0 o
    # t3 c3 W8 ?7 }& F3 U1 o) v

    uyczgfdbh4w64015585458.png

    uyczgfdbh4w64015585458.png
      \% y) g7 ^0 \& T& A" R3 z
                          # p2 g3 d3 g1 M$ d) H
    # j. V5 F* E$ ]) Y# H& `

    ) G" {, I+ \1 h0 I5 p' B+ l' W* E! ^# L4 @" V$ [6 |
    关于我们:9 d& }; ~$ u: O& m. y! l: ~5 G
    深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
    . \3 L. z. B) z& r
    9 c$ [7 c6 S- {4 \- e* Shttp://www.latitudeda.com/
    . v, M, E8 c2 F2 o: \4 I- ~(点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表