电子产业一站式赋能平台

PCB联盟网

搜索
查看: 216|回复: 0
收起左侧

光学片上网络的激光调制方案

[复制链接]

1076

主题

1076

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11451
发表于 2024-9-18 08:00:00 | 显示全部楼层 |阅读模式
引言
7 N2 M( }& O$ Q随着硅晶体管缩放接近极限,研究人员正在探索新技术以继续提高处理器性能和效率。有前途的方向是使用片上光学网络(也称为光学片上网络或光学NoC)来替代传统的电气互连。与电气网络相比,光学NoC在带宽、延迟和功耗方面具有潜在优势。然而,有效管理光学NoC的功耗带来了新的挑战[1]。; \0 `; F3 l" \& L! y- O
. ?" W! g  x% W5 y/ c
本文将探讨用于最小化光学NoC静态功耗的激光调制方案。我们将介绍基于网络活动动态调制激光功率的关键概念、架构和预测技术。- D" j# z. c8 y, R. u* @+ d  W
# x% q  d; M# d4 z- l4 Z( \, _
+ E3 z) p+ J9 T
背景1 N4 H! |. D$ Y4 D% c2 ~
光学NoC使用光来传输芯片上组件之间的数据。基本构建模块包括:
; ^- G& r5 U. x# U
  • 激光器:光源,可以是片外或片上
  • 调制器:将电信号转换为光信号
  • 波导:在芯片上引导光
  • 光电探测器:将光信号转换回电信号
      U( K1 F/ F+ A* @  |! Q, O- U
    ! W# \5 L8 b9 T7 g  _# A# g  u
    光传输本身非常高效,但产生光的激光器消耗大量功率。一个关键挑战是光子不能像电荷那样容易存储。这意味着激光器通常需要持续供电,即使不主动传输数据时也是如此。这种静态功耗可能占光学NoC总功耗的80-90%。8 ]; _9 P2 |* t. v6 ]7 ?" G

    " n1 D* P1 l( O! Z为解决这个问题,研究人员开发了激光调制方案,旨在根据预测的网络活动动态调整激光功率。一般方法包括:" o& R9 J1 ~; N- I
  • 监控网络活动指标
  • 预测未来活动
  • 相应调整激光功率
  • 重新配置网络
    - ~+ W( U: @  d0 K4 p2 ~
    3 w6 F) P7 I! z! i; p0 _( K# N9 p$ d
    让我们看看为不同类型处理器提出的一些具体方案。5 Q: Z* B- S, i. |/ [2 t
    % u, B9 y/ B+ q
    多核CPU设计中的激光调制方案
    . q; q1 ?, v% y: X  {/ CProbe* H8 h7 C. R- E2 s. c
    最早提出的激光调制方案之一是Probe。使用64核架构,核心分组为4x4块。每个块都有专用的片外激光器,可以使用单写多读(SWMR)总线广播消息。
    3 C' x: R2 P2 v) x
    + t. Z' t/ o$ ^1 M' |  W6 MProbe根据链路利用率和缓冲区利用率指标预测未来活动。使用两种类型的预测器:
  • 用于低流量变化:过去和当前利用率的加权平均
  • 用于高变化:由利用率水平索引的模式历史表. x( o, @' T( E( ]  h2 p
    [/ol]
    ( ~5 d# y. B% \2 T4 {1 U1 r& T" y锦标赛预测器根据最近的准确性在两者之间选择。( B5 K6 ^3 U2 q* ~8 G

    : j. S2 Y+ ?/ ^ColdBus$ @4 }9 k5 [# m0 s& \2 q5 X) [/ T
    ColdBus采用不同的方法,基于L1缓存未命中预测活动。关键洞察是在共享内存系统中,大部分网络流量来自L1未命中。2 W0 Y" q% o" g9 i$ F6 `" \
    8 x6 b7 R6 n5 \" x4 D# H
    使用类似于分支预测器的基于PC的预测器来识别可能导致未命中的指令。然后,一个时期预测器估计这些未命中何时发生。
    9 w; \) H0 p' I: _4 i. Z; T# v' m8 u
    1 c& X, S* r' ~- \( G/ Q! _* @ColdBus还引入了一个"额外波导",为需要的站点提供应急功率。
    ; G/ |; |* X2 C5 }" Q) M7 z
    # N$ ?. P+ R0 `* L( G6 ePShaRe
    $ v  ~7 g6 q/ x9 ~% [* ^PShaRe在之前工作的基础上有几个关键创新:
  • 一致性和非一致性流量的独立网络
  • 基于神经网络的非线性预测器
  • 站点之间的功率共享
  • 重用浪费的光功率进行热调谐8 d6 \5 S6 t" L
    [/ol]
    8 b0 u" w/ x- v图1显示了整体架构:/ F! r" U: @3 V' d5 `
    ' v2 I1 N/ ?- }( K/ D+ y: B

    v0i132opydn64034878813.png

    v0i132opydn64034878813.png
    % z+ S6 q  f/ a  ?1 y7 d2 z$ X3 f
    图1:PShaRe架构,显示连接光学站点的功率和数据波导。
    0 p4 ?% |1 I% _, Y) k: _! P* I
    5 }' C6 K- R9 N- Y  O神经网络预测器使用14个性能计数器输入,对每个站点在下一个时期的活动进行二元预测。! w# F; W! T( R8 u3 o5 C

    , z0 @5 h- C1 E0 c: u: sBigBus! m& j; A* R$ Y  I: t; ~$ S6 ~* |& r
    对于非常大的核心数(500+),需要像BigBus这样的设计。BigBus使用分层架构,将块簇组成更大的单元。
    7 Z0 e9 Q- D: Z7 x- _+ O& k. a  F9 u/ c  _' ^' _
    图2说明了BigBus设计:
    3 S, f4 P6 k0 `7 U1 Q* i' o' R1 y/ m! B1 Z3 G$ o

    2lsssyofp4g64034878913.png

    2lsssyofp4g64034878913.png

      i* E" t/ |% q, C图2:BigBus架构,显示由蛇形光链路连接的核心和缓存库的分层组织。! }5 x) o' |3 u  f6 S9 \* l
    ; K* C  S& w% T- \: E# N
    BigBus使用两阶段预测过程:
  • 每个站点根据等待时间和待处理事件决定是否增加/减少令牌
  • 激光控制器将当前预测与历史数据结合
    % ?' I* D3 y3 @' @1 g# I4 t[/ol]
    # T' X9 m1 a7 I' c( O$ _这允许在当前条件的响应性和稳定性之间取得平衡。
    ) q/ {! |( ]9 z  ]6 v, |% `5 ]% F. b; I7 m
    . i8 \  q  P4 x6 P" g2 e3 Z
    多插槽系统(MULTI-SOCKET SYSTEMS)中的激光调制方案
    ' c* w% Z4 c  S' u+ V( r9 z  Y对于像服务器这样的多芯片系统,像Nuplet这样的设计将光网络扩展到插槽之间。Nuplet同时使用片内和片间光网络。
    : Z2 Z/ {2 w8 m) _4 W3 _0 L8 F! A4 ^7 n( B3 N
    片间预测机制旨在确定要流通的仲裁令牌数量。它考虑:
  • 发送到片间光学站(ICOS)的消息
  • ICOS队列中的待处理事件
    $ T% _: t; }: p[/ol]# T9 c5 D) @9 F9 ^0 ], \
    功率请求表(PRT)存储历史令牌计数。预测将PRT值与当前流量趋势和队列状态结合。
    ; y$ W7 t+ l' [. }/ L1 b
    , Q% X  K3 [5 [" CGPU设计中的激光调制方案
    . C$ z+ y& ?( q4 t5 A由于GPU侧重于内存带宽而非延迟,因此带来了独特的挑战。GPUOpt设计将光学NoC适配于GPU架构。
      j) U: \' k/ D8 @- s( k  O8 `0 E3 F% L2 n: |
    图3显示了GPUOpt的整体架构:
    3 l3 ?; e6 b- L: B% b! e: p
    ( q' p2 _1 x( C

    m5tbfrm3byw64034879013.png

    m5tbfrm3byw64034879013.png
    . u$ q9 p# z; y7 E
    图3:GPU光学NoC的架构,显示由光网络连接的SM和LLC集群。
    # Q9 O  k& h/ i6 e/ g5 z) L. G+ @' N/ ~& ?" n3 j  C
    GPUOpt对流式多处理器(SM)站点和最后级缓存(LLC)站点使用不同的预测机制:
    & w/ z. Q' Z3 T/ Z. T* @$ @) Y1. SM站点使用基于以下因素的受限预测器(Restr_Pred):# @% M0 r* d: g! I& L
  • 接收的消息
  • 发送的消息
  • 等待时间
    % t+ t! Z, T7 d7 D2 n

    4 J' W+ ?8 A0 P* ~6 B2. LLC站点使用考虑以下因素的灵活预测器(Flex_Pred):
    $ i0 _- j. ~! N& J5 w/ T/ }* }
  • 接收的消息
  • 发送的消息
  • 待处理事件
    9 C/ m, I. H/ n, Z3 b) P- r
      g6 [0 O9 Z5 z' I: r; u
    激光控制器将这些预测结合起来,确定整体功率需求。
    8 m! Z! C" I4 q8 \8 l+ |: h
    , J0 x2 H. f1 Q
    ) L: q) \, }- Q1 Q. ]
    关键概念和趋势8 L9 F$ c9 W5 e( J
    虽然具体方案各不相同,但一些共同主题和最佳实践浮现出来:% j6 ?7 d' @8 X* y; B0 {+ r
    . S, x5 D* m* B/ |
    1.将时间划分为固定时期进行预测和重新配置  i& b4 Q( ]5 R/ }8 S
    2. 使用多个输入指标:
    0 g' u4 v3 j  i4 Z! I! A0 d" A8 y
  • 网络利用率
  • 缓冲区占用率
  • 缓存未命中率
  • 指令类型
  • 待处理事件2 n, {2 m# V( H! a% X* x
    3. 将当前指标与历史数据结合  H+ ^& v! m8 R0 F
    4. 使用非线性预测函数(如神经网络)捕捉复杂关系0 Q. }1 M8 Z7 T) y# q! X
    5. 对不同流量类型进行单独预测(如一致性与非一致性)! k1 a% S& t# q3 P* S9 C6 Q0 A5 s
    6. 分层设计以实现可扩展性
    8 E6 X8 j1 G2 x0 Q: U7. 尽可能重用未使用的光功率
    5 p2 Q$ N1 v' |9 w  U/ X( O8. 为特定架构经验性地调整预测参数6 W3 Z0 u- S7 ~- C) p9 z/ w

    # L) \* N) M* e7 |+ O# R5 E图4说明了有效激光调制可能带来的功率节省:7 Z( N% y$ q8 i% P# S/ P/ o& ^) X

    1 M2 L5 Y5 P0 z/ b

    om02xkr3dhc64034879113.png

    om02xkr3dhc64034879113.png

    ; F  k8 @6 Z- t图4:ideal、Probe和ColdBus方案在各种基准测试中的相对激光功耗。
    # z8 t8 ^$ _  K7 n2 G6 M) f
    6 x# S7 H0 i* ^1 T/ }
    ' I! `' C  G+ X, L' [2 U0 {
    未来方向; Z1 r4 ^6 x3 j0 O6 w
    随着光学NoC从研究转向实际实施,可以期待这些技术的进一步完善。方向包括:, q/ F' S% S; O4 G( `; \+ U; U* B% q
  • 用于更准确预测的机器学习技术
  • 与应用层知识的集成
  • 在运行时调整参数的自适应方案
  • 考虑电气和光网络的整体优化
  • 针对新兴工作负载(如AI加速)的专门化  {# w0 l! s3 _
    2 g. h  `1 s. {6 _( X' j( F

    6 Y. B0 v) a, ~' n0 {结论& R: U8 r3 k, K# V, C. p
    有效的激光调制对实现光学片上网络的潜在优势非常重要。通过准确预测网络活动并相应调整激光功率,可以在保持性能的同时最小化静态功耗。随着处理器架构继续发展,激光调制方案需要适应新的设计约束和流量模式。该领域的持续研究有望为未来计算系统解锁新的能效水平。
    # [6 ^: @, e5 p3 D
    0 ]6 R" \9 m7 l1 A9 ^/ o% u- V

    ) b# U. V- b$ V  n7 V+ Z; Z参考文献" t( q( q1 v5 Y' N; h) l/ ?
    [1] M. Nikdast, S. Pasricha, G. Nicolescu, and A. Seyedi, Eds., Silicon Photonics for High-Performance Computing and Beyond, 1st ed. Boca Raton, FL, USA: CRC Press, 2021.6 R0 d# ~1 [6 W$ K$ e

    ) \2 J( A' F, v& q6 n8 K- END -
    7 K+ T* u4 W: k
    & K: s& T/ E0 i/ ]- [# k软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。  K5 \1 v) `5 H
    点击左下角"阅读原文"马上申请
    / B  e5 [7 h& [5 Q+ g9 d4 z6 Z# K1 W( x% \1 x2 Z
    欢迎转载
    5 E' Q2 G; y; Y- V3 U3 @
      \6 |/ O0 N7 Y( x2 Q) D转载请注明出处,请勿修改内容和删除作者信息!
    9 l- d7 {8 }) f) j
    + V; D' C8 m# a/ l9 N8 o. d4 y) q2 S( z  t+ \" P. Z7 G1 k: g, C* M% ]

    0 Q$ u3 M$ y5 Q% T& |

    tlesfwadvw464034879213.gif

    tlesfwadvw464034879213.gif
    8 m  p& ?6 ?0 t$ E3 X
    9 A( @4 q8 P) W1 [( o
    关注我们
    5 L" _! l) v: ~# A
    9 N3 ~: P+ c  Q- h  Z- y
    2 p: F& t9 ~& J! S' p- n+ E

    0rzxntnecf364034879313.png

    0rzxntnecf364034879313.png
    9 z* v- `; b; E+ e( a  \
    6 d  m$ ~) O+ G$ v% ?8 x) O

    wklhaednp3g64034879413.png

    wklhaednp3g64034879413.png
    1 E$ Y/ d( \6 M7 S$ F1 f

    + |9 ~6 l- Z! W3 D4 R- p! o; W

    v05awecejyj64034879513.png

    v05awecejyj64034879513.png

    ( y7 G8 M+ L1 i
                          ( \2 c  u1 j0 J1 R8 t( p3 }
    3 v* @6 U' ~) y9 e; t3 P$ ~
    ; N3 w; d( E3 h& K# Y. ^, E5 V

    # c5 Z* I7 _; t) ]关于我们:! [- @3 Z' Y  j3 o
    深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。, M$ U4 f( V6 x% P4 t
    + y+ z# T$ \( g; H+ S- }1 M
    http://www.latitudeda.com/7 K) z& F0 u' ]$ [
    (点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表