电子产业一站式赋能平台

PCB联盟网

搜索
查看: 38|回复: 0
收起左侧

AI/ML应用中的高能效可插拔光模块关键技术

[复制链接]

1121

主题

1121

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11997
发表于 昨天 08:03 | 显示全部楼层 |阅读模式
引言
5 s  o7 i) q6 M" x% M& G, Q1 l& d# C3 Q# h/ o) U0 {
AI和ML应用的指数级增长正在为数据中心基础设施带来巨大挑战,特别是在光互连和功耗方面。本文探讨了两项对AI/ML数据中心的可持续性和效率具有重要意义的技术:线性可插拔光模块(LPO)和浸没式冷却系统[1]。1 Z' M, d, ?& ?, m

zlltg0fcwrx64027730344.png

zlltg0fcwrx64027730344.png
' r& f$ C6 L* s- N4 v. M4 |0 M3 X
日益严峻的挑战:AI/ML基础设施的功耗和光纤需求
, O7 X/ o2 S2 y) _2 e+ N6 [: e& w7 J! |8 I# b
AI和ML工作负载的激增导致数据中心对高带宽连接的需求大幅增长。根据LightCounting的报告,专门用于AI集群的以太网光收发器销售额预计在2024年至2028年间将呈现显著增长,AI相关应用正在成为主导市场细分领域。
. X8 s( S  d- M* a3 \2 C2 U

gl55m2avog464027730444.png

gl55m2avog464027730444.png
) G- i. a& U5 O" s4 H% x
图1:以太网光收发器按应用分类的销售额,显示了2020年至2028年AI应用光收发器销售额的预期增长,展示了AI工作负载在推动光互连需求方面的主导作用。6 k: t5 v+ Q. t
# b! }5 d) M% h- z
光互连的增长与功耗增加直接相关。高盛研究预测,到2030年数据中心功耗需求将大幅增长,AI工作负载是主要驱动因素。研究表明,AI应用可能推动功耗需求增长160%,到本十年末将占美国总功耗的很大比例。8 K: X, M: y1 u- r" N

gj0lkciye5e64027730544.png

gj0lkciye5e64027730544.png
: d1 ~; z- `: d  j& H- _/ z' M3 |
图2:数据中心功耗需求,展示了2014年至2030年数据中心功耗的预期增长,显示了AI工作负载对总体功耗需求的重大影响。图表区分了美国AI功耗、美国非AI功耗以及全球其他地区AI与非AI功耗。1 t0 z& K$ S1 O' ?6 @* ]0 ]
0 U2 u; b1 d4 s% ^0 _9 p
这些预测凸显了需要更高能效的光学解决方案,以支持AI/ML应用的增长,同时保持环境可持续性和运营可行性。
5 H- ^2 Z1 j/ v+ o理解线性可插拔光模块技术
/ Y6 j' N" I. z' j% P( e; J# W/ T2 X2 k' c# z
线性可插拔光模块(LPO)代表了降低高速光收发器功耗的创新方法。LPO的根本创新在于从收发器架构中移除了高功耗的数字信号处理器(DSP)。
; ?: W0 K7 _- K: D7 Z1 @+ e+ j) y4 l( P7 b0 ^1 L& F
传统可插拔光模块采用DSP芯片为电信号和光信号执行完整的数字均衡。虽然这种方法确保了稳健的信号完整性,但代价是显著的功耗,DSP电路通常消耗模块总功耗的40%以上。  O" P4 M" v2 S1 u9 b% C

xbfaygsx1z164027730644.png

xbfaygsx1z164027730644.png

' }) k8 H5 `5 t. H  V图3:线性可插拔光模块,传统基于DSP的收发器、LPO模块和线性接收光模块(LRO)之间的架构差异。关键区别在于DSP组件的放置或移除。% G/ w' M, ^0 ?) P& Z
6 u4 a" _% V! ]
LPO技术完全移除了DSP,依靠现代交换机ASIC的先进信号处理能力。这种方法特别适合800G及更高速率应用,在这些应用中,主机交换机硅片已发展到可以处理复杂的信号调理任务。
# _% X( T6 n% g* ]$ W) Z8 S/ m& W& A
一种称为线性接收光模块(LRO)的混合方法仅在发射侧保留DSP功能,在完整DSP和完全LPO解决方案之间提供了折中方案。这种配置提供了LPO的部分功耗优势,同时保持了发射侧的信号调理能力。( r) u4 _1 H& H( U  `& k9 Y, k5 Y) C
LPO实施的优势
+ v& ~, {7 b( n: H9 I- B/ ~0 G1 Z7 u* e
采用LPO技术带来了多重优势,直接解决了AI/ML数据中心面临的挑战:
, b0 X2 p2 U1 ~' ]1 [

hy0shud5e2c64027730744.png

hy0shud5e2c64027730744.png
+ @2 B; s; ~& e: I- n1 O7 {
图4:为什么选择LPO?突出了LPO技术的四个主要优势:更低功耗、降低延迟、成本节省和提高可靠性。
; Q6 ^, ~& Q5 i' ]. Y" J% I. U: W; ^
功耗降低是最显著的优势。实际应用表明,在模块和系统层面都能实现大幅节能。800G DR8 LPO模块的性能测试显示平均功耗仅为7.2W,而传统基于DSP的模块为14.0W——降低了近50%。
5 n9 I) I! c" d

ie0mkayzpmq64027730845.png

ie0mkayzpmq64027730845.png
" N' g9 ]( \7 n3 Q+ @. [
图5:比较了不同800G模块类型(LPO、LRO和DSP)在DR8和2x FR4配置下的功耗和能效。1 W" {; i& W$ \

' i" x0 |- g# e' R( P6 d温度优势与功耗降低直接相关。LPO模块的运行温度比基于DSP的同类产品低约15°C,这转化为降低的冷却需求和进一步的系统级节能。9 W- v* e, R) ]/ i) c  X2 Q: B

blka2rurgxz64027730945.png

blka2rurgxz64027730945.png

1 O  n/ ^2 x, C' x0 l' n2 Z% I  I图6:功耗和温度(基于800G DR8),展示了DSP与LPO模块的交换机温度和功耗之间的关系,显示了LPO优越的热性能。. [9 X6 D. K4 i6 n4 Q4 `
* z' {8 i- ~+ W+ w; L, Y
由于降低冷却需求的复合效应,系统级节能超过了模块级收益。Arista Networks报告,与当前800G DSP光模块相比,51.2T LPO交换机测得的节能为700W(40%),预计102.4T LPO交换机的节能为1000W。
. j' {7 z1 s0 {0 b. d) c6 P0 t

ui4amep0iqg64027731045.png

ui4amep0iqg64027731045.png

- r; Y; |  U  z1 R1 X& h( z图7:系统级节能,来自Arista Networks的幻灯片说明了LPO技术实现的显著系统级节能,强调由于风扇功耗降低,系统节能超过了单独光模块的收益。; T0 P2 Y. V( a9 l, K
信号完整性和性能验证
5 Q9 \/ L7 \& A
, W% n5 K! c* c尽管移除了DSP,LPO模块在各种链路配置中仍展现出优异的信号完整性。在64端口交换机上的广泛测试显示,误码率(BER)始终远低于可接受阈值。* \" [; B: z) z- a2 Y7 `

0pbhhcdwjgf64027731145.png

0pbhhcdwjgf64027731145.png

+ D7 c: f0 X1 M( x& ]图8:64端口交换机上的800G DR8 LPO性能,显示了使用800G DR8 LPO模块的交换机所有64个端口的BER性能,展示了一致且可靠的性能。$ m& K' T1 Q4 x& k6 N, j/ f

" F3 _. u+ c8 z7 R0 V3 I性能在不同信道长度和损耗条件下保持稳定。800G 2xFR4 LPO模块的测试显示,在短、中、长信道配置之间BER性能变化很小。8 }+ {' W. S  T3 N* ~

h34z2n0s2vl64027731245.png

h34z2n0s2vl64027731245.png
5 @9 h; R" M3 U
图9:低/中/高损耗交换机信道下的800G 2xFR4 LPO BER,显示了不同信道损耗条件下的BER性能,确认了LPO在各种链路场景中保持信号完整性的能力。
: |  B! W% ~1 z" l% K浸没式冷却:数据中心效率的新前沿
. m2 b  g" o: A8 Q# B7 K! G( D
浸没式冷却技术代表了数据中心热管理的范式转变,在电源使用效率(PUE)方面提供了显著改进。传统风冷系统通常实现约2.0的PUE值,而两相浸没式冷却可将其降低到约1.1。
# e8 z6 Y2 Y2 V" I4 C5 Q

qsznrtyc4b564027731345.png

qsznrtyc4b564027731345.png
, l* ^! X1 W/ J& B. i
图10:浸没式冷却和能源效率,比较了风冷和两相浸没式冷却系统之间的PUE值,展示了浸没式冷却的优越效率。$ H% `' R' s# s

4 z% N- x% ^3 u( iLPO技术与浸没式冷却的结合为AI/ML数据中心创造了协同效益。LPO模块降低的发热量补充了浸没式冷却系统卓越的散热能力。: B4 o6 ^6 W% Y% ?
实际实施和演示  E6 m( d& n# ~( Y
: B3 g2 d7 U* |' q' N, G' z
在OFC 2025上的最新演示展示了浸没式冷却环境中LPO模块的实际应用。测试设置包括在浸没槽中运行的Celestica DS5000交换机和各种800G模块。
9 e* H6 X! l+ e: L

qwm3os4tzos64027731445.png

qwm3os4tzos64027731445.png
8 p0 U: X8 [, l5 V2 e
图11:OFC 2025演示设置,显示了包括在浸没式冷却环境中连接到流量生成器的多个LPO、LRO和DSP模块的综合测试配置。3 m6 D; J4 t3 R, L

' v' G+ o  Z8 j" _) B' N. Y+ A) f8 l

a3l0aocfxfj64027731545.png

a3l0aocfxfj64027731545.png
* Q( |! K0 g8 W2 K6 M3 y

ta3yvtpc14w64027731645.png

ta3yvtpc14w64027731645.png

3 D8 [% A6 p/ e8 q  R图12:OFC 2025演示设置,显示了OFC 2025上浸没式冷却演示系统的实际实施。
0 l8 a$ \5 \* x& ]* v5 R; D0 _! Z8 j. t; H+ k
通过FEC尾部分析进行的性能监控确认,即使在浸没式冷却环境中,LPO模块也保持了优异的信号完整性,温度读数显示与风冷系统相比,在降低的温度下稳定运行。
& h! f& V8 I5 ^, u# Q3 l1 S

aflnx0hd4i064027731745.png

aflnx0hd4i064027731745.png

& g' V% y' v6 m4 Y; C: k1 Q2 g3 o图13:浸没式冷却模块的FEC尾部结果,展示了在浸没式冷却环境中运行的LPO、LRO和DSP模块的性能。
& h8 X/ T7 N; n* D- t未来展望与行业合作; B4 r! H& s* {, Q) ?
- \3 t. j/ [9 ?* I, _/ x: v
LPO技术和浸没式冷却的融合为AI/ML数据中心日益增长的能源挑战提供了引人注目的解决方案。然而,广泛采用需要持续的行业合作和标准化努力。6 L1 Z8 p! w! ]- A% W

7 G7 p) i0 K0 `9 m0 P5 R- t2 ?3 |- M% X未来发展的关键领域包括:
0 d$ J3 x8 x7 A% t) k$ P  \跨供应商和平台的扩展系统级互操作性测试# H% U) V* w! X3 ~- F2 b
开发浸没式冷却光模块的标准化测试方法$ ]1 p8 W# Y- H0 n8 U+ e
创建LPO实施的全行业规范& S& y" |& D; R$ P

" v8 N( ?5 v$ T  ~7 h

fwl3yiyvfz264027731846.png

fwl3yiyvfz264027731846.png
' C" e8 N) d( X, b2 T8 w) P
图14:浸没式冷却和光模块,强调了在推进浸没式冷却和光电子技术方面需要全行业合作。& t! L, y! C' P* K& H
结语# k) T# U2 q$ t/ C

! s7 a! w" d5 u$ X; d4 fAI/ML应用的指数级增长要求数据中心设计和运营采用创新方法。线性可插拔光模块技术与浸没式冷却系统的结合,为AI基础设施的可持续扩展提供了途径。通过在模块和系统层面降低功耗,同时保持性能和可靠性,这些技术使数据中心能够满足AI工作负载日益增长的需求,而不会牺牲环境可持续性或运营效率。. G6 G; D2 Z; q" q( b2 {

8 d# U/ a8 U. N. E! Q随着行业持续发展,在AI驱动的数据中心未来中,采用这些高能效技术对于保持竞争优势和实现可持续发展目标将变得越来越重要。" ^. Z8 I3 j; \9 g
参考文献
  a% ^; X# V' |1 d9 a
3 B" z7 r% G! y' B/ K[1] T. Ninomiya, "Key Technologies for Energy-Efficient Pluggable Optics in AI/ML Applications," presented at the OCP EMEA Summit, Dublin, Ireland, Apr. 29-30, 2025.  h5 T) z, S1 C8 [
END* ]5 ]1 S  c4 [8 Z( k  A' M
软件试用申请欢迎光电子芯片研发人员申请试用PIC Studio,其中包含:代码绘版软件PhotoCAD,DRC软件pVerify,片上链路仿真软件pSim,光纤系统仿真软件pSim+等。更多新功能和新软件将于近期发布,敬请期待!( P3 Q' Z! Y/ K' n% ?: t" b0 n7 Z
点击左下角"阅读原文"马上申请
. {; |% H$ L" f& o
' ~* u6 i9 F) G2 C8 p; l欢迎转载
! P9 t/ u& h- U8 u" b, y2 O* m% P; j# c( P2 X
转载请注明出处,请勿修改内容和删除作者信息!
# H: Y$ i! a3 ~8 W
, ]8 @/ V' d  {; w. {0 m5 U$ }
: y0 f) H" g. i4 L# g
8 @! q6 r5 J' f  a

2e3xwecrmgm64027731946.gif

2e3xwecrmgm64027731946.gif

! a- B. x$ g9 T; Z- b, N4 c9 s# a$ |( K8 E3 |
关注我们
; A) d6 C$ f9 o# V. T8 ?$ d1 Q
) A! q4 n6 }* c6 b! ?

2 d* Y2 H7 z3 |4 k( e/ _6 ?

lcsqs0l4zgb64027732046.png

lcsqs0l4zgb64027732046.png
$ u5 J, }6 T7 A: N+ w+ }

! a9 d  u+ k; w8 g$ F

xvkyo1mobpy64027732146.png

xvkyo1mobpy64027732146.png
4 |0 v; c* U' l- r2 g0 m, u
+ ~, E7 n) Z3 Y- A

bi0seyeayms64027732246.png

bi0seyeayms64027732246.png

: Y! v5 k0 P2 r( P$ P0 q; Z
                      2 d9 |5 ^5 K4 B) h/ D  d- T4 n

+ y# p3 |( f' X
% F' V; _/ N& X( j
/ r0 n( @) x* V  j- a& i+ I) n& w, p2 F
关于我们:- u% Z9 i; e5 I- A; H! j4 l, {* W
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
3 S; _" ^8 M/ F8 S  O3 {9 y' m  ~6 z4 o: D, L( s8 |5 a1 K8 [/ T1 O1 Y
http://www.latitudeda.com/
  M+ O6 J0 s: d; d- U(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

关闭

站长推荐上一条 /1 下一条


联系客服 关注微信 下载APP 返回顶部 返回列表