电子产业一站式赋能平台

PCB联盟网

搜索
查看: 34|回复: 0
收起左侧

ISSCC2025 | 高级PAM-4收发器设计用于200G/lane连接

[复制链接]

1073

主题

1073

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11353
发表于 2025-3-31 08:00:00 | 显示全部楼层 |阅读模式
引言- G3 a0 F  f9 ]7 Y
随着AI应用对带宽需求的增加,网络连接正从100G/lane向200G/lane演进,以实现1.6Tb/s以太网。这一转变带来了许多与组件带宽和信号完整性相关的挑战,涉及电缆、连接器和封装。本文探讨了一种采用5nm FinFET技术实现的先进224Gb/s PAM-4 SerDes收发器,该收发器在解决这些挑战的同时,实现了令人印象深刻的功耗效率和损耗补偿能力。
; c0 d5 A& W2 z7 p; S0 R4 Y8 J5 X6 H
本文所述收发器在高速连接领域代表了重大进步,能够在212.5Gb/s速率下补偿超过46dB的损耗,同时优化模拟功耗仅为2.2pJ/b。这一性能对于满足支持AI工作负载的下一代数据中心互连和高性能计算系统的严格要求至为重要。; Y1 E7 z4 t4 p# i! s* C

nzsdzbgqicn6406103611.png

nzsdzbgqicn6406103611.png
$ v4 H* ]. @, [. T6 {0 F+ U0 `
+ Y$ {& W4 B/ r+ f3 b" I; r) Y
1
+ r1 S( Q/ Z6 W9 f  w; Z收发器架构
9 o3 ]) B. Q3 N9 U0 c4 p' K) [2 ?SerDes收发器配置为4通道模块,每个通道能够独立运行,或者在通道之间与不同的接收器(RX)和发射器(TX)配对。这种灵活性改善了封装的分路和在高密度应用中与PCB路由的对齐。9 W. k, D+ H' c7 `* u8 e1 z' m
) T& C3 m- e$ C* b! v! A
该架构采用自适应、可重构设计,实现数据速率灵活性和节能模式。每个发射器包含一个相邻的PLL,可选择在两个通道之间共享一个PLL。接收器通过通道专用的多模式数字控制振荡器(DCO)独立运行时钟生成。
; \" C( ^, f" B3 G; b( Y" j8 P. @: n* |: j. G
一个公共模块在通道间分配电压和电流参考,还包含一个温度感应模块,支持温度跟踪,减少宽温度范围内的性能变化。; E3 y2 ~+ F$ l5 i( ^/ V- [( N5 r$ E3 g
: ?* }; l% Y" c6 Y1 b& a! \
RX模拟前端(AFE)具有高度可配置的宽带CTLE(连续时间线性均衡器),可均衡各种数据速率下的广泛损耗。CTLE输出通过时间交错ADC(TI-ADC)量化,启用数字信号处理进行均衡和性能监控。
4 n/ a+ y- {- b0 ?- L/ A' v# `, u  K9 H& Y( a. m3 P+ ~
发射器数据路径由FIR(有限冲击响应)滤波器、数据序列化和高速多路复用阶段组成。8位DAC将数据转换为模拟域,最后由高带宽电流模式驱动器缓冲。1 ~+ J* z# v2 [7 j- v' M9 I

34ztlxnrctr6406103711.png

34ztlxnrctr6406103711.png
9 ~4 H& U7 s, {% r; Y( }8 c
图1:224Gb/s PAM-4 SerDes收发器4通道模块的整体架构,显示了具有前馈均衡器、浮动滤波器和最大似然序列检测器的RX DSP架构。
/ J7 O2 {  k4 j8 F5 J) x3 @4 k+ {3 p! ^/ s; ^& ^* ]2 @
2/ o& H7 j, L4 k/ w& A
接收器设计
% p( U/ b# S# A. cRX模拟子系统设计注重功率和噪声高效的前端均衡以及低孔径抖动时钟。AFE包含带T线圈的输入网络和单独的终端路径,分散寄生效应并提供宽带良好终端响应。
7 P8 h# t6 t2 ?
( h- l# j5 }. J4 D% h( u3 iCTLE增益级采用谐振增益提升的GM均衡级。第一级使用带T线圈负载的RC退化,而第二级采用带TIA驱动器的非对称推挽GM,具有感应电阻反馈。这种优化的谐振峰值和宽带增益控制网络提供广泛的均衡能力,并优化ADC动态范围利用。% G$ Q7 h) ~& O* @
6 \  L1 E8 {4 e6 I
TIA驱动器级连接到16路级别1采样网络,针对60GHz以上的跟踪带宽进行优化。第二级采样由超级跟随器缓冲器组成,每个驱动7个ADC切片。交错ADC切片的偏移和增益误差在数字域进行背景校正。
& |8 E# s, j! }! q
. \, @+ A, P4 W8 FTI-ADC架构采用112个ADC切片,可适应和扩展,在不同工艺角、数据速率和通道损耗间实现功率效率。ADC分辨率、并行度、供电和信号范围提供可编程性,最小化模拟成本。; ?7 q& K, N/ j3 V

% J# Q/ W. B: [0 y3 x5 z# B时钟恢复围绕数字控制振荡器(DCO)实现,执行频率合成和宽带CDR(时钟和数据恢复)功能。恢复的时钟通过谐振分布网络路由到多相生成器。多相生成器结合2-16相位生成、时钟整形和定时偏差校正等功能。2 u7 G2 C! s' l# k; k; t9 Z3 O8 ^
RX AFE(包括DCO)在配置为212.5Gb/s运行时,实现1.1pJ/b的功率效率。; j- I7 ^6 w3 C6 L# f

jjizmhw2owa6406103811.png

jjizmhw2owa6406103811.png

# a# p' Y8 B! T6 Q& I图2:详细的接收器架构,显示了2级CTLE、级别1和级别2采样网络,设计用于高带宽信号处理。
# @2 m: Y! m; V% p0 [
+ E' u; X- n3 V' q& I1 j3. y; ?; g& x: b$ U
数字信号处理
# ]) I6 Y  I5 U/ D. L2 L$ D3 K6 P接收器的DSP引擎显著增强了系统从严重退化信号中恢复数据的能力。ADC采样后,信号通过29抽头前馈均衡器(FFE)和1抽头推测性判决反馈均衡器(DFE)进行均衡。DFE生成CDR模块使用的恢复符号,还用于三组4抽头浮动滤波器,覆盖高达100UI(单位间隔)的反射。; I. g9 Z$ s& h) l. `6 n2 g
$ }$ M8 j7 K5 l! h0 A; z/ s' B
最终均衡信号可选择性地由最大似然序列检测器(MLSD)处理,用于部分响应的符号检测,专门改善长距离通道的RX性能余量。可编程适应逻辑在初始训练后持续调整FFE、DFE和浮动组系数,维持最佳性能。+ M* O1 s$ O$ Z& B

' n$ W& c( Z/ n  n& m2 o* O2 s在发射器端,数字均衡由10抽头FIR滤波器提供。包括主抽头周围的6个抽头和两个2抽头组,可覆盖高达30UI的范围,实现精确控制信号预加重,补偿通道特性。
( L3 ?* u% E# X8 c( a4 {5 S; h" w  u9 F- ~& c# ?
4
! l0 l3 ^0 l" ], B0 y发射器设计
5 u8 `5 e+ a) \9 `' g, q! i发射器采用8位DAC,具有6位二进制和2位热码位,使用来自LC PLL的高达28GHz的差分输入时钟。谐振CML(电流模式逻辑)级将时钟分配给TX,提供宽带噪声滤波,改善时钟抖动。9 m, u$ i& M: G) U' ?2 r
/ m2 h) z. ?+ O& T: R% d" m% _
IQ生成电路将输入时钟转换为正交相位,辅以相位检测和控制环路进行校准和跟踪。正交时钟驱动最终的4对1多路复用器和64对4序列化器的时钟生成电路。
& d! J0 t: {3 _0 ]* k; d. g$ X- s
% B$ @- G& K" r$ S% ]1 l2 n序列化器由4对1移位寄存器和两级2对1多路复用器组成。定时检测电路最大化序列化器最后2对1多路复用器接口的接口定时。
& Q& D4 r8 z  j8 I1 _* o2 t) C9 V7 u: c- v1 o$ E
2级电流模式驱动器包括将4相交错DAC电流转换为电压的前驱动器,以及将电流镜像到输出的推挽缓冲级。优化的T线圈和感应网络,以及调谐的电阻终端,通过将驱动器与ESD和凸点负载隔离,提供阻抗匹配和带宽提升。- _; I4 ]. O$ x( j6 S
9 X3 A* W* z- {8 Z
这种高性能、高功效的电流模式驱动器发射器在212.5Gb/s下实现0.86pJ/b的功率效率。
" V1 R0 @7 ~4 {3 B& P$ S8 x. W# ?

x5e1jsmqeov6406103911.png

x5e1jsmqeov6406103911.png
9 _  D2 @6 h- W+ ~. [( r
图3:TX架构和TX驱动器电路,显示了8位DAC、序列化器和带优化T线圈网络的2级电流模式驱动器。, u* g1 E* X. ~% e- ^: y6 p5 n

# b9 R% u: M% r4 ~1 Q5
; @. H6 i0 }4 p% n$ X时钟生成和抖动性能
8 a: H9 }& _) z4 n0 U2 g随着数据速率从100Gb/s翻倍到200Gb/s,改进的时钟抖动性能对于维持相对于数据眼图余量的采样误差很重要。收发器采用超低抖动时钟PLL设计,满足这一要求。, r4 A# L% W( X7 p8 G

( ^5 y/ G+ [! X4 x6 h: D; B  IPLL使用双电感和双尾2次谐波谐振LCVCO。VCO谐振箱与采用谐振时钟的CMOS和CML缓冲器耦合,实现宽带滤波和抖动减少。此外,窄带抖动衰减器缓冲器最小化抖动放大。
% f$ F: B* D. p! L: Y
% U  g) c; K$ I: M6 _* H基于模拟的PLL具有8位相位旋转器,支持分数N和扩频时钟(SSC)功能。双电感LCVCO跨越24.2GHz到33GHz的宽频率范围,使用闪烁噪声上转换抑制技术优化低噪声。$ T2 I& v& p' a
7 {, @9 u, C$ H  Q/ V$ i/ T" A2 O
测量结果显示出色的抖动性能,在212.5Gb/s下,假设理想CDR滤波器,从3MHz到奈奎斯特频率积分仅有48fs RMS抖动。2T时钟图案测得的随机抖动(Rj)、确定性抖动(Dj)和总抖动(Tj)分别报告为73fs、157fs和1.18ps。; U1 m# v. g6 |

do15algm0qr6406104011.png

do15algm0qr6406104011.png
1 x- X1 W1 s9 D# v  h8 t: n) H9 a
图4:212.5Gb/s下的TX眼图(原始和带示波器FFE),TX SNDR测量显示212.5Gb/s下为36.1dB,以及PLL 2T时钟抖动测量显示总抖动为1.18ps。) l4 {  j4 z: [) Y" {

6 ~& I/ i4 W0 X( V9 T. ^68 j* a" q* f% ?( f
性能结果) X: ~# D/ m2 Q! \
收发器在各种指标上展示了卓越性能。TX在212.5Gb/s下使用PRBS-13图案测得的SNDR为36.1dB,而在106.25Gb/s下超过39dB。) T8 I) O+ {! p7 s4 N( Y5 A" r
# |$ D' `6 ]2 b% r# J+ @  d' X& q
RX均衡眼图在补偿46dB损耗后显示出令人印象深刻的结果,实现6e-9的PRE-FEC BER(误码率)。此测量使用通过自定义测试板的板对板通道,提供33.3dB的迹线损耗,TX侧连接损耗测得为7.5dB,RX为5.5dB,总损耗为46dB。0 X& y% a8 p6 U
* M8 |  s: Y7 z4 }: e9 A8 z
对于24dB和29dB损耗通道的RX,BER阈值为1e-4的抖动容限(JTOL)余量同样令人印象深刻,展示了接收器架构的稳健性。3 q% X0 r. ^& y) |: }/ h

nwwjhpnxgou6406104111.png

nwwjhpnxgou6406104111.png

4 e% s/ I; j* O. A$ o! }, N3 f图5:性能测量显示不同损耗下4通道间的板对板BER,46dB损耗的RX切片器输入直方图和均衡样本,以及212.5Gb/s下的RX抖动容限图。
! M, O4 r( j  i- p. k) {
2 A2 ~( {% s+ u; {6 J77 i& [8 \1 t" L. o2 R2 ^* C! j
结论
1 e: o2 J: x! W这款224Gb/s PAM-4收发器在高速连接领域代表了重大进步,实现了卓越的功率效率和通道损耗补偿能力。凭借2.2pJ/b的模拟功率效率以及在212.5Gb/s下补偿超过46dB损耗的能力,支持从100G/lane到200G/lane连接的转变,实现1.6Tb/s以太网,满足下一代AI应用需求。
# s/ z. X* q5 @' X% c  D; K  O3 ~1 ~" i6 O! L* F  `
创新架构包括自适应和可重构设计、先进均衡技术和超低抖动时钟,解决了电缆、连接器和封装中高速信号完整性的挑战。此收发器为满足现代AI系统爆炸性带宽需求提供了稳健解决方案。
( p$ J+ Z1 a! D* v% x6 ?

5l0iwetrep36406104211.png

5l0iwetrep36406104211.png

7 H7 y( S$ H4 d5 D. b  h图6:与之前在200Gb/s发表的工作的性能比较表,突显本设计的优势。
$ A* g% o! y, T: \' @4 l4 F1 Q

jc3k104g4uf6406104311.png

jc3k104g4uf6406104311.png
8 `& f$ C( \3 s' l% r/ p
图7:224Gb/s 4通道模块的芯片显微照片,展示了收发器在5nm FinFET技术中的物理实现。) S" K  c& W6 R) J5 v' O/ ^

& s8 l: ?& Z9 {" i# K) D. _参考文献
5 j0 H% P$ ~1 x2 K) G[1] D. Pfaff et al., “A 224Gb/s 3pJ/b 40dB Insertion Loss Transceiver in 3nm FinFET CMOS,” ISSCC, pp. 128-129, Feb. 2024.
0 ?, c) u! N6 l3 i+ @3 T0 q8 b& j8 C: D2 Y- z
[2]  M. Cusmai et al., “A 224Gb/s sub pJ/b PAM-4 and PAM-6 DAC-based Transmitter in 3nm FinFET,” ISSCC, pp.126-127, Feb. 2024.7 r% R$ v( s' b
8 s( ~  }! ?' ?  ?" W4 ?4 X1 a- P9 }
[3] J.Q. Wang et al., “A 2.69pJ/b 212Gb/s DSP-Based PAM-4 Transceiver for Optical Direct-Detect Application in 5nm FinFET,” ISSCC, pp. 123-125, Feb. 2024.: Q  n" I7 X9 p6 e
4 i4 Y' q# h9 x6 T3 j9 D
[4] Y.Segal et al., “A 1.41pJ/b 224Gb/s PAM-4 SerDes Receiver with 31dB Loss Compensation,” ISSCC, pp. 114-116, Feb. 2022.6 C# l5 u$ D$ b4 O( z5 x; z0 E

7 p+ F' s* G. X. u[5] J. Kim et al., “A 224Gb/s DAC-Based PAM-4 Transmitter with 8-Tap FFE in 10nm CMOS,” ISSCC, pp. 126-128, Feb. 2021.2 a# f) T% Z6 E+ H( |

# H  ]8 y: L7 N( l) r1 t* a[6] M. Choi et al., “An Output-Bandwidth-Optimized 200Gb/s PAM4 100Gb/s NRZ Transmitter with 5-Tap FFE in 28nm CMOS,” ISSCC, pp. 128-130, Feb. 2021.
0 ~2 t7 H4 [8 Q* ^* L6 WEND, F: s- `9 f* n% a8 z9 `- \' m
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。$ |; l2 Q( L; |; {
点击左下角"阅读原文"马上申请
, l' M/ H) w2 g  n" D! u6 s6 p3 P: x; N; M4 \! a
欢迎转载/ }5 W- U# U  a2 {8 B9 {) q! Y

: ~; U8 }% v) w转载请注明出处,请勿修改内容和删除作者信息!" m3 P+ \$ w( K4 c$ [  Q

! K- v$ B5 a+ C1 ^/ \: b1 t1 h; H& i+ _

$ U- F; P/ i1 r$ _5 }

xre0x5xngzl6406104411.gif

xre0x5xngzl6406104411.gif
: h  }, D4 @( e- [

/ |1 _4 M3 t; n! j关注我们
6 w+ k/ u7 X3 N' k7 T5 c! ~. b$ v
! [9 p0 e1 r0 n% ~- J6 _8 z
" Q) r4 k) v2 q9 b4 ~6 @

vfh4hioqufq6406104511.png

vfh4hioqufq6406104511.png

+ `; V* s# V  u1 t* U+ ]% t, @
; P$ x; U) i7 G; ?

urnered1kyz6406104611.png

urnered1kyz6406104611.png

) J1 ~3 n  R$ e' A, n4 h

) Y  c/ J( u4 p2 y: v* Y! R

fyhve4lvbzh6406104711.png

fyhve4lvbzh6406104711.png
8 Z. W2 v6 \, _& [: P+ {2 J+ p
                     
3 `1 R2 q, C1 n0 s  N- x' ^; _, L4 u: s  J* d, m: x9 |+ o8 A, c

3 l- H/ Q) S5 B3 _+ h8 R( ~
: D9 V" [* ?5 R1 o0 W4 R; w关于我们:+ I# m' w9 c% g$ z, H! X
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
5 t7 K& t/ Z- K  }) o0 H" N% `% \! |* Y. j  u
http://www.latitudeda.com/
$ e' A2 R- Y. V7 C(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表