引言
, p8 K" B! ~7 }车用级Chiplet架构简介! v+ Y. I' s- n: m( u
自动驾驶系统日益增长的复杂性需要更强大、更可靠、更高效的计算架构。传统计算架构源自PC设计,应用于安全关键型汽车应用时面临显着限制。Mercedes-Benz开创了一种名为多系统芯片(mSoC)的新方法,利用Chiplet技术满足3级和4级自动驾驶能力的严格要求[1]。
/ Q+ Y5 L5 F1 x) Y0 L& S% J0 G
7 G' p1 b8 r, p/ U: R1 j正如Fran?ois Piedno?l在ISSCC 2025上所展示的,这种基于Chiplet的架构代表了汽车计算的范式转变。Piedno?l为这项开发带来了丰富的专业知识,他在Mercedes-Benz工作6年,担任mSoC标准的首席架构师和Mercedes-BenzUCIe?代表,此前在英特尔工作20年,领导了多个高性能计算计划,包括Extreme Edition产品线。
. K @: }6 c$ l4 \* W
pfiuihzmmu46403792139.png
! e1 j c! A. u) [: r$ m
7 e6 W! I! N9 z2 z1' C9 b! K* s7 I2 c8 T
传统计算架构的局限性 ?5 D# c9 @+ H o6 f
传统计算架构,被称为"PC之子"设计,在自动驾驶应用中存在几个关键限制。这些自20世纪80年代以来占主导地位的架构存在多个单点故障隐患,对干扰高度敏感。这些系统的异构性增加了复杂性,而对虚拟机和总线仲裁的严重依赖增加了显着开销。8 e3 t4 q* g; X, y
e040ntnlotw6403792239.png
* R. U' f" i0 \8 Z4 v
图1:描述了"PC之子"架构及其各种组件(CPU、GPU、NIC、NPU),并强调了多个单点故障、对干扰的敏感性以及缺乏内置冗余。- G0 [1 l+ \ m9 s4 M* [/ H9 n
- M. g7 z- o2 g, c7 [! p" U# _这些传统架构也缺乏内置冗余,这是汽车安全应用的关键特性。解决这些限制通常需要资源复制和跨多个电子控制单元(ECU)的备份重定位,这大大增加了带宽需求和系统复杂性。
: \5 E' @ U4 Y7 H4 k5 I8 K
+ ~( x, d* s9 f3 I; _# I2
' _5 x1 u4 W/ Y8 I1 P& x0 d高级自动驾驶计算的复杂性
& {; o' ~: ~9 USAE 3级和4级自动驾驶的计算需求令人惊叹。Mercedes-Benz的自动驾驶系统涉及约1,400个可运行程序(软件执行单元),具有复杂的依赖关系图。这些程序中许多必须满足ASIL-D要求,这是ISO 26262标准定义的最高汽车安全完整性级别。6 c) c* D( y4 R% p* d3 ^+ N
ffvessoyke26403792339.png
0 Q& F; j, y7 g% Q) I( E. A图2:这个复杂的图表展示了高级自动驾驶所需的1,400个可运行程序及其依赖关系,按ASIL安全级别进行颜色编码。4 _2 s2 N: K/ M! J# ~
. E8 l2 C0 s; n3 u i7 |
这种复杂性需要仔细分割工作负载、控制系统和功能安全(FUSA)组件之间的依赖关系。分解这些依赖关系使系统更易于管理,并实现更有效的安全认证。
; W- k0 R+ L4 C, j
uajhft0rm3o6403792439.png
! S9 v! ^9 h. o! B7 d图3:工作负载(A、B、C)与控制组件之间的依赖关系分割,包含功能安全(FUSA)元素。
# X7 h; g- S8 g6 R/ C
6 L! e2 M) w q5 W3. y* c% p1 K/ B% R
功能安全认证的管道架构
5 V, B, Y) N/ Q% o/ H& I) P为实现所需的安全认证,Mercedes-Benz开发了一种复杂的管道架构。该架构将进程分为不同的管道:两个反射管道(具有ASIL-B最低评级)、一个FUSA管道和一个应用管道。
! H3 h$ s+ U) `1 N5 Z1 Y" L, c# M
jqvqixo3jxa6403792539.png
. {+ T$ Q- C. I }
图4:展示了数据通过反射管道、FUSA管道和应用管道的流动,说明了摄像头、推理引擎和融合系统等不同组件如何交互。) V& |; Q& k7 C; V- j/ ?! H
; V' K3 [1 ?( e' V2 b f该系统将约75%的资源分配给易于功能安全认证的确定性反射进程。其余25%用于通常更难认证的应用进程。这种分配反映了对安全关键功能的优先考虑,同时仍为其他车辆应用提供必要的计算资源。% ^8 q0 R) f. w
qwtfyzx2tay6403792640.png
1 N- u* B* f1 H' x" b. u8 B2 p
图5:反射和应用进程之间的75/25分割,突出强调了反射部分的确定性本质与更复杂的应用部分的对比。
) _/ V. e; |6 y+ ~3 J/ J' X
* v- ]8 B" }$ {) Q- y2 r7 X4
1 C% [1 L7 |' ?' xPOLARIS一代mSoC实现
# l% z' U8 W2 y1 I! I4 |POLARIS一代mSoC V1.x代表了这些架构概念的实际实现。这种设计包含多个专用系统Chiplet,包括I/O、CPU、FUSION、NPU、GPU和协调整体操作的中央系统Chiplet。
& v5 o8 c: N+ u$ S2 d4 p* }
yaccrgbltgc6403792740.png
5 e- ]/ x. K& b/ N0 ]
图6:POLARIS一代mSoC V1.x的物理布局,展示了各种Chiplet系统的排列,包括I/O、CPU、FUSION、NPU、GPU和中央协调系统。
8 y w1 m5 Z0 C4 t' q! q, `
) @* T4 p$ ~" Y这种模块化方法实现了更灵活的硬件配置,能够为安全关键操作创建冗余系统。Chiplet方法还允许为每个功能使用更专业化的硅芯片,优化性能和功耗。" D, C- ]# ?# a) {; i
9 t& c) s n9 `, K5
% q. \: D! u" t软件和硬件集成挑战
! A7 m. J; ^ U4 ~( LmSoC架构提出了显着的软件含义,直接影响硬件设计决策。ASIL-D调度要求必须在硬件级别实现,以确保确定性行为。此外,电源管理也必须满足ASIL-D要求,考虑到高性能计算元素的复杂电源需求,这是一个重大挑战。
; v3 N3 H4 d: `* e3 R0 j
itz4kqyafug6403792840.png
9 e: y! ^: H- i3 g R图7:硬件设计的关键软件含义,包括ASIL-D调度和电源管理要求、监控预防和Chiplet验证基础设施。
$ U1 S# a2 h* d9 ^$ T
5 |9 r6 E/ v5 } S d软件和硬件的集成需要谨慎管理整个堆栈。Mercedes-Benz设计使用了硬件和软件元素的混合,包括专用硬件调度器、用于Chiplet间通信的邮箱机制,以及根据Chiplet功能不同而混合使用实时操作系统(RTOS)和Linux等操作系统。4 e& [' Q$ w& N( N. N" a7 G9 _
a45czndpcci6403792940.png
3 Y z4 Y5 o C! ?2 g
图8:软件/硬件堆栈混合,展示了DICE1、CENTER DICE和DICE2,说明了中间件、Linux、RTOS和SHERIFF ASIL-D调度器等硬件组件如何在系统中交互。0 _/ ~% F# K8 U, S3 ]. ?- I3 l
I. Q+ X1 G+ z" Q$ @6' a2 o- Z: g+ A
用于SAE L4自动驾驶的高级mSoC V2.0. b# H; S' x$ i0 V- c% N' `9 }$ `
为SAE L4自动驾驶设计的下一代mSoC V2.0展示了架构的显着进步。这个版本包含了许多专用处理元素,包括CPU、DSP、ISP(图像信号处理器)和ML(机器学习)加速器,所有这些都通过UCIe(通用Chiplet互连快车)标准相互连接。
+ v1 w7 s& E! I7 \$ I
0fccdiqjugd6403793040.png
( D$ y2 b* n5 I6 p4 Z2 z2 Z4 d# D( V
图9:解说明了SAE L4自动驾驶的mSoC V2.0架构,展示了多个Chiplet与HBM(高带宽内存)、ML加速器和Mercedes-Benz专利的FLASH4ML技术的集成。
. W1 F5 j3 ]; q7 }; B- D/ h% r) f8 d7 j9 \. z) Y
该系统具有32通道的高带宽内存(HBM),提供实时传感器处理和AI操作所需的大量内存带宽。该设计还包含梅赛德斯-奔驰专利的FLASH4ML技术,为机器学习操作提供快速、非易失性存储。8 D" v ?* Y- _) G
4 P# m, s {" Y. S4 T; Y B+ @
该架构的一个关键创新是用于Chiplet间通信的加速网络,实现专用处理元素之间的高效数据移动。这种设计在汽车应用的计算密度和效率方面代表了重大进步。
& u& T" o9 C6 l( M
3y2lix3wbsq6403793140.png
- f3 L# U' b6 @" W, ~) n6 v8 D图10:此图展示了高级自动驾驶的扩展能力,具有1000 GB/s带宽和超过3 TB/s吞吐量的高速互连。- O+ ~9 S. Z, t- `* T: u
+ t; K3 ]( [1 L6 v
79 s& v S0 |$ O! P
用于功能安全的UCIe实现( f' ~4 p" k. x! V3 q' n
通用Chiplet互连快车(UCIe)标准在mSoC架构中发挥关键作用,提供Chiplet之间的标准化互连。Mercedes-Benz开发了几种专门设计满足汽车功能安全要求的UCIe专利实现。
7 W5 t) Y$ y* g5 h# b' y8 v( `2 F/ w7 W8 \0 o
UCIe: 4 x 1配置提供四个Chiplet之间的完全连接:8 y6 v+ g( L; V+ j( N
ll5msezdc356403793240.png
, W" _/ y5 u+ v5 [: H' M+ p; y% Y/ u图11:UCIe 4 x 1配置,包括片上网络(NoC)连接、两个电源间的电源分配和FUSA(功能安全)元素。3 A% k" o K) u0 x# D2 ]# {
" T' d# D5 e" r
为了可扩展性和冗余,梅赛德斯-奔驰还开发了3 x 1、2 x 1和1 x 1 UCIe配置:& R: m+ p" B4 |
doabu55ornn6403793340.png
1 Z" t, w. ~9 Q! P
图12:UCIe 3 x 1配置,移除了一个连接("GONE"),同时保持双电源和功能安全元素。/ ?7 b5 L J8 I5 L( T
rh3s2rnpbfm6403793441.png
2 C) q5 X/ \$ i5 L( O& ~
图13:UCIe 2 x 1配置,进一步减少连接,同时保持必要的电源和安全特性。
+ y7 r- C' p% F& E
' F1 L/ D$ N9 u5 T, S: f
u3uxg4tzzdk6403793541.png
# j. d9 s9 n( b+ @# p1 k$ D0 |
图14:最小的UCIe 1 x 1配置,代表最基本的实现,同时保留冗余的双电源。
1 u2 r `; `9 \. J: x$ ~/ D" G4 j' B2 x" Y% o& A# L) B
这些各种UCIe配置能够实现灵活的系统设计,可以根据特定要求定制,同时保持关键安全特性,如双电源和用于功能安全监控的专用GPIO(通用输入/输出)接口。( u4 F5 V9 b l, u/ J
3 i% t+ f+ F e; b7 M
8% \. Y2 ?; ?: M2 Y
用于开发和验证的mSoC模拟器
" F, r& u# g* b' {为支持这种复杂架构的开发和验证,梅赛德斯-奔驰创建了一个复杂的mSoC模拟器。这个高级模拟器在软件中实现了关键架构概念,允许开发人员在硬件实现前测试和完善算法。' \8 [/ m/ e% J' K$ p
vwucui2b1wy6403793641.png
" f3 }* @+ A! J( E图15:mSoC模拟器的高级软件架构,包括用于工作负载队列的邮箱SRAM、各种计算元素(Jupiter、Mars、Mercury、Saturn)和用于有效载荷和内部状态的HBM4内存。0 R( |0 o3 j7 H3 Z7 L _ ]
0 I& j# J" ?2 |2 W1 `! y. Z
该模拟器运行在强大的开发硬件上(56核Xeon CPU、512GB DDR5 RAM、NVIDIA RTX 4090 GPU),并使用POSIX共享内存进行组件间通信。它实现了与目标硬件相同的架构概念,包括基于邮箱的通信系统和跨专用计算元素的工作负载划分。/ |2 s9 s/ @- \% P: h
' W+ }% [; K4 X6 e9 Y4 e0 m7 e+ @
模拟器运行演示展示了多个处理管道处理自动驾驶的摄像头输入、物体检测和环境映射:$ S& v4 S: @+ z1 M9 p& W2 }: d
n4iawajmdd06403793741.png
/ }4 `6 i+ T, D2 D( T$ h图16:mSoC模拟器演示的屏幕截图显示了多个窗口,展示摄像头馈送、物体检测结果和系统统计数据,演示了自动驾驶功能的并行处理。0 V" e7 @! A- L/ S H% x: \9 d5 [& _
9 V9 ^8 l/ ]/ l( F( E* f' v
9
- r* U+ J" J; _8 A结论
* d1 t$ h1 ~( lMercedes-Benz开发的基于Chiplet的多系统芯片(mSoC)架构代表了汽车计算的重要进步。通过解决传统计算架构的局限性,并提供专门为自动驾驶需求设计的框架,这种方法实现了更高效、更可靠且功能安全的系统。
a' ~& J9 x7 o" q7 Z' @9 R
8 |1 l- b9 [% {Chiplet设计的模块化特性允许灵活配置、专用处理元素和内置冗余。硬件级调度和通信机制的实现确保了安全关键应用所必需的确定性行为,而使用UCIe等标准实现了与来自各种制造商的Chiplet的互操作性。" E, }' C+ x: @( C4 ?8 _7 |; Q7 ?
7 ]& B5 Y5 p8 z- X1 `随着汽车系统不断向更高级别的自动驾驶发展,像mSoC这样的架构将在提供自动驾驶所需的计算能力、可靠性和安全特性方面发挥关键作用。mSoC V2.0及以后版本的持续开发展示了梅赛德斯-奔驰致力于推进这项技术,以满足SAE 4级自动驾驶及更高级别的挑战。; L5 ]4 {& l K6 c
0 ^3 R7 B0 J6 y O9 m- Q" v
参考文献+ d/ H4 ~2 t7 T+ T( a0 I
[1] F. Piednoel, "Design and Assembly of an Automotive-Grade Chiplet-Based Multiple System-on-Chip (mSoC)," in 2025 IEEE International Solid-State Circuits Conference (ISSCC), Feb. 2025, pp. 1-23.
9 B9 L8 Q# X" E% lEND3 b9 L, b7 n! A' k' V) V
U$ N- S+ y9 [" v9 G
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。
) l: o4 r5 H1 X0 X- J& I1 m, D/ a点击左下角"阅读原文"马上申请
# H$ |& v, Z7 y; M
9 F3 d3 p6 @' a欢迎转载7 k% h, O/ l8 l+ Y+ x
5 S) \+ r% I7 r* Z3 S& U
转载请注明出处,请勿修改内容和删除作者信息!
$ r2 c/ h$ e4 l: c- s
4 W: K: q% \; L6 g% m" `/ i/ y2 z7 H$ F
# A+ I/ \% b( g" o' t6 O
jhwasudcpft6403793841.gif
3 K& C9 t( y% V
6 A7 F9 ^6 _$ j9 W+ j
关注我们- c% v% I) c8 n) g
# r/ f1 k B& j
# e' s9 f4 [: p/ D! k/ X
nzrtebqj50x6403793941.png
6 u, t" s Y* N* b | ( Q0 W- Q- b7 K- ]
xd1mwaxbj2z6403794041.png
1 s6 q8 `" g0 j& [6 W | 6 a8 Y" k! F6 N( }6 j7 q

% r+ t1 p9 T9 {7 P' T |
8 o. \9 u& p! i+ R' I( z+ X7 _
- W6 Z/ Z1 r0 I! G# D: H* z4 W6 ^
- F5 W$ W8 Z" z5 T9 Y0 Z% y( }/ v9 C0 M, A+ y% q
关于我们:
; b5 a. w" L% ?6 L深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。. U6 ^0 l4 R2 a8 P0 N0 X' x
. E; M) F1 \2 {; n) Y
http://www.latitudeda.com/& x7 o9 p; B/ h9 ?
(点击上方名片关注我们,发现更多精彩内容) |