电子产业一站式赋能平台

PCB联盟网

搜索
查看: 127|回复: 0
收起左侧

使用CNSim评估Chiplet网络

[复制链接]

1075

主题

1075

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11406
发表于 2025-1-10 08:02:00 | 显示全部楼层 |阅读模式
引言% i0 Q& d+ X# z3 l
& `% t9 F9 M! n; |9 n* {" \
Chiplet架构通过在一个封装中集成多个硅芯片,显著提升了计算密度和效率,改变了现代计算系统的设计方式。由于Chiplet网络的异构特性以及片上和片外网络的紧密耦合,评估这类网络存在独特的挑战。本文介绍CNSim(Chiplet Network Simulator),专门设计用于评估大规模Chiplet网络的周期精确、数据包并行仿真器[1]。7 k* z, q$ Z& \, g

dsvumwxcgh264052581101.png

dsvumwxcgh264052581101.png

  a$ s: u! H9 Z1 c. G$ t6 F( a  ]CNSim主要特性
# ^  Z! v9 z/ o" c& o  l1 @* t" O8 r3 u! ?# `& H" k
CNSim具有三个核心功能:! @# K; O4 t4 T2 Y
数据包中心架构:与传统的基于周期或离散事件的仿真器不同,CNSim采用新型的数据包中心架构,根据注入时间维护数据包队列。这种方法在保持周期精确性的同时实现了高效仿真。
2 B3 s7 |1 w2 D" V& R1 ]

dq4gcfkpbha64052581201.png

dq4gcfkpbha64052581201.png
, \7 h2 J) {1 W6 B* o
图1:数据包中心的CNSim架构概览,展示了关键状态值如何存储在数据包而不是网络中。! b% O9 `$ I1 o2 r
) ?# V0 T. B3 \; I% j% X/ s
并行仿真支持:CNSim实现了基于原子操作的超线程机制,支持高效的数据包并行仿真,保持最小的不一致性。仿真器可以通过工作线程同时处理多个数据包。3 l; B1 ]5 V' m" Q# z# X

wmh51tvtnsv64052581301.png

wmh51tvtnsv64052581301.png
. ?1 I& f! r7 Y, F  G- j' l+ z9 N$ f
图2:数据包并行方案,展示了每个工作线程如何从队列中获取数据包进行顺序处理。
8 h7 ^+ O* a) ?5 ]
/ P+ a$ h/ ^% G4 j* m( d. |异构路由器和链路建模:CNSim通过可配置的多宽度FIFO和虚拟流水线级,提供了统一的异构路由器和链路建模。' t, ?, b7 O! C+ Q/ G& M

t2gff3umcsd64052581401.png

t2gff3umcsd64052581401.png
$ J0 B6 V& R  G4 b( N! v
图3:异构路由器和链路的统一建模方法,展示了多宽度FIFO和虚拟流水线级的实现。6 F! }: x$ }7 _/ j/ |2 N+ A/ {8 v4 H
使用CNSim进行网络评估! Q+ J  y! T% o. ~, a( M) b) N* D5 `

! y. e8 }- y, ?& j! ]CNSim支持多种网络拓扑,包括2D网格/环形网络、蜻蜓网络和分层拓扑。
) ~8 e/ n5 g% y* c8 ?9 ~

4yf2rnqijqa64052581501.png

4yf2rnqijqa64052581501.png
. z) n; \- v$ r
图4:不同的异构链路Chiplet架构,展示了传统2D网格、基于Chiplet的2D网格拓扑和基于异构链路的2D环形拓扑。6 @  H  f( g, V3 d* K, J2 Y2 o
; Y/ K- `$ }( i* {/ R

. E- `+ [' @" A: q. q在流量模式分析方面,CNSim可评估合成流量(均匀随机、位反转、位重排、位转置)、实际工作负载(PARSEC基准测试)以及集体通信(AllReduce模式)。4 Z9 J) `/ g( j. U( q

1 d- L' G) B8 M/ v  \$ d% V性能指标包含平均数据包延迟、网络吞吐量、资源利用率和拥塞统计数据。
# e5 N9 k, E% X

nlhmulbube064052581601.png

nlhmulbube064052581601.png
3 x; W# L, B9 s3 h2 R9 f& q
图5:在均匀流量模式下,不同网络配置的平均延迟与注入率关系的评估结果。/ g' a8 _. M7 G9 o( ?
应用实例
2 R9 O- i" N9 a8 ^3 |( `9 G1 h& ~
, I' W' Q9 v! H& c$ e案例研究1:异构链路网络4 l- O4 N2 j+ D" ~- V
CNSim支持评估具有不同带宽和延迟的异构链路网络,包括片上链路(1 flit/周期带宽,1周期延迟)、低延迟并行链路(1 flit/周期带宽,2周期延迟)和高带宽串行链路(2 flits/周期带宽,4周期延迟)。  m  M! y$ m& a4 p4 |* z5 X! l4 U

naarxignfxn64052581702.png

naarxignfxn64052581702.png

5 p9 K9 ~2 \1 o1 a$ @图6:不同Chiplet网络配置在各种PARSEC工作负载下的性能比较。
& k& T8 p2 x9 h4 g7 v0 p9 V$ o9 Q& Z' E0 g9 n, ~, }6 j1 V
案例研究2:大规模蜻蜓网络
2 w3 |/ u3 a7 Y, R2 RCNSim可高效仿真从小规模(41组,1,312节点)到大规模(145组,18,560节点)的网络。/ r( [4 G2 @4 B- e+ s2 M" k

bfx2mic4q3f64052581802.png

bfx2mic4q3f64052581802.png

4 Q3 t$ y4 I$ A2 `图7:不同网络规模的全局性能比较,展示了平均延迟与注入率的关系。
, w  u* O9 }% h, b4 M. q, ]7 ?0 ~CNSim使用最佳实践9 g- Z3 R6 n4 I1 c1 q
, p% B6 @6 Y2 N
配置设置需要定义网络拓扑和规模、配置路由器和链路参数,以及设置流量模式和仿真时长。性能优化方面,应根据网络规模使用适当数量的并行线程,配置数据包发布宽度以平衡速度和精确度,并启用重复路由计算的缓存。结果分析包括收集延迟和吞吐量指标,分析资源利用情况,比较不同配置。: _" M0 p# v$ O
总结; }' L* p, g7 ]

& j) b$ O9 I4 x$ sCNSim为评估Chiplet网络提供了周期精确仿真、高效并行执行、异构组件支持和全面的分析能力。5 N! ?* `) I& }1 V, ~, k' p

jemftxjk1s064052581902.png

jemftxjk1s064052581902.png
: f+ A; O7 v2 B) D
图8:在不同注入率下BookSim和CNSim的内存消耗比较,展示了CNSim的效率。
% X$ [( w/ S+ u0 ^/ @0 ?9 }$ [( Z2 Z
) Z$ |5 W6 l7 g' K# F; R* x通过独特的功能和能力,CNSim解决了现代Chiplet网络仿真中的关键挑战,同时保持了高性能和精确性。仿真器的开源特性使研究社区能够在此基础上进行扩展,推动网络创新。
' S: @  a. l2 V1 E7 ?( ` 参考文献
% l8 C7 z) o: W3 C
8 l! c% J% h1 B+ Q/ \2 d[1] Y. Feng, Y. Wei, D. Xiang, and K. Ma, "Evaluating Chiplet-based Large-Scale Interconnection Networks via Cycle-Accurate Packet-Parallel Simulation," in 2024 USENIX Annual Technical Conference (USENIX ATC '24), Santa Clara, CA, USA, July 10-12, 2024, pp. 731-747.* Q8 a; y& p, `- V
END( v; Z3 C6 j6 D; z. ?: `8 C
- T; U0 a' T2 L! q( T4 A% O3 ~
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。3 i% {$ A6 Q- s! k$ l$ E  n
点击左下角"阅读原文"马上申请
8 K2 V9 T% a/ J8 R$ H( j; B$ K) @) I: M
欢迎转载
9 z  y6 C/ X6 Z! Y% Q, v- E# X5 C9 E! N' V6 ?
转载请注明出处,请勿修改内容和删除作者信息!$ H; }5 j5 ]) x' G3 ^/ A4 `
" V% k7 R/ a2 D9 v* P

5 S1 q' G/ G) n' j6 H; T. s
; X; Q& V! F5 a! C

2vkk0ys20un64052582002.gif

2vkk0ys20un64052582002.gif

9 ^( Z. P' I: z/ {
- G) D& b1 s5 s! q% g关注我们
" O3 |& h) k2 c" k' \7 O, |
5 i1 a5 L7 Q$ j# V
8 k7 N% f  q; V' e

dk4m4h1ku5z64052582102.png

dk4m4h1ku5z64052582102.png

6 L. X3 I0 E; g3 ]# X  t. w

% A/ h' e' Q( R3 p- G; W. Q( K

n0ijmx2jc1r64052582202.png

n0ijmx2jc1r64052582202.png

- @1 B: N; `! o8 ~: L

  W- ^4 }, |/ o" W! J5 b& p

lsuipjgxnrz64052582302.png

lsuipjgxnrz64052582302.png
- j7 ?' P5 v) ^7 [3 x
                     
4 j$ A; d# F% x7 V# L" T- v5 N9 X( T3 t: l6 I2 A
3 t6 Y+ j4 F* j- y% G; J0 y

  X  X) {* s& v2 T6 l+ U关于我们:
/ a9 Y& Y: D' T0 ]深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。' |+ C: K0 C, R- N" t( l( \. O5 x2 n
  N8 l7 L2 B# O& H6 G* Q5 j- p
http://www.latitudeda.com/
/ k) z$ U& Y' D(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表