电子产业一站式赋能平台

PCB联盟网

搜索
查看: 120|回复: 0
收起左侧

NVIDIA Blackwell的内存与电源创新技术解析

[复制链接]

1073

主题

1073

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11353
发表于 2025-4-17 08:02:00 | 显示全部楼层 |阅读模式
GDDR7内存架构
, Z) S) Y4 p. g5 b* f# l5 ~" G
" c; b0 R$ U2 ?6 e  ^NVIDIA RTX Blackwell架构通过采用GDDR7技术实现了内存技术的重大进步。这一发展是NVIDIA与DRAM行业在架构、线路设计和信号优化方面长期合作的成果[1]。
* I; r0 X8 V9 T) F! w! P: a# T9 Q# `7 a

q2upkh4omsw64012027341.png

q2upkh4omsw64012027341.png

7 o) z5 y1 O( X0 I

3ugccp43dup64012027441.png

3ugccp43dup64012027441.png

6 Q$ A4 a6 }1 f# [* b9 C图1:GDDR7与前代GDDR6/6x的对比,展示了通过PAM3信号技术在数据传输率和效率方面的显著提升。- v/ p* \+ E' \( D
( }. r6 S, w: q" s  C4 F+ y+ Q( _
GDDR7内存系统采用PAM3(脉冲幅度调制)信号技术,这是一个相对于之前内存代的重大改变。与GDDR6X的PAM4信号(使用4个级别传输2比特/周期)不同,GDDR7的PAM3方案使用3个级别传输1.5比特/周期。这种改变结合创新的引脚编码方案,大幅提升了信噪比(SNR)性能。
! A" ~, h" b" T' f
+ ?6 P7 w) |. c8 y6 Q6 V对于GeForce RTX 5090,这转化为28 Gbps的GDDR7内存速度,提供1.792 TB/秒的峰值内存带宽。GeForce RTX 5080更进一步推进到30 Gbps GDDR7内存速度,实现960 GB/秒的峰值内存带宽。这些提升在保持更好功耗效率的同时,实现了相对前代的显著性能提升。
( I! V% J. B+ F  f) a: ^先进电源管理+ g+ K) ]0 t4 j. Y

: C# U0 u- D8 ]+ V- Z9 hBlackwell架构在Max-Q理念下引入了多项精密的电源管理功能,旨在特定功耗预算内提取最大性能,同时在空闲期间实现快速电源状态转换。
8 P8 q- @, r2 A' ?6 _/ f! ?1 m

sy2b2bjxmmn64012027541.png

sy2b2bjxmmn64012027541.png
# v& m! R# e! a3 v9 \
图2:新的Max Q电源效率创新,通过多种优化技术提升电池续航时间。
* j$ H" S, n* w( H
2 e) j5 `5 r: p) ~7 p) X! o+ G电源管理系统包含先进的电源门控功能,可以快速禁用整个时钟树。这一功能即使在通常被视为"活动"状态的短暂空闲期间也能节省动态功耗。
# u7 q( F( O5 N6 l+ n$ P

mdono0vob5p64012027641.png

mdono0vob5p64012027641.png
/ u0 b7 [' @% g8 A$ p( m: D- V2 O. a
图3:先进的时钟、电源和轨道门控机制,对GPU各子系统的功耗实现精细控制。
' `6 a" ^- `; r2 `" X* q! i电源状态转换
8 ]9 y! X0 l) s$ v
1 P! n: u* m; j8 I4 @7 C( KBlackwell的一项重要创新是大幅改进的电源状态转换能力。该架构能够以比前代GPU快1000倍的速度适应动态工作负载,在变化的工作负载条件下实现更高效的电源管理。
8 C# U# q) p% l* N/ C, _4 @

r0hxed0h2cn64012027741.png

r0hxed0h2cn64012027741.png
! r+ h8 U5 S2 Y3 z
图4:加速频率切换演示,展示了在不同工作负载下时钟调整的改进响应能力。5 Z$ P* u. V2 k$ N, b4 J

2 Z! I% ~5 U$ x) t8 F新的频率切换系统使GPU能够快速响应工作负载变化,根据即时处理需求上下调整时钟速度。这一功能确保在维持功耗效率的同时实现最佳性能,对台式机和笔记本电脑都非常重要。
+ n) c) C* S8 S+ \( g低延迟电源状态
3 w4 r1 w2 X' ~
' n7 k+ j$ C, i( U% ?

g2m5b3kllrx64012027841.png

g2m5b3kllrx64012027841.png

/ L; x: g# V( t5 n  Y& X图5:运行小型语言模型(SLMs)推理时的功耗模式实例,对比Ada和Blackwell架构。. S  O" o. v6 F# `! u% o. l
- t7 B! e9 t5 i" j  _
在特定工作负载下,架构通过以下方式实现高达50%的功耗节省:
" O! Z% Q  L( U7 A' w! v通过性能提升减少活动周期
  k2 X* X. e& ]7 H3 i. F通过先进的电源和电压门控降低过渡状态功耗5 n2 @0 J, g% i# o0 H' G3 U
相比前代进入深度睡眠状态的速度提高10倍
& f# G! j3 I5 Q1 l
实际应用效益, ~3 p3 l4 c9 X% F) B1 A$ a
$ }2 g  l0 V; W5 j+ K8 p
对台式机用户而言,这些改进转化为更好的每瓦性能,GPU在需要时可以发挥最大性能,而在轻负载时保持较低功耗。增强的电源管理功能对高性能游戏场景特别有益,功耗效率直接影响系统温度和风扇噪音水平。
  D" T9 W, c# {/ d4 O$ f4 |+ ?! }% s+ X: [
笔记本电脑用户从这些创新中获益更多。先进的电源门控和快速状态转换能力有助于延长电池续航时间,同时保持响应性能。快速切换电源状态的能力确保笔记本GPU在需要时能提供最大性能,同时在轻负载时节省电池电量。! D6 T, K* _) W
内存子系统优化6 ~/ O9 }% X$ k* _. F: a: ]5 h

- m& t: g+ U! F5 W5 {RTX 50系列显卡的GDDR7实现包含多项超越原始带宽提升的优化:  o- G* M) c% c6 Y
增强的CRC用于RAS(可靠性、可用性、可维护性)- H' C7 F% A$ V8 d
改进的内存时钟树门控能力
, e, o- W" F1 g6 d1 U. q针对内存子系统优化的电源轨道管理' p$ T5 ^6 U1 H4 H( B
系统集成考虑2 O* u- t2 ~# C/ q* `& N( Q+ t

' Y, @) T1 K9 W7 C& l对系统搭建者和硬件爱好者来说,Blackwell架构的内存和电源创新需要考虑几个重要方面:
; q9 Q: T2 S$ i电源要求需要考虑功耗的动态特性
7 u/ U* q: n* w4 \3 |" m1 u根据更高效的供电系统优化散热解决方案% Q' R; w& C: B4 t8 p7 I$ h  Y
通过适当的系统配置最大化内存性能
+ s1 x5 L3 X5 G0 q" V. |& }
结语
& A7 H7 Z4 U) R, P; L* i
5 r1 q' E4 K: ?' i, X+ D# ABlackwell的内存和电源创新体现了GPU技术的重要进步。GDDR7内存结合PAM3信号技术和精密的电源管理功能,在性能和效率方面都带来了显著提升。这些技术进步为台式机和笔记本用户提供了实际好处,也为系统搭建者创造了构建更高效计算系统的新机会。2 L$ |; E) i: u$ j5 `* E$ s0 C% ^4 Z
参考文献
; g4 c/ ^1 M0 `4 f' M: T1 t' t* g$ C0 ]; j6 O
[1] NVIDIA Corporation, "NVIDIA RTX Blackwell GPU Architecture: Built for Neural Rendering," V1.01, March 2025.1 f% H; S1 `& a( q0 O' M/ }
END
% `& G% @. ~1 m& j5 f2 n软件试用申请欢迎光电子芯片研发人员申请试用PIC Studio,其中包含:代码绘版软件PhotoCAD,DRC软件pVerify,片上链路仿真软件pSim,光纤系统仿真软件pSim+等。更多新功能和新软件将于近期发布,敬请期待!* k: {) d3 G4 r& q
点击左下角"阅读原文"马上申请3 @* [/ _" l7 z* K% b$ W2 J6 {

8 Z7 ^0 s$ B8 `7 n欢迎转载0 u" v8 k* M! ~! G4 Y  E
  O( W3 z- X2 \! Q$ q# c( g: o
转载请注明出处,请勿修改内容和删除作者信息!
1 n, u* e, H$ r
; B" f8 ^9 H  Q2 |+ U
! h0 B- a, L; |: Z% G
$ E/ k$ S6 X9 ~* X3 p% l9 l* ~

0ccje0pcdnq64012027941.gif

0ccje0pcdnq64012027941.gif
, Z& K- l, Y2 S9 X

" N* j0 w" d! E% F& w关注我们
% n# C6 D. [( k$ r( E0 Z0 }5 G
: @7 P! u2 P. X, m& j7 _

  L4 P5 x. S3 H. V6 b7 ]

h25tfuiiss564012028041.png

h25tfuiiss564012028041.png
: T: J( v% O+ B
+ r6 o5 Y+ D$ U  D$ J* O

ko1k5thvapk64012028142.png

ko1k5thvapk64012028142.png
4 ~' s& P, T& ^0 B) W8 C8 W
9 E4 I! L+ |. c$ n; V# {

s2g41thtxiv64012028242.png

s2g41thtxiv64012028242.png

9 E3 Q0 V! \: E& s+ y9 ]. C9 U
                     
% N/ ]; P# Y# J% H8 q
6 x  `2 ]- b) f

& A. A! Q1 p  o/ H7 s; c1 I0 r# _; F) C0 ~- I8 J" m
关于我们:
, R$ D8 z/ ?6 J& H0 U深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
) t6 I  ~6 [+ ^2 V$ |+ F  L0 j; {+ d3 v% d1 q8 f7 S
http://www.latitudeda.com/
3 o7 _. d, x3 Z7 H(点击上方名片关注我们,发现更多精彩内容)
回复

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


联系客服 关注微信 下载APP 返回顶部 返回列表