引言
7 ~1 ?$ @, \2 v2 z7 Z" YNVIDIA RTX Blackwell架构在GPU技术发展中具有重要意义,标志着计算机图形处理向神经渲染技术的重大转变。本文探讨Blackwell架构的革新特性和技术创新[1]。
6 ^: Q$ T* c8 J P, b i7 s: b k5 [. z$ R5 z7 G8 V
2rp3alkscgx6405300214.png
" \) `" Q# n: p& a
3 i9 ~2 \6 Z% S+ R7 j! {7 f1( ^; m I& c. O, r5 Z6 k
神经渲染的演进/ f: M1 y4 ]6 {7 }) n8 q% k
GPU架构的发展已经进入一个新阶段,传统渲染技术正在通过人工智能获得增强和提升。Blackwell架构在NVIDIA之前GPU所奠定的人工智能技术基础上,进一步提升了AI驱动的游戏和专业应用程序的图形真实度和交互性能。
8 Z6 q7 G9 g% [6 v- z6 V+ O" c
agodr5tcpsx6405300314.png
) l, h9 k! r2 I# k e$ r2 H图1:从2016年到现在,AI TOPS(每秒张量运算次数)显着增加,展示了随着DLSS4和神经渲染特性的发展,AI处理能力呈指数级增长。
! M) ]5 M" m+ L1 ^1 q6 q: c/ q3 t, z" e9 z
即使在摩尔定律逐渐接近极限的情况下,Blackwell通过复杂的神经渲染技术仍然保持了GPU性能和图像质量的提升。NVIDIA的DLSS(深度学习超级采样)超分辨率和帧生成技术大幅提高了帧率,同时以较低的渲染成本实现了接近原生渲染的图像质量。* z9 @; i( L: ^5 M
9 ^9 }3 B' a6 ^! X2
, I2 N. C; Z& U3 h架构设计目标
; S% ]/ i0 r. _+ r4 V) ~( P; r" _4 m( v
mksb12exdtz6405300414.png
8 ~: V$ v2 Y# B9 B1 S图2:RTX Blackwell的设计目标集中在四个关键领域:优化新型神经工作负载、减少内存占用、实现新的服务质量功能以及提高能源效率。
" f7 d( A. u* L* i7 y: \3 }5 a2 ^% S, q
Blackwell架构的设计精心考虑了多个关键目标。主要关注优化神经工作负载的处理能力,同时降低内存占用并提高能源效率。这种平衡的方法确保GPU能够处理日益复杂的AI驱动渲染任务,同时保持合理的功耗水平。" V, b2 p$ d9 h
8 M3 S( q& t' h7 ~
3
1 A2 R0 X: ^ V n; m2 F1 k核心组件与创新
) F+ j" O. ]. `! o( l; N1 H9 KBlackwell架构在其三个主要处理组件(CUDA核心、RT核心和Tensor核心)中引入了多项创新技术。
" S8 Y9 w) X6 p1 c' z2 c
153e2tk5cti6405300514.png
1 w2 Y* X o/ n4 T/ K# c" z2 X5 q
图3:Blackwell流式多处理器(SM)图显示了FP32/INT32处理器、第五代Tensor核心和第四代RT核心的集成设计,展示了对不同工作负载的全面处理方案。, z( q3 y! Z$ u- {$ b; @
" u0 V1 u8 v; ]! z( H3 {0 s
4lxu32jaaaa6405300614.png
5 [( }, F/ {2 d) Y: I5 X3 q% \
图4:Ada SM和Blackwell SM架构的对比,展示了流式多处理器在神经着色器方面的优化和演进。' k2 ^3 U5 L' ^$ u- b- d' b
) Q s- @; B$ e' G/ X8 x9 O' YBlackwell的流式多处理器(SM)有显着提升:
+ J% O: [6 Q& M4 O/ h与上一代Ada GPU相比,整数数学运算吞吐量提高了一倍RT核心架构增强,具有新的光线追踪能力第五代Tensor核心支持FP4,提升AI处理性能- Y7 b f1 N! Z4 K2 H
45 F" |7 E3 i/ z8 j k* S
内存与性能创新0 |9 f$ W4 c f1 v6 Z, {
GDDR7内存的引入标志着Blackwell架构的另一项重要进展。这种新型超低电压GDDR内存标准采用PAM3(脉冲幅度调制)信号技术,实现了更高的内存速度和更好的能源效率。
! P4 v3 |- u; ^1 d+ L) j& N, |
ssz0i21sbgs6405300714.png
* B# v1 A; _0 s: ^. d图5:GDDR7与前代GDDR6/6x内存的对比,展示了通过PAM3信号技术在数据传输率和效率方面的显着提升。; i( B' Z6 @$ Z! ]$ H6 }9 F
1 J/ k" Z1 T# j! N1 V这些改进带来了实质性的提升。基于Blackwell架构的GeForce RTX 5090显卡可提供1.792 TB/秒的峰值内存带宽,同时保持比前代更好的功耗效率。
- x) ?5 w& T5 O, L" |! W3 x1 b ~
5
6 H0 A5 E1 @- G' Y% _神经渲染技术
$ l3 N6 e0 L4 B# Z6 r1 f7 e
hzbsl2m2bq06405300814.png
) ?; j, ~4 p+ [' e! j4 u* [- ~7 D$ H图6:DLSS功能及其在不同RTX系列上的兼容性概览,突出显示了所有RTX游戏玩家可用的全面升级。5 a0 s" n/ Y. i4 B* D% i
) ], x; b+ _8 g. F6
) y* d3 ]# D7 L$ T; J( V, K应用与发展方向( b# ?" d; G% B/ W; k, [- J
nrwc3d3mynm6405300914.png
, s6 V+ | L1 F( y. j- u8 N8 x1 X
图7:图形中的神经加速管线图,展示了纹理、光照、材质和形状等不同元素如何通过神经模型处理以增强渲染效果。5 Y1 B- }( W- Z2 k' _
% e$ M9 B# W( h1 r( _2 G( @Blackwell架构代表着GPU技术的重大提升,体现了计算机图形处理方法的根本性变革。通过结合神经渲染和AI驱动处理,NVIDIA创建了一个能够提升游戏和专业图形应用视觉质量与性能效率的平台。
0 W# w! r9 U( Z& U7 e. v, |& b( V7 ]; O
这种架构将传统图形处理与人工智能技术相结合,推动神经渲染在创建实时图形中发挥更大作用。随着开发者和内容创作者开始利用这些功能,计算机图形各个领域将会出现更加精细和视觉震撼的应用。
* d$ z+ |; W7 g b4 w# K4 z- X' f8 m
7 v* e: K# r% I" P参考文献
$ b% v& I1 v7 q% ~[1] NVIDIA Corporation, "NVIDIA RTX Blackwell GPU Architecture: Built for Neural Rendering," V1.01, March 2025., R* b( c3 S0 C: ^
END
f, r5 e$ {8 ?5 w9 N7 v+ z软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。* O8 r# ~3 w5 K$ v' q, Q- H
点击左下角"阅读原文"马上申请
9 w5 X- j/ h6 {; N* T: v) \5 U1 u" R( H! i1 a* }' ?$ _, W' T( @
欢迎转载7 ]; n" O- n1 x
2 L+ o, E& K' v转载请注明出处,请勿修改内容和删除作者信息!
! T( o# C3 | N, E- J
% O) o& E( A8 V7 T/ d N# \7 k9 R M1 G; L
+ N) d1 p6 d% |/ |& M
zxxsedp5jf36405301014.gif
) V7 z# j- K8 }6 ^
4 e3 `* ^/ A3 s- \* J1 z5 }4 h; z8 h4 o关注我们
7 K0 o% h/ k" d( ?
) c* m: Z( d% n# f& B3 s3 L3 b/ ~9 B; _$ o2 I$ I/ n
h131duqmmyb6405301114.png
. A2 u# b% ]4 D: A | ( m6 v8 G- |- W5 X. f
3wm3dorx2ge6405301214.png
6 v# C; u9 B5 A. V) \0 l E; ]
| 6 h) _) n) r# ~/ Z- [; n9 D# m" U
dg0c3cn53cc6405301314.png
7 @5 w2 H1 b( x. X* q4 y | & _! s+ W1 j; ~2 \1 Y
; M- r! Y( o/ u1 f- @
8 i8 ^5 g( R5 V5 e4 a
2 W0 f$ O7 h2 m% ~8 L3 o关于我们:; f; @) Z! G% F) D: z e2 V" ~
深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
0 }+ b, W" R- d+ Y! D# f/ K% d* k3 N! I2 ]+ C0 |* j$ N6 d( o
http://www.latitudeda.com/ W$ { \5 V$ l
(点击上方名片关注我们,发现更多精彩内容) |