电子产业一站式赋能平台

PCB联盟网

搜索
查看: 964|回复: 0
收起左侧

Hot Chips 2024 | AMD下一代"Zen 5"核心性能和效率的进展

[复制链接]

1076

主题

1076

帖子

1万

积分

论坛法老

Rank: 6Rank: 6

积分
11451
发表于 2024-9-27 08:00:00 | 显示全部楼层 |阅读模式
引言
7 [* n' H' g* Z+ P! ]; y$ s本文探讨AMD即将推出的"Zen 5"核心架构。这一新一代处理器核心在性能和效率方面都有显著提升,对于计算行业的发展具有重要意义。; ^6 {7 r  G3 S: Q
- W! l6 V9 u2 D9 H. p
"Zen 5"核心概述1 Q' G) `: U3 i% x  D8 j
"Zen 5"核心是AMD成功的Zen架构系列中的最新迭代。在继承前代优势的基础上,"Zen 5"旨在提供显著的性能改进,同时保持出色的能效比。
# ]3 l6 F6 Q& E
; t0 H1 L/ u" G9 j6 W& O9 Y

0x14liirb2v64014029133.png

0x14liirb2v64014029133.png

7 y6 M6 [6 r2 Q7 S+ w3 S0 ^9 N图1:展示了Zen架构的演进,突出显示了Zen 3、Zen 4和Zen 5的关键特性。5 H  |% A6 O! `3 q4 A& o: p2 d) v
, k7 b1 ?$ z( V5 L3 I' L, j* Z6 D7 H
"Zen 5"的主要特性:
  • 相比"Zen 4"提升16%的IPC(每时钟周期指令数)
  • 支持AVX-512变体和FP-512
  • 8宽度指令分发和6个ALU(算术逻辑单元)
  • 双管线取指/解码
  • 采用4nm/3nm制程工艺. E9 ?# B  s0 l( `/ Y# a
    [/ol]
    4 Y. q; C6 i+ w' S( O微架构深入分析% i' ]4 S/ \: P
    "Zen 5"微架构引入了多项增强功能,以提高性能和效率。: [  z8 R- `) C, B7 S

    # A. P6 Y1 P3 T% R$ m/ F$ e4 ^

    wjkplehrz3164014029234.png

    wjkplehrz3164014029234.png
    * n$ y  O9 o, `% C) z% H  e
    图2:提供了"Zen 5"微架构的详细概览,展示了各个组件及其互连。
    & T) w  V" v; A. q$ h# o" U! M1 g( S5 w
    前端改进:
    $ p; U6 q1 m" b4 Z
  • 双指令取指和解码管线
  • 8宽度指令分发到整数或浮点单元
  • 增强的分支预测,每周期可进行2次预测
  • 更大的Op-Cache,可存储6K条指令,每周期2x6宽度取指
    ( o' L$ y1 T2 s3 i' B( I5 C1 }) P

    6 Z5 C8 f: A& i0 v, H执行单元增强:
    ; C* @9 T" d( U! ]/ K
  • 6个整数ALU和4个AGU(地址生成单元)
  • 每周期4个浮点运算,FADD(浮点加法)延迟为2周期
  • 完整的512位AVX-512数据通路,提高吞吐量
    7 g  G+ i- g! j. ]" Z3 |# n8 ^# \

    * l6 ^, U  Y$ x( p缓存和内存子系统:+ E& ]2 z" Y' e4 d: ]( S
  • 48KB 12路组相联L1数据缓存,每周期可进行4次读取,2次写入操作
  • 1MB 16路组相联L2缓存
  • 改进的L3缓存延迟) a# w1 B" G% J/ c5 \. C
    ; b7 M* N9 l% \0 C. V! Q# a. ~
    "Zen 5"家族和平台支持
    5 ^! F+ p' e$ [8 M  r7 `; w9 U* kAMD推出了两种"Zen 5"核心变体,以满足不同市场细分的需求:
  • "Zen 5":优化单线程性能
  • "Zen 5c":注重性能功耗比和性能面积比9 f8 C! l6 K0 n* D, |' e
    [/ol]* P8 I7 ^! k7 M- B! d6 @6 ]

    ( Q5 ^& W, O% q' V; |6 z0 ?

    lsonkembxck64014029334.png

    lsonkembxck64014029334.png

    & {" e. H1 l  G) d7 E0 K图3:展示了"Zen 5"家族成员,显示了"Zen 5"和"Zen 5c"核心之间的差异。
    6 O% e4 b2 Y( `2 p, I
    : z( k2 ~7 D9 D# @0 _这种方法使AMD能够针对从高性能台式机到节能移动设备的广泛产品范围。" g6 ^1 {) U. p

    0 l; d5 a. l: c9 k9 c9 z, Y% b新指令集架构(ISA)特性
    - l, m6 \- q2 T( q"Zen 5"核心引入了几项新指令和功能:
    2 a/ @- Z2 V# ]. n) `. B: w2 r" u; O
  • MOVDIRI/MOVD64B:4、8或64字节的直接存储指令
  • VP2INTERSECT[DQ]:AVX-512向量对交集
  • 3VNNI/VEX:带VEX编码的扩展AVX-512指令
  • PREFETCH[I*]:指令线的软件预取
  • 增强的安全特性,包括SEV(安全加密虚拟化)改进
    . t+ A! {2 |9 ?$ |. g0 L" b: }

    $ `6 g7 z0 s5 J! m/ o9 Y+ _, i5 }性能提升+ ]; Q$ }5 p7 G& E( ^; d
    AMD声称"Zen 5"核心在各种应用和使用场景中都实现了显著的性能提升。
    + j/ o# d' a6 P# R
    . \* [4 e$ B" [& n

    zvxxsqg3taf64014029434.png

    zvxxsqg3taf64014029434.png

    & j; ^+ T/ H  {- C7 C图4:展示了"Zen 5"相比"Zen 4"的关键进步,突出显示了各个领域的改进。* Y* Q  j! }" T6 |
    : N- M  n) ~; o! u- ]4 }/ O
    IPC提升8 T) N! P- \+ N4 G* Q1 u
    "Zen 5"核心在一系列应用中展现了令人印象深刻的IPC改进:- o  X3 J) |/ Y& }2 Q% a3 Q
    ; n" i# v0 V) M1 }  Z& p

    hnj2wk1sava64014029534.png

    hnj2wk1sava64014029534.png

    1 g* T1 V$ M( g' x5 P) w2 y% f" O图5:显示了使用"Zen 5"核心的PC相比前几代产品的IPC提升。! L6 C( w, n' L, L6 \6 p

    % ?2 m9 x- E, C( D3 _AI和科学计算. w3 v  x. _: {4 g, [' j
    "Zen 5"核心在AI和科学计算工作负载方面也表现出显著的性能提升:
    0 T3 f$ _" E$ G
    9 W6 {  n4 H* g( i( ]! t1 Y

    pzv5ibat4ld64014029634.png

    pzv5ibat4ld64014029634.png
    6 r0 n" F4 f! k: K3 e5 j+ a+ m# M$ B
    图6:展示了基于"Zen 5"核心的第5代AMD EPYC "Turin"处理器在AI吞吐量性能方面的领先地位。
    + N/ d! g+ A- F9 b+ F/ i7 T7 i
    ; W8 b3 w1 K& b: {8 o在SoC中的实现6 ^5 ]0 ^- `, f9 D1 c
    "Zen 5"核心将被实现在各种系统级芯片(SoC)设计中,以满足不同市场细分的需求。
    5 I* {2 J+ f7 l; S  S"Strix Point" SoC:  \  _7 n# x# J1 h0 f7 F

    mbethlwddx564014029734.png

    mbethlwddx564014029734.png
    8 \+ p+ V$ Z6 F5 R8 W, J1 P' q( K
    图7提供了"Strix Point" SoC的详细框图,展示了"Zen 5"和"Zen 5c"核心的集成。
    2 o8 o, B! J) w! h: L, K  a; K
    6 {7 G% H* i+ F, n( Q0 e"Strix Point"的主要特性:
    6 L; Z- n7 Z; G1 {/ T
  • 异构架构,包含4个"Zen 5"核心和8个"Zen 5c"核心
  • 集成RDNA 3.5图形处理器,最多16个计算单元
  • XDNA 2推理引擎,用于AI加速
  • 支持DDR5/LPDDR5内存
  • PCIe 4.0和USB4连接
    # g: D! `! ^2 k8 I& Z

    7 N$ [7 @* L2 m+ d5 U3 f"Granite Ridge" SoC& r7 g  J# k, ~/ g

    iciyktynici64014029835.png

    iciyktynici64014029835.png

    / {3 X9 N" i) G+ H* T( `& r7 \图8:显示了"Granite Ridge" SoC的框图,该SoC专为高性能台式机应用设计。
    ! _' h: l, H0 u, v
    4 q9 q8 _6 b/ E8 ~# U4 a: I"Granite Ridge"的主要特性:9 ~# x9 J3 t1 f) c3 t9 X2 P- E* R) l9 q3 ]
  • 最多16个"Zen 5"核心(2个CCD,每个8核)
  • 每个CCD 32MB L3缓存
  • 支持DDR5内存
  • PCIe 5.0连接
  • 兼容AM5插槽, |) H8 E& S+ f5 D- W2 T& k; `- o

    ! H+ N2 ?) F* S" D5 @/ u' F能效改进6 T  E' z- z* w, w9 `% E1 c$ e
    "Zen 5"核心在Zen系列的能效优势基础上进行了进一步改进:
  • 增强的电源门控技术
  • 改进的smt(同步多线程)支持,提高性能功耗比
  • 缩短电源状态进入/退出时间
  • 优化分支预测,减少无用工作
  • 高效的字符串操作和预取器改进
    ( }% T4 j  L6 a8 ]: [- x& Y[/ol]6 y3 I& e4 C6 ~- c# ?% t
    这些增强功能在保持出色能效的同时,提高了整体系统性能。
    8 J# s" |: Y6 ?1 I3 K. T+ P: q/ j- c0 C+ Q
    RDNA 3.5图形架构+ B- Z# y% h# @; U4 Z9 R
    对于移动应用,AMD还改进了集成图形架构,推出了RDNA 3.5:
    $ o4 u1 V4 |9 |* P2 I2 a

    rzwyqc2fvgt64014029935.png

    rzwyqc2fvgt64014029935.png

    0 x/ B4 F7 f  ?4 |& _, L+ u图9:概述了为移动应用优化的RDNA 3.5图形架构的改进。
    9 N/ s. I% H0 F' K" E9 V2 `% k8 c+ B% F1 L. ?
    RDNA 3.5的主要改进:3 v- d" }4 _/ ^6 w+ V. J: o7 s
  • 2倍采样率和点采样加速
  • 增强的着色器子系统,插值和比较率提高2倍
  • 改进的光栅化子系统,通过子批处理提高效率
  • 针对LPDDR5的内存子系统优化和改进的压缩
  • 更大的引擎配置,包括8个WGP(工作组处理器)和4个RB+(渲染后端+)
    5 I: e+ {: v0 H# x# Q3 V, P
    ! u. z, T$ r. w" r* g
    AMD Ryzen AI与XDNA 2架构
    3 z, h* R% x, a9 P1 X1 w为了满足个人计算机对AI能力日益增长的需求,AMD引入了XDNA 2架构用于AI加速:
    5 d  c4 i7 u- i0 M/ n  A0 p

    xzwccgymld564014030035.png

    xzwccgymld564014030035.png

    9 h7 f) _* C, D# z0 l( E5 k图10:展示了基于XDNA 2架构的AMD Ryzen AI "Strix" NPU(神经处理单元)。
      r7 C2 V, K6 k. w$ ]" `& z% i- y9 ]& `) V+ U6 ]& K6 i0 Z) ~
    XDNA 2的主要特性:
    2 S: b  r) j/ f# H
  • 最高50 INT8 TOPS(每秒万亿次运算)和50 Block FP16 TFLOPS
  • 8个并发隔离空间流,提高多任务处理能力
  • 片上内存容量比上一代增加1.6倍
  • 支持块浮点和增强的非线性函数
  • 相比上一代产品,性能功耗比提高2倍1 E$ G- C' p& v. T& K4 I# F7 Y# ~& M

    2 e  T2 I* E! [& t' b结论
    " R4 ~+ t$ H3 t4 _AMD "Zen 5"核心代表了x86处理器设计的飞跃,在各种应用中都提供了显著的性能改进。凭借对AI加速、能效和可扩展性的关注,"Zen 5"核心有能力满足从移动设备到高性能服务器等各种市场细分的现代计算需求。) f" I! T% u/ z
    # ^' ~7 u# l7 L/ a2 l7 c0 a9 s* d
    随着AMD不断创新和突破处理器设计的界限,可以期待未来会有更多令人兴奋的发展。"Zen 5"核心及其在各种SoC中的实现,展示了AMD在竞争激烈的处理器市场中提供领先性能和效率的承诺。: b" x7 L6 t" P! t/ C" z! d

    5 i# e( W% Y+ q4 p参考文献
    - Z  b3 |- t. K" ]7 C  h[1] B. Cohen and M. Subramony, "Next Generation 'Zen 5' Core," in Hot Chips 2024, Aug. 2024.: u3 h& h0 o$ ]1 z. c* ~

    : \; M+ [) l8 j1 x: I# `3 k- END -& u6 j0 L, K! ?

    0 b( l6 a6 @7 O软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。+ f; Q9 r: B# }3 D5 a/ Q- K# n
    点击左下角"阅读原文"马上申请- g- E6 p7 P- ^$ y. O

    ; U9 u7 M- ?. N* ]& b4 U欢迎转载
    1 e" V  p- K2 S+ G, L$ g' f0 v8 q2 R, i9 L
    转载请注明出处,请勿修改内容和删除作者信息!- T! b" ^0 G. D8 ?- n% x& T3 G+ s! z) l

    + o3 V4 \# C* D3 `' y5 P9 a: V
    * O, W* H! b( V  P4 f% t3 v

    $ @- y6 a+ _/ N; O, B& O

    vjhqegeadpe64014030135.gif

    vjhqegeadpe64014030135.gif
    2 Q& ?% Z4 Q2 Y# ]+ m
    , A0 m% J/ z0 G* b+ Z% G; D
    关注我们% I# b1 i  b4 l
    2 d4 O8 O$ v$ W8 O! E
    ! y4 ~; D5 r# ~; k! T7 \7 u2 w5 A

    yfjpo4desb064014030235.png

    yfjpo4desb064014030235.png

    " T# ~$ @; I4 J, z8 J/ N

    ( C/ R# v2 S- h9 m2 f5 @

    diigldkjaki64014030335.png

    diigldkjaki64014030335.png
      n. d' T& Q- Z2 t5 Z) t  L( C: f) C) B
    0 s6 d4 E; k* w) F

    5uwjbu0mhxm64014030435.png

    5uwjbu0mhxm64014030435.png
    : @7 H2 u( K$ i' R
                          # t' t( r  ?* j, ]+ w

    9 s3 ]  u2 B1 q! Q
    1 K9 P2 D) k( K+ y9 x, l
    # ~  v( D# k9 ~1 }2 k% Z4 C
    关于我们:
    , n* J* F2 }& L5 r9 h7 Q深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。8 L6 ?9 @( x$ W
    1 |0 O" v4 L! n" e; A# t! ]7 T
    http://www.latitudeda.com/% z: i0 ?) q4 L$ F& b
    (点击上方名片关注我们,发现更多精彩内容)
  • 回复

    使用道具 举报

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则


    联系客服 关注微信 下载APP 返回顶部 返回列表