引言
, Q7 _; Z2 k( K6 q( |人工智能领域正在迅速发展,在大型语言模型(LLM)及其计算需求方面取得显著进展。随着从传统预训练方法向更复杂的后训练和推理方法转变,行业在人工智能计算架构和扩展规律方面面临新的挑战和机遇[1]。
+ {2 I i& V# V
4ol4sxr3l1n64021748400.png
5 ?$ W" `% }- U- r( G# m
2 Z2 j# D9 {: _1
# X% M( ?9 p& p# W1 [0 u6 A扩展规律与性能提升& e2 l% d: ~' o# K: h
LLM扩展规律的传统认知正在被重新定义。早期模型主要依靠Chinchilla法则,通过优化模型规模和训练数据集容量来提升性能。但目前的发展面临数据稀缺性限制,促使研究人员探索其他提升模型性能的策略,特别是通过后训练和测试时计算优化。
4 M" i$ j% I' a. ~
vbqcrduzhmu64021748501.png
& Z6 L! E- E0 S0 |5 y! g# E图1:各种LLM模型的智商测试结果对比,OpenAI的o1预览版达到了明显更高的智能得分。$ J& d4 G1 B* }8 n# _% d2 }/ {) f$ L
5 U, z; @; ~) E( |OpenAI的o1模型证明了这些新方法的有效性,在多项基准测试中大幅超越前代产品。该模型在后训练阶段利用强化学习和思维链过程,即使使用相同的基础预训练数据集也能取得更优异的结果。
/ W6 J5 a5 z4 {" ]* p2 C
qsopj3unr3l64021748601.png
+ S& h x3 |) Y& A0 F- Q. {
图2:OpenAI的o3模型在ARC-AGI基准测试中的表现,展示了相比前代版本的显著进步。) Z) v! t) F/ Q5 n
' Y8 J* r+ x! f) ^6 \( u$ ]
2$ e ]* D1 S* B% U" J' c3 H
向主动式人工智能的转变
$ W& R! s1 [* M6 W+ A4 V行业正在经历从生成式人工智能向主动式人工智能的根本性转变,后者能够以最少人工干预执行复杂任务。这种转变代表了人工智能发展的重要进程,尤其在交通、制造、基础设施和医疗保健等领域的实际应用中表现突出。2 Q# ^+ A$ ]- y7 B7 P r r1 n3 S
, i+ C9 B9 S' M `Google的Gemini 2.0平台通过Project Astra和Mariner项目将多模态能力与实时交互相结合。这些研究原型探索了未来人机交互范式,特别关注设备级别辅助和浏览器自动化。
- `8 S! O0 Q" Z8 r
d30myzdqy4d64021748701.png
- K7 k) l1 u1 J; d+ \5 U+ h7 w
图3:LLM推理中的多步对话流程,展示了在上下文窗口内如何管理输入、推理和输出过程。; ~& m( X. `* _$ x$ Y7 n0 @( I
2 Z6 X. `. k' K7 ?1 a% c g
3
6 b& }/ m& x6 a' ^+ {计算需求和基础设施
9 T: M! {8 |: R1 f7 _- W, j# N向后训练和推理扩展的转变对计算基础设施产生了重要影响。虽然总体计算需求可能不及预训练要求,但这些新方法需要大量计算能力来有效处理推理训练。3 g: F; k$ B# C3 n2 U
zqcv2e5fpkh64021748801.png
; U6 l( Z9 a8 C2 w: r0 ^图4:GPU供应在训练(60%)和推理(40%)工作负载之间的分配。- P( S: q$ I: Y; y( r
ysm5dzrvt4e64021748901.png
' s1 w, Y! h* Y2 H1 N& n: N: y) h3 {, |图5:不同LLM训练代际的GPU需求增长,突出显示了计算需求的指数级增长。
0 ~! M0 _% h$ z- }0 @ k. V
, \8 h# [/ x9 I+ h2 {+ N+ P4
6 _- O7 X; J% o0 W* N4 M9 {- A# M技术实施和性能指标
0 ?% B2 }$ m1 R( e n8 L推理token在现代人工智能系统中发挥关键作用,占用上下文窗口的大量空间,但在生成响应后会被丢弃。分析显示,o1-preview/o1-mini等先进模型比GPT-4o消耗多约6倍/2.5倍的输出token,其中推理token占总输出token的72%/52%。- C3 v$ D& Y2 @6 p: z2 n' T' y- N, i7 T+ }
22q0qao53ij64021749001.png
, m6 B% K4 _8 G9 u图6:到2028年ASIC在总AI FLOPS供应中的预计采用率。
: p6 z7 K w' E1 O- W% U. I x3 `) u8 j
% W# C! {: N- u/ x, q55 y) l y* y9 Y0 K- K/ `! f
基础设施和市场动态6 |; t5 y7 |; l
人工智能服务器基础设施市场正在发生重大变化,特别是在NVL机架的生产方面。虽然GB200的整体生产计划保持稳定,但供应链限制导致出货预测需要修改。行业预计年度NVL机架出货量为25-30k台,随着组件供应改善,产量将逐步提高。
# R. @* w7 g8 k; {
egm2adzrazo64021749101.png
0 M2 S3 Y. l- g/ w0 D
图7:超大规模数据中心资本支出相对EBIDTA的累计预测,表明在人工智能基础设施投资水平持续。
9 E: u0 h6 u6 z% l X6 ]
5 T1 \, n- Y9 H8 Z6
$ h5 g: @6 w3 {! }1 m, n6 k2 X市场影响和未来展望7 N N7 J4 A0 f3 e3 h3 `, [
展望未来,行业面临机遇与挑战并存。尽管目前面临变现挑战,超大规模企业仍然坚定投入人工智能发展。根据IDC预测,今年全球云服务支出将达到8050亿美元,在人工智能推动下到2028年可能翻倍。0 W# ^" v8 m/ p% v
jop45vgv3nb64021749201.png
" N/ b O" \5 B+ b图8:云服务的全球支出预测,分析了传统云计算与人工智能驱动增长的构成。
6 n! W1 e+ _: q. M+ U
4 L+ s4 j& L: t这些发展趋势表明人工智能计算将保持持续增长,特别是在推理能力和专用硬件解决方案方面。从生成式向主动式人工智能的转变不仅代表技术演进,更代表了人工智能系统与终端用户交互和价值创造方式的根本性转变。
+ h& O& m( B [. H( ~& V
0 a7 |6 A. Z7 \4 p- q2 r9 A5 b参考文献
: e% J& K' }6 l9 t[1] S. Kao and A. Chen, "Small stumble out of the gate: Taiwan technology sector outlook," CLST Research Report, pp. 1-24, Jan. 1, 2025.
9 q+ E3 ^9 C7 m$ z7 O N: O% _: C s( SEND& G. F0 b1 O, j! ^" A
F! s/ A1 [: D6 @+ e: A3 Q
软件申请我们欢迎化合物/硅基光电子芯片的研究人员和工程师申请体验免费版PIC Studio软件。无论是研究还是商业应用,PIC Studio都可提升您的工作效能。/ J+ B- z, x4 J7 u d+ s. U; ~8 P1 X
点击左下角"阅读原文"马上申请$ I" `- l, M9 j+ `
& d m- d- G% {4 e7 _7 i; F欢迎转载) a. J2 @9 I2 K% m" ]# h! j+ w# @
& d1 o& B2 o5 r5 @ i转载请注明出处,请勿修改内容和删除作者信息!( d3 H5 g7 s" j' O
$ L! M( h0 U# o$ z4 X4 Y/ b* j1 j& v, n! n! J
( O$ ?+ O! A$ W6 T# r
hrkfzdclmsa64021749301.gif
% U! l' b4 A2 [( P$ N) m$ A1 z
4 @1 K0 n- u; O& U* d关注我们
0 a s- |$ y! t+ N2 y7 s1 n! X( K7 ^8 z9 E9 u0 ^
; |& q" o# I5 b0 z/ z' Q2 K }" ~# Q
5xyagvocwn464021749401.png
( g" b: p" ?$ t) _# g' T; w |
0 F: w% U1 k+ B4 F4 \' }* u
mvfrfx1t0kg64021749502.png
6 @ T' t! F4 f# W1 K6 k
|
5 _) \9 g' V F! q9 l" R5 E
p5hloizslsq64021749602.png
! }% j; f' Q f& Q |
B2 C6 \9 L( |) @/ x1 B2 b3 C7 p1 k
/ [2 {5 ~7 H' s1 i1 |& I; R' R- C0 o0 Q! z, k8 q% f
关于我们:
9 N% V* H. |5 X% V5 H( H深圳逍遥科技有限公司(Latitude Design Automation Inc.)是一家专注于半导体芯片设计自动化(EDA)的高科技软件公司。我们自主开发特色工艺芯片设计和仿真软件,提供成熟的设计解决方案如PIC Studio、MEMS Studio和Meta Studio,分别针对光电芯片、微机电系统、超透镜的设计与仿真。我们提供特色工艺的半导体芯片集成电路版图、IP和PDK工程服务,广泛服务于光通讯、光计算、光量子通信和微纳光子器件领域的头部客户。逍遥科技与国内外晶圆代工厂及硅光/MEMS中试线合作,推动特色工艺半导体产业链发展,致力于为客户提供前沿技术与服务。
1 S- Z7 I' o4 ~% k- w) z& o% ]. s6 q: x6 V
http://www.latitudeda.com/: G7 @$ I; G) ^7 r
(点击上方名片关注我们,发现更多精彩内容) |