一水 衡宇 鱼羊 发自 凹非寺
# @; k5 r$ i0 r4 ]文章来源:量子位 | 公众号 QbitAI刚刚,“鸽”了一年的稚晖君,终于带着具身智能新品来填坑了!7 L8 E1 h2 d. f( j! U2 e
没有什么比抽奖抽一台,更能体现对产品的自信了。
5 W& s! t# c' y
isgn5awrjvh6408842902.png
1 N* h1 x0 N% t/ ]一上来,稚晖君也没藏着掖着,就在直播现场搭建的“摄影棚”里,机器人当场秀了一波在语音指令下动手调饮料的操作:! H Q4 D a; {9 [& F: S
0gtdfyquxcj6408843003.gif
% c1 X* q; T5 v9 A) X! o' h O
6 l1 u0 N$ _9 m& C" E5 T! {' b( W7 N
mqu1grsvtrh6408843103.gif
6 n8 m; E# O1 |; z/ @5 e△2倍速现场主持人,也由此番发布的远征A2机器人亲自担当。
) M0 i4 |& {4 q7 ]% f# M+ N# r
dnd5gj2eoef6408843204.gif
3 z6 ?7 [7 x+ r, y0 C( b% j) Z一套小连招下来,网友们be like:! g- Z" [# e7 |- ~2 o1 V
nqoyoiiteov6408843304.png
* \' H( E) j" P2 }4 y3 H* [
B站科技区流量担当,诚不我欺(手动狗头)。
# w& d' M1 S2 P6 _+ d
p4nomit4mwp6408843404.png
) Y6 w+ f! m; o9 @2 a尽管发布会只有短短1小时不到,但稚晖君和他背后公司智元机器人憋了一年,此番属实带来不少干货,先给大家伙做个小总结:4 Z* f+ q( a3 y4 D
发布远征A2系列人形机器人
4 K: c1 I: m; h9 ^0 T6 T全栈开源灵犀X1系列机器人,主打一个“人形机器人人人造”# V w& `5 j5 F* o7 B' h5 t* [
自研关节模组实现量产化迭代升级,灵巧手自由度升级至19个
% p2 Z" w! ?/ ?定义具身智能G1至G5演进路线
9 ^5 _0 ~1 z" Q% O) A5 z; X……: ^5 y) a3 ]6 \" E3 O( T' W, u
总之,可以说是秀产品力的同时,也把硬核DIY的科技情怀给拉满了。$ I; x1 Y! y0 U B9 @: j) j$ \$ X
ppeh3litut36408843504.gif
7 O9 s" ^" }) ^
具体详情,咱们一项一项展开来唠~
6 R* t- \# [/ m3 m3 t/ v A面向量产的人形机器人就像稚晖君自己所说,自去年8月中旬发布远征A1以来,他及他身后的智元机器人颇有些低调,在公众视野里可以说是“鸽”了一年。8 v/ ^: s* F7 a# @4 [! L
2w30410uovq6408843604.png
* v! G+ N' _0 Z# I# }7 b+ P& d% z
但其实这一年中,智元机器人一直在“闷声干大事”。2 F- h# Y" h- C/ ^+ S9 D# E% R$ |# o
智元机器人销售服务总经理姜青松对此补充说:2 p# E w* t1 m& P0 H2 u; w1 R- @
我们每个月都在迭代,但因为不具备商用条件,所以没有宣传。
$ Z9 a$ x$ l* E而现在,面向商用,智元确实在这场发布会上,给出了阶段性的思考和答案。
% K: t& o+ j6 y首先,在产品方面,远征A2系列机器人相较于前代,主打的就是一个“面向量产改进”。' G* T1 p6 T' c9 U) B' q5 C4 w: ?
32lrsptppe36408843704.png
* y' V- Q! Y9 M) D" c ^
为此,智元此番发布了3款适用于不同场景的机器人:
6 ]8 b+ @+ }- w6 E5 F/ q远征A2,身高一米七,体重140斤,是能双足行走的交互服务机器人。大模型加持下,具备流畅的讲解能力和稳定的运动功能。
9 ~" `7 e. H! n' D1 \! o远征A2-W,轮式柔性智造机器人。一开场给稚晖君做饮料的就是它,具备动态任务编排、复杂作业执行,以及双臂协同作业等能力。
2 L0 ]2 k7 @$ F1 J. b! s远征A2-Max,重载特种机器人,能够搬动40kg以上的重物。该款机器人目前处于产品研发阶段。# w; P: b! N1 z
4 X" w Q3 C) r$ X
mml4pcsgw5r6408843805.gif
9 B8 ]! d. o; Q% ~) q6 E
具体到技术细节上,智源机器人将机器人系统划分为动力域、感知域、通信域和控制域。
9 |8 ~& M8 @, }1 M1 G2 t4 O
qszxsmlsw0u6408843905.png
- w: m8 y& e( O动力域方面,智元自研的PowerFlow关节模组实现量产化迭代升级。其中最强型号额定扭矩达到270Nm,峰值扭矩达到512Nm。1 h9 Z7 _/ n( Z- c' }4 y0 \! Y; ? {
a5dfh4ulvut6408844005.png
4 k% u8 `, t" @+ v3 `
稚晖君表示,PowerFlow此番提升,主要是可靠性和稳定性达到量产级别。在现场,他也透露这款关节模组将开启对外售卖。
C/ P* p- g" U9 [9 b$ P! l$ @此外,机器人灵巧手的自由度也升级至19个,其中主动自由度达到12个,并引入了基于MEMS原理的触觉感知和视触觉感知技术。
8 |. x6 ]5 S+ q" E使用工具拧螺丝:+ K! M% }, }% E* F1 ` O
4ylo4a1vch56408844105.gif
" w O5 z4 F/ o拆快递:* S' \4 w: U' n" g: `2 i
4htsd3choss6408844206.gif
2 v/ z& i6 `) m7 M) g5 ~, ^ @+ z
干点穿针引线的精细活,都不在话下:/ y" U5 B0 t6 f: X& k5 D7 ~ C8 e
i44gnavxkia6408844306.gif
0 o8 w3 F9 |: l S. i0 W感知域方面,远征A2系列集成了RGBD相机、激光雷达、全景相机等传感器,引入自动驾驶Occupancy感知方案,通过SLAM算法进一步提升环境理解能力。
& w+ s* f0 t7 M: a9 M6 c7 R. T* J通信域方面,智元自研了专为具身智能打造的轻量化、高性能通信框架AimRT。3 U) N; u4 k) L
相比ROS等第三方中间件,在性能、稳定性、系统部署效率和灵活性均有提升的同时,兼容了ROS/ROS2已有生态。8 V4 H: E% O/ I' N" I8 ]
AimRT还将于9月底开源。4 f6 D; L2 {/ a1 f2 C. l! K
jqqovlejyvg6408844406.png
- h8 Q D* B$ n控制域方面,结合Model-based和Learning-based两种算法,智元进一步提升了机器人的运动控制和适应能力。并预研了基于自然语言指令集驱动的、可以适配不同机器人本体的AgentOS,基于强化学习,实现机器人技能的精准编排和高效执行。
3 a& \5 E9 m' @ D2 Y$ e
4wf4pblrnby6408844506.png
8 ~# `6 Y7 J- t) [3 C另外,智元还构建了面向开放生态的软件平台AIMA(AI Machine Architecture),覆盖机上、云端和客户端。该平台集成了机器人软件的核心技术,同时提供丰富的二次开发接口。0 A7 e* y* o# n4 m
具身智能技术演进路线值得关注的是,配合自家商用化进程,智元此番还提出了类似自动驾驶L1-L5的具身智能技术演进路线:# @0 ?/ c Y+ u4 x4 m6 z
G1至G5(其中“G”指通用人工智能)。4 r* q4 v+ r+ u) y- Z- o" Y& z
tycjrba2w0z6408844606.png
6 Z f+ t, L: Z+ I+ v0 q" k% N
其中,G1为传统自动化阶段,机器人基于大量人工编排执行任务,辅以简单视觉,基本不具备泛化能力。& z- w. S2 c, j
G2阶段,有了大模型的加持,机器人开始实现一大类场景的快速迁移。+ q* i0 ?- E) j5 f9 K* a) k w
方法是,针对大量不同场景任务,提炼出可复用的原子能力,且以相对通用的方式实现这些能力。
) `# Y5 {6 b. R+ |9 y过去一年,智元机器人在G2路线取得了阶段性突破,实现了通用的:位姿估计模型UniPose、抓取模型UniGrasp,力控插拔模型UniPlug等一系列zero-shot和few-shot的通用原子技能。, p, f9 z3 n9 x
g1cvpxi2wki6408844706.png
7 [! m( T! c) [" U* Y& r% \ t6 w
不过嘛,以上阶段都还采用了大量手工编排。, W- t& k, V% C3 C
到了G3端到端阶段,机器人训练从算法驱动变成数据驱动。
, a0 }4 }6 E2 P* f5 p1 w此时,由手工设计各类原子能力变为依靠大量数据采集。这一阶段的目标是,形成一套通用技能训练框架。
- f1 Z) m+ R" t8 B. H* m比如发布会反复提到的“PPT能力”,即抓、放、递……) s" V8 r* H9 p( \ J; Y' e- G2 C
xjmsxzmviov6408844806.png
( b* ^4 J3 b- ~/ j稚晖君特意提醒,当前实验表明,端到端是一条具备Scale up潜力的路线。" f9 \/ o* A1 P1 N" w1 D
在G3基础上,G4主要实现通用操作大模型。
) ?3 y7 l% P! S9 T) Y" b% z举个例子,比如对于开瓶子、开门把手这两个动作,G3阶段还需要单独采集数据,以训练不同的技能。% t G# w+ ]1 d5 Y
但对人类来说,其实动作的底层逻辑是相通的。
, q: T. v. w [, L) m因此,G4引入了大量跨场景的真实、仿真数据,再加上时间模型等类似技术,让AI理解背后物理原理,从而执行更加复杂的任务。% [# ^* X4 c, T5 g( q- D7 T
至于最后的终极目标:AGI。对具身智能来说,主要还是能够走出实验室,在开放场景具备跨任务的泛化能力。3 x% |' N! X6 W* @/ o8 D
从G1到G5,一个显著趋势是:数据需求不断上涨。
$ { o- N. |# ^( O
5 @. L( D- K3 a# {' E姜青松透露,目前智元已经迈向G3阶段。在G3路线上,智元机器人还形成了一套具身数据方案AIDEA。
/ A2 w. k5 f* ?( U, b) D+ B( T7 b' e1 b这是因为,“有多少人工就有多少智能,在具身智能领域依然成立”。! p# Q( ]( y0 ]$ N
也就是说,高质量的人机操作数据非常关键。 T' h; z. t5 O$ H2 k3 @/ f6 R

O7 b/ O5 [$ J具体来说,AIDEA包括数采本体、遥操设备和数据平台。4 j- { t( R! `8 B4 C- S
数采本体也就是轮式、足式等类型丰富、可靠稳定的机器人。
# F0 I. V/ W J遥操设备支持全身映射、臂手协同和高精实时。
. e/ h) S. T6 b G* {. W数据平台覆盖数据采集、数据标注、数据管理、模型训练、模型评测、模型部署再到数据回传的全链路,支持SaaS服务和私有化部署。6 d" {0 w" X' j( n

0 f: A8 e0 t T0 S1 ]2 n彩蛋是,基于AIDEA的百万条真机、千万条仿真数据,同样开源。今年四季度,感兴趣的小伙伴可以蹲起来了~9 W' K7 A* f4 R% w; J
“人形机器人人人造”以为介绍完远征系列,智元机器人一年一度亮活大会就结束了吗?- r( F9 P$ [; q6 G# B, z K
并不!5 h0 t) i1 P4 d* b& T# B$ ?& i5 b
稚晖君一声令下,远征A2-W缓缓推上来了一个没它高的神秘黑箱。
" v* V2 p( Y: n3 D6 B7 W有点眼熟,好像是直播最开始,稚晖君指挥A2-Max搬走的那玩意儿:
; I$ v7 K9 t, r 4 O. J) _# N% Z! G
里面的东西破箱而出,是智元推出的另一款机器人。
7 c8 i. d& C1 w/ v8 x6 B灵犀X1。
: _0 a8 ]% ]' H" `1 H2 H' G7 w诞生于智元X-Lab实验室(也可以简单理解为智元内部的稚晖君实验室),是智元机器人专门面向极致创新和敏捷探索而设立的。
6 V3 p6 L5 X4 U; P ?( {+ l , z6 \1 V* U8 U& e- j
今年6月立项,10个人组团投入其中,不到半个月前刚刚正式降生。1 C0 W+ d/ r* h( S/ z5 p7 i

! V7 k7 \; {+ A7 y+ I视频录像显示,灵犀X1身经百摔:/ o. A2 O. ~4 [; V
" V ?8 i. P" S2 Q, U' Z4 B2 |
现在已经能做到被大力推攘也不会摔倒了。/ w8 j# m- g0 U. W/ L- p! b
6 ^# C$ F, g" G- C* S3 k( f7 { W# l8 U3 @' G+ J/ [5 h
△来人啊,这里有人霸凌具身小机器人(不是)灵犀X1身高1.3米,体重小于33kg——比起远征系列,灵犀系列看起来更小巧玲珑;它的最大行走速度高于2米/秒,单臂负载大于3kg。" @" t3 g; @/ _
据介绍,灵犀X1全身上下都由两款自研PowerFlow关节搭建成,分别命名为PF86和PF52。% w0 |$ W: e0 V" x5 m0 H9 U4 _
这两款PowerFlow对外销售。
2 u+ E- M7 v O1 b' h$ b
3 H% P' o. \6 Q) c" e. H7 j+ T此外,灵犀X1还具备中空走线、输出端绝对值编码、支持PF-Link智能接口等众多功能。& K' \" Q- `$ l% R
它融入了模块化设计理念,可以通过简单抱箍形式轻松拆装,尤其是它的两只“手”。3 ]% {8 ]& ~/ A8 P% P- O2 G
要知道,灵犀X1的标配是智元X-Lab自研的两个“带前馈力控、超低成本”的自适应通用夹爪。
8 g& m+ k" l/ R8 r9 |2 L自适应抓握,仅1个主动自由度。
- z* k: Z0 Y5 ~. v! J , C" x- W. P2 m* d, d% N
但泛化性很强,抓啥都行。
2 P# q9 E( k+ S l* l4 V1 G
- j/ h8 B* L* F4 m, S4 P甚至是桌面上平躺着的一根针,也能稳稳夹起来。
8 R1 C# Q* e5 B# h$ Q' h 9 L; y, a+ |- y; ~" C
但灵犀X1的执行器不仅可以是自适应通用夹爪,也可以是百元级成本的六维力传感器,满足不同场景需求的那种。
" n4 E9 K' z* x 9 f: j& `+ ?. q
有点意思的是,灵犀X1可以开启“机机模式”。& I0 G6 w% \, j6 Z. @3 B2 t
简单来说,就是打开灵犀X1的脑子(里面本来是空的),把手机装进去,用性价比更高、功能更丰富、算力更强、普及率更广的手机,来当它的脑子。; o" R8 B8 W' @0 L
然后大家就能看到以下这个又好笑又有点诡异的对话画面: o \) ^6 [2 N( p

$ \( h$ T# G5 F4 N, y9 k此外,灵犀系列还有款机器人:! ~/ X% q7 v/ ?6 U* X) i( o
专业数采机器人X1-W。
" a+ i4 i8 ?4 @' a- J7 i和远征系列的A2-W一样,它们都是轮式,然后上半身可上下升降。
7 u# v5 }/ x" [& {不过与采训推一体机器人A2-W相比,X1-W价格更低,适用于只做真实数据采集,服务预训练阶段;而A2-W可服务采集、训练、推理多个流程,不仅对预训练有用,对fine tuning也有用。; k7 N+ \' J* I. \! G$ A
不同的应用场景可选用不同的机器人进行采集,搭配满足全栈数据采集需求。
3 m+ M9 @9 O% e 8 u$ a+ P# ^6 C- q8 F4 G
最后就是大家都很关心的价格了。
9 D! w5 ~2 s: x; X7 N. y- x/ [- d“友商都很卷,我们不参与价格战。”说完这句话,稚晖君按下手中的PPT遥控器,屏幕上出现了灵犀X1的价格—— b, \2 r' g3 x% j
0元。5 O* Z z6 _, Q% I

( S9 r4 ]" G0 f% M6 B/ ?他表示,除自研关节外,灵犀X1的本体设计图纸、软件框架、中间件源码、基础运控算法,统统即将开源。
6 m# {9 q' H: u" ^+ C主打的就是一个“人形机器人人人造”。! \+ x! u, Q: [7 g7 L
1 L: G4 c+ c, C5 |- \
稚晖君也现场给他的X-Lab打了波招聘广告,“欢迎有想法的年轻人加入智元,加入X-Lab”。7 ^5 W" c2 m. P0 n" Q9 h$ ?6 t
0 z) {/ K" B w: n& E. T i& |
One More Thing最后,咱再来简单正式介绍一下智元机器人(AgiBot)。
! s" U$ i* q7 E/ w. C; ~它成立于2023年2月,致力于AI+机器人的融合创新,以及打造具身智能机器人产品和应用生态。
$ B: a( j' f f* W: O1 z! M创始团队包括稚晖君(彭志辉),电子科大毕业后,先后在OPPO研究院、华为工作(以华为天才少年身份入职)。同时,他也是B站up主,自称野生钢铁侠。
9 x( h; G z8 n2 ^- b* [' \+ p
" C. k! ?3 D3 s6 T同为创始人的,还有上海人工智能研究院智慧康养首席科学家、上海交通大学机械与动力工程学院教授闫维新。& `2 s! _ U2 Y# X
去年8月,智元机器人推出首款产品:
. D5 |% @) J+ `通用型具身智能机器人原型机,远征系列的A1。
9 R2 Z+ _0 r4 n4 ]# r V
* U' B* h, ]& m2 q1 o$ G今天,属于是智元机器人第二次大张旗鼓地对外展示研发和产品进展。9 l; v& }7 m& e9 b \" A4 v+ J
截止到目前,智元机器人已完成了A4轮等多轮融资。
# g7 @! }9 R+ t! y5 P9 j0 g智元官方还透露:- c9 H0 a' H4 N" Z
今年,智元机器人预估发货量达到300台左右,其中双足200台左右,轮式100台左右。
* t7 I- [2 z6 ~6 n! J我是老温,一名热爱学习的嵌入式工程师
0 U2 z% _! }* g+ `0 Z关注我,一起变得更加优秀! |