|

一水 衡宇 鱼羊 发自 凹非寺$ ?/ K- Y5 d8 P0 k
文章来源:量子位 | 公众号 QbitAI刚刚,“鸽”了一年的稚晖君,终于带着具身智能新品来填坑了!# u* Y& {( p+ I/ k
没有什么比抽奖抽一台,更能体现对产品的自信了。
1 v/ g0 M) B8 I2 Q6 t! o4 P
mugmo2llofo64012766539.png
/ I* Y/ ~" b, Z' ?1 Y
一上来,稚晖君也没藏着掖着,就在直播现场搭建的“摄影棚”里,机器人当场秀了一波在语音指令下动手调饮料的操作:
4 E3 z# W3 b+ E
v0setuib44k64012766640.gif
, \1 P1 b. r9 ~. p
0 o9 Y4 s; Y# t* i5 @
4cu5djxywpc64012766741.gif
. e0 m/ e+ p; [△2倍速现场主持人,也由此番发布的远征A2机器人亲自担当。
+ ]2 a' t- t# @: r% u$ J) }
v0m2yhuoakl64012766842.gif
0 v/ ^2 i% d% W% W/ I一套小连招下来,网友们be like:/ H7 @. T# Y/ C, I' q- }" s
nnzmjs4wxnw64012766942.png
0 P; _: S# Q. O; j2 G
B站科技区流量担当,诚不我欺(手动狗头)。
3 f# y9 d" F6 D1 d Q: N# O
3oobgxtkprz64012767042.png
; E& v0 y, n5 a8 `9 }- C3 p; H
尽管发布会只有短短1小时不到,但稚晖君和他背后公司智元机器人憋了一年,此番属实带来不少干货,先给大家伙做个小总结:- F7 X' i* J3 d9 Q3 J' a
发布远征A2系列人形机器人
+ {& s9 `. ]& S全栈开源灵犀X1系列机器人,主打一个“人形机器人人人造”! B$ ~: T* }; K1 k( ]
自研关节模组实现量产化迭代升级,灵巧手自由度升级至19个5 n4 g0 S- J7 N" p& W* m% o. m
定义具身智能G1至G5演进路线& T# E7 ]$ r) |# ?/ B: s
……3 V* O% m9 P; d/ U6 z+ {
总之,可以说是秀产品力的同时,也把硬核DIY的科技情怀给拉满了。
3 X6 Q/ A3 Z/ i1 n1 Z
wigrauutnkz64012767142.gif
1 M$ i% Z# N+ l* _6 W
具体详情,咱们一项一项展开来唠~
4 d5 ?, W2 x* V c/ F面向量产的人形机器人就像稚晖君自己所说,自去年8月中旬发布远征A1以来,他及他身后的智元机器人颇有些低调,在公众视野里可以说是“鸽”了一年。+ u7 A) k. Y2 }" p$ W; g8 P* u
1qvumtxzicr64012767242.png
; D# ^$ E) n! R. K/ D+ L# e
但其实这一年中,智元机器人一直在“闷声干大事”。. u7 P; [% }, \: T& E
智元机器人销售服务总经理姜青松对此补充说:
- W+ B: [& p1 X6 y6 q8 `% R我们每个月都在迭代,但因为不具备商用条件,所以没有宣传。
4 g* e8 \# [3 {/ T3 D而现在,面向商用,智元确实在这场发布会上,给出了阶段性的思考和答案。6 C+ U) c- J( m& n9 a3 \( u
首先,在产品方面,远征A2系列机器人相较于前代,主打的就是一个“面向量产改进”。
9 P" O( I% A# R9 [
kddowqdepeh64012767342.png
; _1 f$ {% }+ j( Y为此,智元此番发布了3款适用于不同场景的机器人:# o1 O$ H! J- n- i. h
远征A2,身高一米七,体重140斤,是能双足行走的交互服务机器人。大模型加持下,具备流畅的讲解能力和稳定的运动功能。
! y7 u) Y @: m+ C远征A2-W,轮式柔性智造机器人。一开场给稚晖君做饮料的就是它,具备动态任务编排、复杂作业执行,以及双臂协同作业等能力。 C. h* P: P! F0 y8 A+ A( s0 _
远征A2-Max,重载特种机器人,能够搬动40kg以上的重物。该款机器人目前处于产品研发阶段。
2 ]4 N% ]* `+ y* n% U: M6 ~, r. k7 B/ Z" C
wcgu2frxoid64012767443.gif
e$ L% b- U; U% s- p5 m: I9 `
具体到技术细节上,智源机器人将机器人系统划分为动力域、感知域、通信域和控制域。
0 S f2 f `* |
bkvd3juxrey64012767543.png
$ l7 E0 J; [/ @$ c6 ^动力域方面,智元自研的PowerFlow关节模组实现量产化迭代升级。其中最强型号额定扭矩达到270Nm,峰值扭矩达到512Nm。( O: V6 R C o) e# [$ _" [
fu2qb1pk4zd64012767643.png
5 g" w4 U% G2 n) X5 f, i# H稚晖君表示,PowerFlow此番提升,主要是可靠性和稳定性达到量产级别。在现场,他也透露这款关节模组将开启对外售卖。
, Z1 n+ F# X0 ]9 }- y此外,机器人灵巧手的自由度也升级至19个,其中主动自由度达到12个,并引入了基于MEMS原理的触觉感知和视触觉感知技术。
% h7 {* T5 x! Z% c; X使用工具拧螺丝:; ^7 i8 i% `- [& M* f
yxp44isbtlz64012767744.gif
I. a' C/ X/ l0 @; z拆快递:
% o, h ^2 }* s+ H
hkkrnlo0rjz64012767844.gif
_$ z2 D3 X6 x干点穿针引线的精细活,都不在话下:
. J7 [2 E. b) _ Z8 r
5jay22s54ul64012767944.gif
% `' O' V& |. }+ D
感知域方面,远征A2系列集成了RGBD相机、激光雷达、全景相机等传感器,引入自动驾驶Occupancy感知方案,通过SLAM算法进一步提升环境理解能力。" s; P- s( K! @6 {: t
通信域方面,智元自研了专为具身智能打造的轻量化、高性能通信框架AimRT。) f) T3 v7 y( g7 J& o
相比ROS等第三方中间件,在性能、稳定性、系统部署效率和灵活性均有提升的同时,兼容了ROS/ROS2已有生态。 o: m& I5 v' v: E& Q# }$ G8 X
AimRT还将于9月底开源。" w) l" h! j& R
f4jk4cg324o64012768044.png
& Y; A: t: m; g3 G, V* h
控制域方面,结合Model-based和Learning-based两种算法,智元进一步提升了机器人的运动控制和适应能力。并预研了基于自然语言指令集驱动的、可以适配不同机器人本体的AgentOS,基于强化学习,实现机器人技能的精准编排和高效执行。 w. {: {, U& c& W# R" U8 o" f
tzavmyve5ir64012768144.png
0 l5 J( i6 ]* P
另外,智元还构建了面向开放生态的软件平台AIMA(AI Machine Architecture),覆盖机上、云端和客户端。该平台集成了机器人软件的核心技术,同时提供丰富的二次开发接口。
" H0 C t' o4 _. s具身智能技术演进路线值得关注的是,配合自家商用化进程,智元此番还提出了类似自动驾驶L1-L5的具身智能技术演进路线:9 }- f5 D4 F' p" w
G1至G5(其中“G”指通用人工智能)。/ m& \- n9 b4 T+ E
pk3gieoxc4b64012768244.png
, t3 m/ }" s7 p
其中,G1为传统自动化阶段,机器人基于大量人工编排执行任务,辅以简单视觉,基本不具备泛化能力。9 N: U+ I. s1 t& ]$ q" ?5 L
G2阶段,有了大模型的加持,机器人开始实现一大类场景的快速迁移。
( j$ b, z3 q. a3 ~ j方法是,针对大量不同场景任务,提炼出可复用的原子能力,且以相对通用的方式实现这些能力。/ B Z$ I0 [8 m8 s d
过去一年,智元机器人在G2路线取得了阶段性突破,实现了通用的:位姿估计模型UniPose、抓取模型UniGrasp,力控插拔模型UniPlug等一系列zero-shot和few-shot的通用原子技能。
# G! Y$ [" c J3 c, r* X! t% J
aw5vwd4tkga64012768344.png
6 Q* L) P. V# a, i$ ?+ j; ?不过嘛,以上阶段都还采用了大量手工编排。
$ o: S4 r- D- ^1 n9 O到了G3端到端阶段,机器人训练从算法驱动变成数据驱动。
. C' d/ N* x' N5 v6 u, v此时,由手工设计各类原子能力变为依靠大量数据采集。这一阶段的目标是,形成一套通用技能训练框架。
6 Z$ q! r* w2 ?6 `1 S比如发布会反复提到的“PPT能力”,即抓、放、递……7 j( W& c; A+ N! |
l5fr5n2oh4f64012768444.png
0 _6 j/ U) t6 f稚晖君特意提醒,当前实验表明,端到端是一条具备Scale up潜力的路线。
$ x6 v! k/ S$ s在G3基础上,G4主要实现通用操作大模型。
0 b* L6 F- H2 [ N+ R! j4 y举个例子,比如对于开瓶子、开门把手这两个动作,G3阶段还需要单独采集数据,以训练不同的技能。, S9 s/ ]5 b- v. \! J; N% G
但对人类来说,其实动作的底层逻辑是相通的。
" w* ^4 c) h4 i因此,G4引入了大量跨场景的真实、仿真数据,再加上时间模型等类似技术,让AI理解背后物理原理,从而执行更加复杂的任务。
7 _% a& \( \3 f- [至于最后的终极目标:AGI。对具身智能来说,主要还是能够走出实验室,在开放场景具备跨任务的泛化能力。+ y5 C: Q! E7 f* i# l
从G1到G5,一个显著趋势是:数据需求不断上涨。
4 z! d0 S' Z9 i, u$ M
% i6 Q. \4 l3 ~3 y2 L% v姜青松透露,目前智元已经迈向G3阶段。在G3路线上,智元机器人还形成了一套具身数据方案AIDEA。' ?# T# K$ X% T6 ] d6 u7 O' T
这是因为,“有多少人工就有多少智能,在具身智能领域依然成立”。0 q2 L6 J' c/ l
也就是说,高质量的人机操作数据非常关键。8 {$ j# ^4 W. h) {

- z! h) E+ ~! P/ D具体来说,AIDEA包括数采本体、遥操设备和数据平台。$ f4 Q) o0 |$ l+ _& B5 u2 E
数采本体也就是轮式、足式等类型丰富、可靠稳定的机器人。/ D; r% k3 S& f% {( y0 R" R
遥操设备支持全身映射、臂手协同和高精实时。
- H$ w2 J& H% W& N数据平台覆盖数据采集、数据标注、数据管理、模型训练、模型评测、模型部署再到数据回传的全链路,支持SaaS服务和私有化部署。
0 s1 n9 S" \' O7 {- Y ; z+ [- _1 _; f" U# |
彩蛋是,基于AIDEA的百万条真机、千万条仿真数据,同样开源。今年四季度,感兴趣的小伙伴可以蹲起来了~
7 v1 O8 Q# R& F) I2 S6 B$ _( a“人形机器人人人造”以为介绍完远征系列,智元机器人一年一度亮活大会就结束了吗?
: I7 I. U' n6 f! V并不!( C# N3 C7 M2 h# x' T: @" o! t
稚晖君一声令下,远征A2-W缓缓推上来了一个没它高的神秘黑箱。" h4 t# F% s' H0 o" C: J
有点眼熟,好像是直播最开始,稚晖君指挥A2-Max搬走的那玩意儿:7 M- B" p8 A8 K p5 B* m6 ^
; A* r2 m t a3 f
里面的东西破箱而出,是智元推出的另一款机器人。
1 q; V3 \6 \* U* X2 P0 \灵犀X1。7 v4 c$ \3 a& t" ~# l5 s+ S$ p
诞生于智元X-Lab实验室(也可以简单理解为智元内部的稚晖君实验室),是智元机器人专门面向极致创新和敏捷探索而设立的。
" J w* I, ?: b7 B+ U$ k. m8 y % l4 m7 Y) C8 k# {. \7 s; u5 P
今年6月立项,10个人组团投入其中,不到半个月前刚刚正式降生。1 A+ E1 ?* E( A2 [' y

4 I1 r8 Q/ {2 c, V0 T8 Q& s9 R4 T视频录像显示,灵犀X1身经百摔:: e) X, K! L H6 f

; e4 s6 S+ o, D; Z) ^ z+ t' Z$ U现在已经能做到被大力推攘也不会摔倒了。
# A4 G9 \0 m7 _, h8 [, ~7 L/ S F9 ^: ?" N( e/ t

& N' A7 G, y4 w5 H6 @. u0 q; r9 W4 s) O△来人啊,这里有人霸凌具身小机器人(不是)灵犀X1身高1.3米,体重小于33kg——比起远征系列,灵犀系列看起来更小巧玲珑;它的最大行走速度高于2米/秒,单臂负载大于3kg。
* _/ d' g( M3 Q4 \; O# {$ p据介绍,灵犀X1全身上下都由两款自研PowerFlow关节搭建成,分别命名为PF86和PF52。1 m" m( o; c, t' b! d
这两款PowerFlow对外销售。5 u( A! T% C0 t- G
0 n) W2 ]* C! ]% C/ p
此外,灵犀X1还具备中空走线、输出端绝对值编码、支持PF-Link智能接口等众多功能。6 X( A5 P9 O ]
它融入了模块化设计理念,可以通过简单抱箍形式轻松拆装,尤其是它的两只“手”。8 m: d: h4 l7 w& V
要知道,灵犀X1的标配是智元X-Lab自研的两个“带前馈力控、超低成本”的自适应通用夹爪。 A" I! N T# V0 \% O0 Q
自适应抓握,仅1个主动自由度。
1 _) G1 `' h6 q; x. ]: \4 B
3 Z: ]' x- H8 h& A' n但泛化性很强,抓啥都行。
+ \/ ^5 [. {# c0 P" `8 z- _
) P* h- l" {4 U* H甚至是桌面上平躺着的一根针,也能稳稳夹起来。, v( w( w% G! B. g0 ~6 R

' i' O, A% {2 s9 h+ V, l但灵犀X1的执行器不仅可以是自适应通用夹爪,也可以是百元级成本的六维力传感器,满足不同场景需求的那种。- k6 I! i. g. }4 \6 s

; J# w/ V+ h1 v有点意思的是,灵犀X1可以开启“机机模式”。
+ y! ?1 k6 O7 d6 {" Y% j- ?& a简单来说,就是打开灵犀X1的脑子(里面本来是空的),把手机装进去,用性价比更高、功能更丰富、算力更强、普及率更广的手机,来当它的脑子。
3 [, M# g0 p7 h$ ^# k然后大家就能看到以下这个又好笑又有点诡异的对话画面:
2 Z+ ~/ ` f9 y" I, j0 r) y * g1 I) _, x- M5 y* @/ ~, H* [
此外,灵犀系列还有款机器人:
! \, ~ e* N5 T" |/ ?专业数采机器人X1-W。, \9 W. V2 n3 X6 q! M
和远征系列的A2-W一样,它们都是轮式,然后上半身可上下升降。) O+ z: X; Z4 T, x) ?
不过与采训推一体机器人A2-W相比,X1-W价格更低,适用于只做真实数据采集,服务预训练阶段;而A2-W可服务采集、训练、推理多个流程,不仅对预训练有用,对fine tuning也有用。
' ^- x: ?, I- `) l8 z3 @& A, X不同的应用场景可选用不同的机器人进行采集,搭配满足全栈数据采集需求。* t: I. V8 r; d+ R& s2 e
# q' {0 g1 E, s2 o8 H* K8 _& |! n
最后就是大家都很关心的价格了。" v' ]" l f0 q, t
“友商都很卷,我们不参与价格战。”说完这句话,稚晖君按下手中的PPT遥控器,屏幕上出现了灵犀X1的价格——2 J) n. d: G+ q, B! H& w d5 X
0元。% H* n' r. D$ S
8 Z: c. Z% h3 T* i
他表示,除自研关节外,灵犀X1的本体设计图纸、软件框架、中间件源码、基础运控算法,统统即将开源。
! C. ~; E4 P3 K& a3 A/ P( n主打的就是一个“人形机器人人人造”。3 w3 F/ f# w0 [9 R6 o8 q9 {

1 @2 U* m) q1 l( ?3 L# [! y稚晖君也现场给他的X-Lab打了波招聘广告,“欢迎有想法的年轻人加入智元,加入X-Lab”。$ h# W8 e, M4 P9 g9 _) y) J& I
; g& `7 ^5 F9 A3 |8 {0 k
One More Thing最后,咱再来简单正式介绍一下智元机器人(AgiBot)。
0 d1 O( i- [, G5 c% ~ R" i, |它成立于2023年2月,致力于AI+机器人的融合创新,以及打造具身智能机器人产品和应用生态。
! _( b3 M. [* _2 t. V7 {创始团队包括稚晖君(彭志辉),电子科大毕业后,先后在OPPO研究院、华为工作(以华为天才少年身份入职)。同时,他也是B站up主,自称野生钢铁侠。( g( X& H) X2 |9 ^4 N* K* d+ y% a s

5 o/ U& {' I9 {8 h% d' C" P+ @同为创始人的,还有上海人工智能研究院智慧康养首席科学家、上海交通大学机械与动力工程学院教授闫维新。& p+ p# K' Z+ R# v9 Q, q( q' f
去年8月,智元机器人推出首款产品:
6 N& w! F; v+ d, A通用型具身智能机器人原型机,远征系列的A1。
& r0 k. T1 B+ s( [9 i1 ~# l 9 t, ]# R' L& q4 W$ f
今天,属于是智元机器人第二次大张旗鼓地对外展示研发和产品进展。0 m9 A7 r6 o9 ~5 F1 o
截止到目前,智元机器人已完成了A4轮等多轮融资。
` p7 J( J3 U; N0 e3 [/ U8 g智元官方还透露:
`& J+ G* m, z x" Z9 y今年,智元机器人预估发货量达到300台左右,其中双足200台左右,轮式100台左右。
* f$ F5 w. E/ a4 Y6 J9 l A. g( Y7 b我是老温,一名热爱学习的嵌入式工程师7 S9 ]% i6 v0 a) u0 |
关注我,一起变得更加优秀! |
|