正在阅读:

拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶

扫一扫下载界面新闻APP

拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶

人形机器人的“肉身困局”。

文|硅谷101

6月1日,宇树科技科创板IPO申请成功通过了上交所上市审核委员会审议。而就在不久前,宇树还发布了首款载人变形机甲。我们离机器人真正落地还有多远?

去年春晚,机器人还在转手绢、扭秧歌,今年就直接进阶到了高难度的空翻、武术。如今,甚至连手机厂商造的机器人,都能在半马上都打破人类记录了。为什么机器人本体这两年的进化能够如此之快?

为了进一步理解机器人的本体进化,我们走访了一些头部机器人企业,也和一些业内人士聊了聊:造机器人究竟有什么难点?机器人的制造门槛真的不高吗?机器人公司的护城河又究竟是什么呢?

这篇文章我们将详细拆解机器人身上的各个零件,相信完整看完之后,你也能自己拼出一台机器人。

01 骨架材料:轻量化与抗冲击的平衡 

机器人身上硬件种类繁多,我们可以粗略地划分为4个系统:撑起整个结构的骨架、驱动骨架运动的关节、感知环境的传感器、指挥身体的电气与计算系统。我们先从骨架开始说起。如果一辆车以时速60公里撞向一个假人,由于巨大的冲击力,假人会飞出去,摔的七零八碎。而对人形机器人来说,承受这样的冲击力,已经成为了“日常”。

王闯

智元合伙人/高级副总裁/通用业务部总裁

机器人它每一次空翻触地,身上承受的加速度有几十个g,可能都比汽车和航天都要高,跟汽车撞到墙的加速度差不多。

这就对机器人的结构材料提出了挑战:要翻起来就得身体足够轻,承受如此大的冲击力还得强度大,否则可能一个空翻,零件就飞出来了。所以机器人的第一项挑战就是探索骨架材料。

世界上第一台全尺寸机器人WABOT-1,就是以钢材为主,体重达到了大约160公斤,可能它跳一下就得把地板砸个坑,就更别说翻跟头了。

后来,从本田的ASIMO、波士顿动力的早期液压版Atlas,到第一代特斯拉Optimus,铝合金成了主流,密度只有钢的三分之一。

现在行业已经开始探索更多材料,比如镁合金,它的密度比铝还低了三分之一,局部还会使用强度更高的钛合金,例如经常需要承受冲击的膝关节、脚踝等。

有意思的是,这些坚硬的骨架为机器人扛下了冲击,但供应商似乎赚的只是个“辛苦费”。

某机器人公司前采购总监

骨架最后的卖价,除掉本身金属的含量,再除掉抛掉的废料以外,ratio(比率)其实很低很低了。骨架最后还是卖金属费用+加工费用,大部分成本还是里面的metal(金属),没有办法降价了。它的加工费还是在合理区间的,如果量起来的之后,它的加工费就会趋近于很低,因为它没有什么太大门槛。

除了这些核心的骨架外,机器人的外观件,可以分为两类:

一类是装饰保护件,主要用在胸部、背部、头部,材料从塑料、仿皮TPU到织物,五花八门,主要是为了降低磨损、让触感更亲人。虽然有些机器人看上去是金属机身,实际上是塑料外壳做了一层金属喷漆。

另一类就是让机器人像真人的仿生皮肤,这些皮肤不仅触感要像人,还得在皮下植入触觉传感器。

在骨架和皮肤之外,真正让机器人实现各种超难度动作的,是关节,这也是整个机器人硬件里成本最高、技术最密集、故事也最多的部分。

02 拆解执行器:关节是最贵也最难的部分 

大家肯定看过不少机器人跳舞、空翻的视频,这是先通过真人动作捕捉,再训练模型后映射到肢体动作上。

几年前,我们看波士顿动力的Atlas后空翻时,还觉得非常惊讶,但现在可能大家都觉得习以为常了,这背后的原因就在于,机器人的关节经历了从液压系统到电机的转变。

王闯

智元合伙人/高级副总裁/通用业务部总裁

以前我们造不出这么牛的关节,那时候的关节整个性能都很差,空翻是很难翻的起来的,最近这一两年关节的技术进步非常非常大。

关节在业内被称为执行器,主要分为旋转执行器与直线执行器,我们先以肩膀来举例,看看它们是怎么带动身体运动的。

肩膀有三个自由度:前后摆、上下抬、内外旋,被称为俯仰(pitch)、滚转(roll)、偏航(yaw),本质上这些运动方式都是旋转,所以通过三个旋转执行器的组合,手臂就能向X、Y、Z三个方向自由活动了。

到了膝关节上,一般只需要一个自由度,所以用一个旋转执行器或者直线执行器就可以了,直线执行器就像人体的肌肉一样,通过拉伸来带动上下的骨干运动。

而做一次极限动作,得靠全身几十个执行器紧密协同,任何一个地方反应没跟上,或者力量偏差了一点,后果就是摔倒。

这些执行器里面是什么结构呢?旋转执行器与直线执行器都有一套伺服系统,由电机、编码器、驱动器、传感器组成,两者最大的区别就在于,旋转执行器是伺服电机加减速器,而直线执行器是伺服电机加丝杠。

我们先从减速器开始说起。

Chapter 2.1 旋转执行器与减速器

或许你听过这个装置,第一个齿轮转动10圈,第二个齿轮只转1圈,第三个则只有0.1圈,总共100个齿轮,以此类推,如果要让最后的齿轮转一圈,那么第一个需要转古戈尔(Googol)圈,也就是1的后面有100个0,所需能量超过了整个宇宙的能量总和。

这就是一个大型减速器,本质上是个巨大的杠杆,牺牲速度,换取力量。为什么机器人的关节需要减速器呢?

因为电机天生是“高转速、低扭矩”:转速可以轻松达到每分钟上万转,但输出的力矩却比较小。而机器人的关节需要精准控制,我们很难让电机只转几度的同时,还能搬动非常重的东西,所以需要减速来降低转数,提高扭矩,减速比(也就是齿轮比值)越大,速度降低越多,同时输出扭矩越高。

行业最常用的有三种减速器:行星减速器、谐波减速器、RV减速器。我们用模型来给大家解释下。

首先是行星减速器,它的名字很形象:电机连接中心齿轮,带动三个行星轮,行星轮再带动外圈的大齿轮旋转,就像行星围绕太阳一样。它结构小,成本低,但减速比较小,同样的电机转数下,输出扭矩较低,因此常用在手部关节。

需要输出更大的力时,就会用到谐波减速器了。它的最中心是波发生器,将夹层的柔轮撑成椭圆形,一般柔轮与外侧固定的钢轮之间只相差2齿,柔轮只有两个对称区域与刚轮啮合,这样最中心的波发生器旋转一周时,柔轮只转动了2齿,所以减速比可以做到非常大。

谐波减速器的输出扭矩强,且精度高,常用在机器人的肘关节、肩关节,来实现手臂的精准控制。

前文中提到,机器人后空翻时,承受的力相当于汽车撞击,这也对特定部位的减速器提出了很大挑战,但谐波减速器的柔性结构也意味着抗冲击力较差,这时就得用上RV减速器了。

RV减速器由第一级行星齿轮和第二级摆线针轮组成,第一级降速后,通过偏心凸轮带动摆线盘做偏心运动,摆线盘与外壳上的针齿啮合,推动外壳旋转。

这样一来不仅减速比大,由于摆线盘有多个齿同时啮合,所以刚性好、抗冲击更强,常用在机器人的髋关节、膝关节、腰部等需要抗冲击的部位。

减速器是非常精密部件的,加工难度高,而且面对长期的磨损,也很难保证稳定性,这是整个关节里最难的部分。

王闯

智元合伙人/高级副总裁/通用业务部总裁

当大批量地制造、使用的时候,齿轮的精度以及长时间运行的稳定性要求就很高。比如说用了1000个小时,它就发生了各种各样的异响,或者性能就下降了,这个时候运控的算法可能很难去调整,表现在机器人上就是可能走路没有以前那么好了,甚至开始走得逐渐变歪了。

机器人可能要做很多极限的动作,自己也会摔倒,这些冲击很有可能会损伤里面的这些小的齿轮。我们如何能做出性能又很好、成本又很低、长时间使用又没问题,同时摔倒之后它又能抗得了冲击、不会轻易的损坏的齿轮,这是一个非常有挑战的不可能三角。

换句话说,造一个减速器不难,难的是造出一万个性能一致、耐用的减速器。

Chapter 2.2 直线执行器与丝杠

接下来我们看看直线执行器和它的核心部件——丝杠。

直线执行器可以说是最像人体肌肉的,当我们的手臂这样摆动时,并不是关节在主动旋转,而是连接两端骨骼的肌肉在收缩。所以直线执行器只做一种运动,那就是推拉。

有些机器人的膝关节,会采用直线执行器,通过推拉来模仿人类膝部肌肉的运动。当有多个直线执行器通过特定的结构组合后,还能实现关节的旋转。这样的运动方式会被应用到手腕、脚踝等部位。

要做出直线执行器,最简单的就是液压装置,之前波士顿动力的老版Atlas就是以直线液压缸为主,具有高爆发、抗冲击、功率密度大等优势。为什么是老版呢?因为新版他们也转向了电机驱动,主要是液压装置系统复杂,容易漏油,而且控制精度不如电机。

但电机只能旋转,要输出直线运动,还需要一个“转换器”,也就是丝杠。

丝杠轴上有螺纹,旋转时会带动螺母做直线运动,这个过程就像拧螺丝。为了减小摩擦,丝杠内部会加入滚珠,这就是滚珠丝杠。有的会将滚珠换成了滚柱,寿命更长、承载更高、刚性更好,这就是行星滚柱丝杠。此外还有的还会用到T型丝杠。

王闯

智元合伙人/高级副总裁/通用业务部总裁

现在用的可能比较多的就是滚柱丝杠,它对加工精度要求非常非常高,而且在一个很长的行程内,你的一致性要非常好,如果中间有一些不好的,它对于不同机器之间的控制算法就是一个很大的挑战。

有的直线执行器中也会配合上减速器,让电机输出更高扭矩。但目前行业中,直线执行器的应用比较少,主要有三个原因:动态性能差、制造难、成本高。

王闯

智元合伙人/高级副总裁/通用业务部总裁

目前整个行业量产最多的就是旋转关节。直线执行器在行业内也有一些应用,它的特点是载荷能做到更大,而且在一些状态下,如果不供电,也是能保持一个稳定的姿态,是能够自锁的。但是我们觉得它的缺点就是动态性能可能会稍微差一点,因为它的载荷大、减速比大,但动态性能差,所以没有那么敏捷的动作。还有一个比较大的难点是很难大批量地、低成本地制造,所以在当前,我们觉得还不适合做大规模的商业化。因为大家现在用的少,出货量也少,在客户场景中验证的也少,所以它整个成本都是现在居高不下的。

说完传动,我们再来说说动力本身,也就是电机与伺服系统。

Chapter 2.3 电机与伺服系统

机器人身体中的常用的电机是无框力矩电机,相比传统电机,它没有了外壳和轴承,只保留了最核心的部件,这样做是为了尽可能缩小尺寸,可以直接嵌入关节内部。

灵巧手比较特殊,用的是体积更小的空心杯电机,当然输出功率也就没那么高了。灵巧手的难度甚至比整个机器人本体还高。

身体电机的难点主要在于三块:能效与散热、体积和性能稳定性。我们先来说下能效与散热。

电子产品都会不可避免的产生热量,当热量积压过多,超过了正常工作区间后,性能就会下降,所以电机的能效,也就是真正有多少能量被用在做功上,就格外重要,一旦过热,控制系统就只能降低功率,比如空翻到一半时,突然“腿软”了,就会啪一下倒地上。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我们以前做的最早期的样品,可能10分钟之内,这些极限动作只能做一次。它的转速、转矩这些性能曲线做一次之后整个就变掉了,也有可能因为里面发热之类的原因,这个时候就需要先把它技能冷却一下,让它温度降下来之后才能继续做。再一个比较大的问题是它的能效,就是输入一定的能量有多少转化为了热量,比如说是5%,那就和3%就有巨大的差异。这些都会限制性能,哪怕我硬件能力再强,我都不敢再往上去抬性能了。

3%和5%之间看着也许没多大差别,但需要注意的是,电机的发热不是线性的。

当关节要做一次极限动作,瞬时电流可能是平时的3~5倍,发热量就是额定状态的9~25倍。这意味着热量的积累速度,远超关节被动散热的能力上限。做一次空翻,关节温度可能就从温升10度直接跳到50度。所以做完后电机需要冷却,机器人才能继续下一个动作。

要提升电机的能效,就得从电机材料、绕线工艺、结构设计上来下手,这里我们就不详细说明了。

目前很多关节的散热主要靠被动,因为机身采用了大量金属,可以想象成巨大的散热片,只有在功率非常大的关节才会额外加入风冷或液冷散热,比如腿部。

而且额外加入散热措施会带来第二个挑战,那就是体积限制。

工程师们正在想方设法尽可能缩小关节电机,一方面是为了减轻重量、降低成本,更重要的是体积越大,转动惯量也更大,改变运动状态就更难。

打个比方,当你旋转一根绳子的时候,绳子越短,转速就会更快,如果绳子变长了,转速不仅会变慢,当你想停下来时,需要的缓冲时间也会更长。

第三个难点是性能是否稳定,也就是在电机在输入多少电流时,转数是多少、能输出多大扭矩,业内称为TN曲线。这就会影响机器人的控制算法。

比如走过一段不平整的路面时,脚踝上的六维力矩传感器感受到了起伏,为了维持平衡,就需要动态调整电流,来控制电机扭矩。如果TN曲线不稳定,可能控制系统下达的还是同样的命令,但电机输出扭矩产生偏差,结果就是摔倒。

而且TN曲线还对算法的训练有着很大影响,因为机器人算法是先在仿真系统中训练,如果仿真系统中的TN曲线和现实相差太大,那实际表现也会产生偏差。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我会输入给仿真系统一个曲线,实际中这个电机能达到甚至超越这个曲线,那它想要达到的性能、想做的动作就能做到。如果反过来在低转速下ok,但是转速一高它性能就下来了,这个时候就肯定有一些极限动作就做不了,因为有一些最难的动作,要求你在极高的速度下,又有极高的爆发力。

要精确控制电机转数,还需要一套伺服系统,主要由编码器、驱动器、传感器组成。

编码器用来测量电机转子的角度、速度、位置,让系统知道电机当前在什么状态。

王闯

智元合伙人/高级副总裁/通用业务部总裁

编码器其实很关键,机器人里面因为有减速器,所以必须用双编码器,才能知道输入端和输出端两个的位置都在哪里,才能更精确的控制。

驱动器会根据编码器的反馈,以及来自“小脑”的控制指令,调整给电机的电压、电流。

传感器的种类比较多,比如力矩传感器测输出扭矩,温度传感器测电机温度、防止过热等等。

以上就是执行器里的关键部件,接下来我们再说说执行器的整体,为什么它是降本的关键?自研和采购有多大区别呢?

Chapter 2.4 研发路径与成本

根据美国银行的测算,执行器是机器人身上成本最高的部件,约占51%。

某机器人公司前采购总监

无论是手或是电机,motor(电机)和control(控制器),也就是你的肌肉(执行器)是比你的骨骼、比你的眼睛(传感器)、脑子(芯片),包括你的心脏(电池)都是要贵的。

所以执行器是未来量产降本的关键,最主要的因素就在于,中国供应链实在太卷了,此前不少需要其他国家工厂精加工的部件,现在国内都能找到替代。

比如做电机的卧龙电驱、做减速器的绿的谐波、双环传动、中大力德等等,甚至还有公司直接可以提供完整的执行器,比如三花智控、拓普等。

既然市面上可以买到现成的执行器,机器人公司为啥还要费时费力自己研发呢?我们对比下这两种模式。

如果采购成品,可以降低研发成本,提升开发效率,但相应的物料成本会更高,难以根据自己的需求去定制,性能也会有所不足。

王闯

智元合伙人/高级副总裁/通用业务部总裁

大部分(执行器)公司不会给你专门去设计你想要的东西,它卖给你的都是标准件,成本相对来说也比较高。如果一个公司它本身本体的团队人又少,关节的积累也不够,肯定是去买别人的会更好一点,会更快速地能把这个东西做出来。

如果自研的话,能更好的匹配需求和算法,性能更强,但相应地需要付出大量研发精力。

选择哪种路径更多的是公司规模与成本的考量,根据我们的调查,目前头部的机器人公司更多还是偏向自研,甚至会进驻供应商那边参与设计。

所以机器人的关节不仅仅是把零件装在一起,而是要在极小的体积内,实现力量、精度、耐久、成本、重量的平衡,可以说是整个身体中最难的部分,原因在于这是一个新兴的产业,此前供应链并不成熟,大家都是在探索阶段。

王闯

智元合伙人/高级副总裁/通用业务部总裁

(初期)很多的产线的设备都是行业内没有的,我们自己还要去设计(生产)设备。

光有强健的关节还不够,机器人又该怎么知道怎么站稳?如何感知世界?接下来我们聊聊传感器。

03 视觉系统:机器人如何感知世界 

Chapter 3.1 惯性测量单元(前庭)

现在的机器人在大部分情况下,不论人类怎么干预都很难摔倒。要实现这样的平衡,在硬件上得依靠身体中的各个传感器。

一方面是前面提到的电机伺服系统,它通过关节里的编码器和力矩传感器,实时感知每个关节的当前位置和受力情况,然后以每秒上千次的频率调整输出。

另一方面,光有“四肢的感觉”还不够,就像人类还需要靠内耳的前庭系统,来感知身体的倾斜与旋转,在机器人身上,这个部位就是惯性测量单元(IMU)。

IMU非常常见,比如当你把手机旋转时,画面也跟着旋转,就是靠IMU。

IMU是几个传感器的组合,最核心是两样东西:一个是加速度计,测量XYZ三轴的加速度,另一个是陀螺仪,测量俯仰、偏航、滚转三个轴的角速度。此外IMU还会加入磁力计,相当于是电子罗盘,用于校准。

把这几个数据融合起来,IMU就能实时感知机器人的运动状态,当我们踹他一脚时,身体会瞬间获得一个加速度,同时还会前后左右倒,IMU检测到这个变化后,会将数据传给“小脑”,计算出需要给各个关节增减多少扭矩,然后将身体拉回来。这个部件在手机、汽车等地方用得很多,所以技术和应用也相对成熟。

防摔倒靠的是IMU,而对日常行动来说,更重要的是防碰撞,避障最依赖的就是视觉系统。

Chapter 3.2 摄像头与激光雷达(眼睛)

机器人的“眼睛”,和汽车的自动驾驶非常像,但又不完全一样。常见方案是摄像头 + 激光雷达 + 毫米波雷达多传感器融合。其中的例外就是特斯拉Optimus,众所周知马斯克是坚定的纯视觉党,只用摄像头。

在传感器的使用上,机器人几乎和汽车一样,许多供应商也都是从汽车供应链上迁移而来。不过虽然都是同一种传感器,但实际的规格大不相同,我们以比较贵的激光雷达来举例。

首先是测距要求不同。汽车要跑高速,激光雷达需要看到150-200米外的障碍物。机器人主要在室内活动,10~20米就够了。测距短了,意味着激光雷达的功率、体积、成本也可以更低。

第二是点云密度和扫描方式不同。汽车识别的是车、人、路障,这些都是大物体,点云密度可以低一些,但机器人需要在桌子上拿起螺丝刀、在地上捡起硬币,这些都是小物体,所以需要更高密度的点云。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我们是希望点云要非常的密,像我们现在用的是非重复扫描,就是你在原地站一会之后,它的点云就会变得更密。这个对我们来说是非常好的,因为我们机器人很多时候并不是那么激烈地在做操作,它像人一样,人做很多事情都是慢慢地去做的,而汽车对稳定性、实时性以及重复性的要求非常高。

第三是安装位置和体积不同。车可以把激光雷达装在车顶、保险杠上,体积大一点没关系,但机器人身体较小,就必须使用更小的模组。

第四是可靠性要求不同。比如汽车常年在室外,对工作温度要求更高;而机器人受到的冲击力更大,对抗震性要求更高。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我以前做车规的话,激光雷达最低的要求是-40度到85度,但在机器人上,至少现在是完全是不需要的。所以汽车上有很多专门为可靠性做的设计,在机器人看来就是冗余的。汽车出车祸的时候,可能加速度才能达到机器人日常做一次空翻的加速度,所以我们对这些震动状态下的稳定性的要求非常高。

虽然汽车的激光雷达已经非常成熟了,但机器人的激光雷达还处于行业早期状态。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我们希望体积变得更小、点云更密、望距离短一点但是FOV(视场角)大一点,这些需求其实都是还没有被满足的。

在摄像头上,根据前特斯拉人工智能硬件负责人的透露,它们选择了车规摄像头,但内部研发时的路径也一再变化。

刘向科(Kerry)

前特斯拉人工智能硬件负责人

目前的方案应该是基于车上的摄像头, 是500万像素。早期最早的方案是堆了很多摄像头的,像素都是有区别的,把帧率降低,把像素提高。为什么这么做,是因为当时Elon提了个要求,希望机器人能够做到穿针引线,当时我们算了,要做到这个要求,必须得要有超过1500万像素,才能看得见这个事情。

也是因为软件团队表示,这个事情如果要是连像素、摄像头都变了的话,对于重新训练这个模型的要求、时间的要求、还有工作量就都会大太多了。 做不到怎么办呢?就考虑在摄像头上加自动对焦。但后来好像又说这个事情,也未必是一定需要的,所以反正就是一直在变。

Chapter 3.3 触觉

接下来我们说说触觉,要实现触觉,主要分4种途径:

最常见的是压阻式,通过将压力转化为电阻,来改变电流信号,比如电子秤会用到。

第二种是电容式,用弹性介质隔开上下两层,当施加压力时电极距离变小,电容值发生变化。

第三种是压电式,只要材料受力,就会直接产生电压,比如打火机里放电的小玩意。

第四种是光学式,表面有弹性材料,受力后产生形变,由摄像头来捕捉,这是目前最热门的方式。

触觉最好是三维的,不仅可以感受到压力,还能感受到平面上的摩擦。比如当我们拿起可乐时,手会捏紧瓶子,向上抬起,如果手指感受到瓶子有下滑的摩擦力时,会加大捏的力度避免滑落。

但这也对材料和算法提出了很大的挑战。

王闯

智元合伙人/高级副总裁/通用业务部总裁

第一就是在传感器本身的层面,因为它其实本质上都是材料,任何的材料都很难在三个(XYZ)方向上很好的解耦开,所以精度就变得比一维的力难很多,怎么能把它弄准?其次是,这些三维的触觉这么复杂的数据,怎么跟操作模型结合起来,这也是非常难的,因为现在整个数据的量都非常少。

在这些挑战下,此前行业中的量产机器人,几乎不怎么搭载触觉。

王闯

智元合伙人/高级副总裁/通用业务部总裁

在整个2025年量产的产品里面,触觉用的非常少,几乎就没有,不只是我们,就整个行业都用的很少,因为这个东西不稳定。

需要考虑它长期抓东西的时候怎么能不变形,因为它稍微变形一点,可能输出的信号就完全不一样了。还有就是,不要发生性能的漂移,形状、位置这些都不能发生破损,材料又要稍微柔软一些,又要很耐磨,这本身也是很矛盾的事情。

但到了今年,情况似乎有点变化。我们的采访嘉宾表示,到了2026年,看到了规模化生产的希望,接下来就是如何在数据采集、训练中,让触觉系统更好的结合了。整体来说,触觉这个行业还非常早期,我们也期待看到未来更多进步。

除了前面提到的这些传感器外,机器人身上还需要温度、湿度、六维力矩传感器、UWB等等,这些都比较成熟,我们就不多赘述了。

传感器让机器人能感知世界,关节赋予了机器人活动的能力,但要让这两者结合,还需要一个“中枢”,接下来我们聊聊这个中枢——电气架构。

04 电气与计算:芯片整合与线束轻量化 

Chapter 4.1 芯片(大脑与小脑)

我们在之前讲机器人算法的文章中提到过,业界发展出了“System 1+System 2”这样的双系统架构,System 1负责操控四肢,System 2做复杂思考,在芯片上,也采用了“小脑+大脑”这样的组合。

为什么不用一个芯片干所有事?因为需求完全相反。

大脑芯片要思考“该怎么做事”,需要的是高算力、大内存,最好能在端侧跑大模型,延迟个几秒基本没啥影响。

目前绝大多数机器人大脑选用的是英伟达的Orin芯片,2025年英伟达还推出了性能更高、专为机器人和物理AI设计的Thor芯片,预计将成为未来主流。

特斯拉Optimus例外,它用的是自研的芯片,而且还是双芯片。

刘向科(Kerry)

前特斯拉人工智能硬件负责人

机器人因为不是自动驾驶,没有这种安全考量,Elon自己觉得,他说:不需要这个安全冗余的问题了,一个芯片就够了。做一个单芯片系统之后,他后来他一想不对,机器人的世界模型对算力的需求,是远高于自动驾驶的。自动驾驶两个都够呛,那机器人怎么可能一个能够?他自己又反应过来说:不对不对,改回两个芯片。

另外今年初的CES上,高通也发布了机器人大脑芯片Dragonwing IQ10,并且宣布了与Figure的合作。

而小脑芯片要“操控身体”,不需要特别高的算力,但实时性、稳定性、响应速度必须高,一旦延迟个几毫秒可能就会摔倒。

例如机器人空翻、跳舞时,基本是用提前录好的动作,但我们会发现它的脚还是会有一些碎步,这就是小脑在动态调节平衡,就像人类的“本能反应”一样。

王闯

智元合伙人/高级副总裁/通用业务部总裁

小脑它要求速度非常快,所以小脑里面的频率可能是1K赫兹。

目前小脑芯片通常是MCU,主流选择是意法半导体的STM32系列、恩智浦的i.MX RT系列、瑞萨的RZ系列等。

现在我们也看到了一个新趋势,行业正在试图将大脑和小脑芯片整合在一起。这方面特斯拉比较前沿,一开始走的就是这条路线。

刘向科(Kerry)

前特斯拉人工智能硬件负责人

我们就先默认当时是用Hardware 4这个电脑的自研芯片。特斯拉的大脑小脑集中在同一个芯片上面,如何通过这一个芯片,用一个什么样的通讯架构来控制整身的行动?当时我们也是花了一些时间研究这种方案,一个SOC里面既有算力的ASIC,也有一个多核的CPU,这个多核的CPU可以用来处理小脑这些东西,这个频率很高的CPU的延迟也非常的低。

除了特斯拉外,也有其他公司在研究集成方案。

比如灵境智源在今年3月发布了德沃夏克架构,在一块芯片上集成了“大脑-小脑-皮层”三个功能。那统一成一块芯片,会带来哪些好处呢?

王闯

智元合伙人/高级副总裁/通用业务部总裁

首先我觉得最大的一个优势就是,因为现在做成一块板了,整个胸腔的体积和走线都会变得很简洁。然后其次是大脑和小脑,越往后,它之间的协调就越重要,举个例子,有人向你扔了一支飞镖,你去看以及预测飞镖的轨迹,这些东西可能都是用大脑,但是你手伸出去抓到它,这个是小脑,这两个东西之间通讯越快,越有利于完成非常高难度的动作。如果大脑、小脑做在一起的话,芯片之间的通讯会非常非常快,可能大脑能够实时的去控制小脑怎么动,并以非常高的速度去反馈。

不过根据行业内的看法,统一大小脑芯片还处于非常早期的阶段,需要等机器人出货足够多、市场足够大之后,机器人公司才会像现在的智能汽车公司一样,逐渐转向一体化的自研芯片。

Chapter 4.2 电池与线束(心脏、神经、血管)

最后,还需要为全身提供能量的电池,就像机器人的心脏。核心需求是如何在更小的密度下,容量做到更高,主要供应商有宁德时代、LG、亿纬锂能等,

还有遍布全身的线束,就像神经与血管,用于设备之间的通信与供电。主要供应商有立讯精密、TE Connectivity、Amphenol等。

关于机器人的供应链种类繁多,我们就不一一介绍了,在这里放一张全景图,大家有兴趣可以放大研究。

看到这里,相信你已经学会了怎么造一台机器人,但先别急,如果你真的自己去做了,会发现哪哪都是问题,因为造机器人最大的难点,其实是各个工程之间的平衡。

最后我们再来聊聊,组装与量产的难题,以及这两年机器人突飞猛进的原因。

05 组装与量产:能动不等于好用 

如果你看过前段时间的机器人马拉松,会发现现场有不少趣事。

有的随地大小坐,引来隔壁机器人拍手叫好;有的跑着跑着脚崴了、喝醉了、胳膊掉了、冲上绿化带了,或者被减速带绊倒后“粉身碎骨”了。

当然也有表现非常亮眼的,比如荣耀的机器人,不仅包揽了前六名,还刷新了人类的半马记录。

不过这也引发了一些讨论:连手机厂商做机器人都能表现这么好,是不是意味着这行业没什么门槛呢?

Chapter 5.1 组装

业内人士的回答是:Yes,and,No。我们先说Yes的部分。

前文我们提到的各个零部件,供应商和手机、汽车行业高度重合,再往上,算法也有部分能和自动驾驶复用,这也是为什么荣耀、小米、特斯拉、小鹏会下场做机器人的原因。

某机器人公司前采购总监

Electrical & Power system(电气与计算)部分的供应商重合度能达到90%多,mechanical system(骨架结构)部分就算模具不一样,供应商也有很多类似的。电驱这一块是唯一可能和车相关性没有那么高的,因为车里面不需要有类似提供太多扭矩的东西。但是减速器、齿轮等零件在汽车里有非常多,包括sensor(传感器)也是。所以基本上80%以上的东西是可以同质的。

理论上,只要你认识这些供应商,就能自己搓出一台机器人。但“能动”和“好用”之间,却隔着一道巨大的鸿沟,这就是No的部分。

比如组装后重量分布不均,机器人的重心就偏,走路时为了保持平衡,某些关节要额外出力,功耗增加,续航减少,甚至影响步态稳定性。

又或者在实验室里跑1小时没问题,但放到真实环境跑100小时,各种毛病就出来了:比如某个螺丝松了、某根线磨损了、某个关节的润滑脂干了、某个传感器开始漂移了,这些都必须经过不断调试,才能找到平衡点。

某机器人公司前采购总监

每一个零部件,我把它拆成每个供应商,我觉得供应商的难度都不高的,我觉得最后是系统整合才是,比较难的东西。

更多是说你给了它上了constraint(约束),比方说你要把这个东西减重、轻量化做到什么(程度),但是你以人形把它框住了之后,它的力矩的大小以及它的精密度上,都要达到人类的高度,这才是难点,更多的是工程路径上的trade off(权衡)。

王闯

智元合伙人/高级副总裁/通用业务部总裁

往往市面上买到的标品,都是不能让人满意的,都离我们真正算法应用的要求来说有差距的,所以这些都是核心零部件,我们要自己动手去做。

Chapter 5.2 量产

要做出可商业化、能量产的机器人,还会面临一致性的问题。

因为每台的关节背隙、传感器零点、电机参数都不一样,要让同一套算法能稳定应用在不同批次的本体上,还需要对各个细节做调整。

王闯

智元合伙人/高级副总裁/通用业务部总裁

你放10个机器人在那,给它发同样的参数(指令),它的手伸出去的位置是不一样的。

如果做操作,可能差个几毫米,就从能抓住它变成了把它撞倒,这时候怎么把所有机器人的传感器和执行器的标定方案做好,就非常难。还有在标定完了之后,能不能保证,在使用一年之后,它很多地方老化了、传感器也有畸变了的情况下,它还能保持稳定,这个时候可能还需要一些在线的标定,就是自己能把误差分析出来。这些东西都是看不见的功夫,但是如果不做的话,后面很多问题都解决不了。

所以真正的难点不是“拼起来”,而是系统级的整合。

我们回到机器人马拉松,今年不仅速度进步了不少,整体的完成度也提升了,再看这两年机器人动作的进化,从走路,到转手绢,再到跳舞、武术,为什么这两年进化如此快呢?最重要的原因就在于供应链的成熟。

王闯

智元合伙人/高级副总裁/通用业务部总裁

在过去一两年,机器人行业还不像现在这么的被大家看好,那时候大家不会为机器人去做激光雷达,大家只会说我这个是为物流车做的,你拿来直接用吧。那个时候是求着别人的,大家对机器人都是将信将疑的。

正如我们前面说的,机器人产业链很多环节都和汽车重合,此前对供应商来说,存在内部资源博弈的问题:在产量有限的情况下,是优先供给商业化成熟的行业?还是修改产线,去押注商业市场尚未成熟的机器人?

某机器人公司前采购总监

以前市场我觉得还没有到这个级别,跟真的跑量的手机、汽车等等还可能差一到两个数量级。所以供应商也是在博弈,因为它内部资源也有限。

现在随着机器人赛道越来越热,供应商开始愿意为机器人专门开模、定制产品,相信随着需求越来越大、商业化路径更加明确,供应链还会像滚雪球一样成长。

那下一个里程碑的动作,会是什么呢?

06 下一个里程碑:从空翻到接住一片落叶 

王闯

智元合伙人/高级副总裁/通用业务部总裁

我前几天去了上海马戏城,我看了一场表演之后,我的感觉就是,机器人里还要进步的东西太多太多了。

那个蒙着眼睛在几十米高空走钢丝的演员,那个用一根筷子让几十只碗同时旋转的杂技师,他们展示的,是人类用了上百万年才进化出的东西:极致的感知、本能级的平衡、毫厘之间的触觉反馈。

虽然现在机器人能空翻、能武术,但它依然离人类遥远。

我问王闯,对机器人的下一个里程碑时刻是什么期待,他的回答其实有点让我惊讶。他的答案,不是什么更复杂更fancy的动作,而是一个非常非常基础、具备人类“感控融合”本能的“接住一片落叶”。

王闯

智元合伙人/高级副总裁/通用业务部总裁

有一片树叶,我能走过去,手伸起来正好就捏到那片树叶。

仅仅是一阵风飘过,穿过一片树林,而“它”走过去,伸出手,“恰好”接住了一片落叶。 这一天到来的时候,机器人距离我们的生活,又近了一大步。

本文为转载内容,授权事宜请联系原著作权人。

评论

暂无评论哦,快来评价一下吧!

下载界面新闻

微信公众号

微博

拆解机器人“肉身”、量产与供应链:空翻之后,它还要学会接住一片落叶

人形机器人的“肉身困局”。

文|硅谷101

6月1日,宇树科技科创板IPO申请成功通过了上交所上市审核委员会审议。而就在不久前,宇树还发布了首款载人变形机甲。我们离机器人真正落地还有多远?

去年春晚,机器人还在转手绢、扭秧歌,今年就直接进阶到了高难度的空翻、武术。如今,甚至连手机厂商造的机器人,都能在半马上都打破人类记录了。为什么机器人本体这两年的进化能够如此之快?

为了进一步理解机器人的本体进化,我们走访了一些头部机器人企业,也和一些业内人士聊了聊:造机器人究竟有什么难点?机器人的制造门槛真的不高吗?机器人公司的护城河又究竟是什么呢?

这篇文章我们将详细拆解机器人身上的各个零件,相信完整看完之后,你也能自己拼出一台机器人。

01 骨架材料:轻量化与抗冲击的平衡 

机器人身上硬件种类繁多,我们可以粗略地划分为4个系统:撑起整个结构的骨架、驱动骨架运动的关节、感知环境的传感器、指挥身体的电气与计算系统。我们先从骨架开始说起。如果一辆车以时速60公里撞向一个假人,由于巨大的冲击力,假人会飞出去,摔的七零八碎。而对人形机器人来说,承受这样的冲击力,已经成为了“日常”。

王闯

智元合伙人/高级副总裁/通用业务部总裁

机器人它每一次空翻触地,身上承受的加速度有几十个g,可能都比汽车和航天都要高,跟汽车撞到墙的加速度差不多。

这就对机器人的结构材料提出了挑战:要翻起来就得身体足够轻,承受如此大的冲击力还得强度大,否则可能一个空翻,零件就飞出来了。所以机器人的第一项挑战就是探索骨架材料。

世界上第一台全尺寸机器人WABOT-1,就是以钢材为主,体重达到了大约160公斤,可能它跳一下就得把地板砸个坑,就更别说翻跟头了。

后来,从本田的ASIMO、波士顿动力的早期液压版Atlas,到第一代特斯拉Optimus,铝合金成了主流,密度只有钢的三分之一。

现在行业已经开始探索更多材料,比如镁合金,它的密度比铝还低了三分之一,局部还会使用强度更高的钛合金,例如经常需要承受冲击的膝关节、脚踝等。

有意思的是,这些坚硬的骨架为机器人扛下了冲击,但供应商似乎赚的只是个“辛苦费”。

某机器人公司前采购总监

骨架最后的卖价,除掉本身金属的含量,再除掉抛掉的废料以外,ratio(比率)其实很低很低了。骨架最后还是卖金属费用+加工费用,大部分成本还是里面的metal(金属),没有办法降价了。它的加工费还是在合理区间的,如果量起来的之后,它的加工费就会趋近于很低,因为它没有什么太大门槛。

除了这些核心的骨架外,机器人的外观件,可以分为两类:

一类是装饰保护件,主要用在胸部、背部、头部,材料从塑料、仿皮TPU到织物,五花八门,主要是为了降低磨损、让触感更亲人。虽然有些机器人看上去是金属机身,实际上是塑料外壳做了一层金属喷漆。

另一类就是让机器人像真人的仿生皮肤,这些皮肤不仅触感要像人,还得在皮下植入触觉传感器。

在骨架和皮肤之外,真正让机器人实现各种超难度动作的,是关节,这也是整个机器人硬件里成本最高、技术最密集、故事也最多的部分。

02 拆解执行器:关节是最贵也最难的部分 

大家肯定看过不少机器人跳舞、空翻的视频,这是先通过真人动作捕捉,再训练模型后映射到肢体动作上。

几年前,我们看波士顿动力的Atlas后空翻时,还觉得非常惊讶,但现在可能大家都觉得习以为常了,这背后的原因就在于,机器人的关节经历了从液压系统到电机的转变。

王闯

智元合伙人/高级副总裁/通用业务部总裁

以前我们造不出这么牛的关节,那时候的关节整个性能都很差,空翻是很难翻的起来的,最近这一两年关节的技术进步非常非常大。

关节在业内被称为执行器,主要分为旋转执行器与直线执行器,我们先以肩膀来举例,看看它们是怎么带动身体运动的。

肩膀有三个自由度:前后摆、上下抬、内外旋,被称为俯仰(pitch)、滚转(roll)、偏航(yaw),本质上这些运动方式都是旋转,所以通过三个旋转执行器的组合,手臂就能向X、Y、Z三个方向自由活动了。

到了膝关节上,一般只需要一个自由度,所以用一个旋转执行器或者直线执行器就可以了,直线执行器就像人体的肌肉一样,通过拉伸来带动上下的骨干运动。

而做一次极限动作,得靠全身几十个执行器紧密协同,任何一个地方反应没跟上,或者力量偏差了一点,后果就是摔倒。

这些执行器里面是什么结构呢?旋转执行器与直线执行器都有一套伺服系统,由电机、编码器、驱动器、传感器组成,两者最大的区别就在于,旋转执行器是伺服电机加减速器,而直线执行器是伺服电机加丝杠。

我们先从减速器开始说起。

Chapter 2.1 旋转执行器与减速器

或许你听过这个装置,第一个齿轮转动10圈,第二个齿轮只转1圈,第三个则只有0.1圈,总共100个齿轮,以此类推,如果要让最后的齿轮转一圈,那么第一个需要转古戈尔(Googol)圈,也就是1的后面有100个0,所需能量超过了整个宇宙的能量总和。

这就是一个大型减速器,本质上是个巨大的杠杆,牺牲速度,换取力量。为什么机器人的关节需要减速器呢?

因为电机天生是“高转速、低扭矩”:转速可以轻松达到每分钟上万转,但输出的力矩却比较小。而机器人的关节需要精准控制,我们很难让电机只转几度的同时,还能搬动非常重的东西,所以需要减速来降低转数,提高扭矩,减速比(也就是齿轮比值)越大,速度降低越多,同时输出扭矩越高。

行业最常用的有三种减速器:行星减速器、谐波减速器、RV减速器。我们用模型来给大家解释下。

首先是行星减速器,它的名字很形象:电机连接中心齿轮,带动三个行星轮,行星轮再带动外圈的大齿轮旋转,就像行星围绕太阳一样。它结构小,成本低,但减速比较小,同样的电机转数下,输出扭矩较低,因此常用在手部关节。

需要输出更大的力时,就会用到谐波减速器了。它的最中心是波发生器,将夹层的柔轮撑成椭圆形,一般柔轮与外侧固定的钢轮之间只相差2齿,柔轮只有两个对称区域与刚轮啮合,这样最中心的波发生器旋转一周时,柔轮只转动了2齿,所以减速比可以做到非常大。

谐波减速器的输出扭矩强,且精度高,常用在机器人的肘关节、肩关节,来实现手臂的精准控制。

前文中提到,机器人后空翻时,承受的力相当于汽车撞击,这也对特定部位的减速器提出了很大挑战,但谐波减速器的柔性结构也意味着抗冲击力较差,这时就得用上RV减速器了。

RV减速器由第一级行星齿轮和第二级摆线针轮组成,第一级降速后,通过偏心凸轮带动摆线盘做偏心运动,摆线盘与外壳上的针齿啮合,推动外壳旋转。

这样一来不仅减速比大,由于摆线盘有多个齿同时啮合,所以刚性好、抗冲击更强,常用在机器人的髋关节、膝关节、腰部等需要抗冲击的部位。

减速器是非常精密部件的,加工难度高,而且面对长期的磨损,也很难保证稳定性,这是整个关节里最难的部分。

王闯

智元合伙人/高级副总裁/通用业务部总裁

当大批量地制造、使用的时候,齿轮的精度以及长时间运行的稳定性要求就很高。比如说用了1000个小时,它就发生了各种各样的异响,或者性能就下降了,这个时候运控的算法可能很难去调整,表现在机器人上就是可能走路没有以前那么好了,甚至开始走得逐渐变歪了。

机器人可能要做很多极限的动作,自己也会摔倒,这些冲击很有可能会损伤里面的这些小的齿轮。我们如何能做出性能又很好、成本又很低、长时间使用又没问题,同时摔倒之后它又能抗得了冲击、不会轻易的损坏的齿轮,这是一个非常有挑战的不可能三角。

换句话说,造一个减速器不难,难的是造出一万个性能一致、耐用的减速器。

Chapter 2.2 直线执行器与丝杠

接下来我们看看直线执行器和它的核心部件——丝杠。

直线执行器可以说是最像人体肌肉的,当我们的手臂这样摆动时,并不是关节在主动旋转,而是连接两端骨骼的肌肉在收缩。所以直线执行器只做一种运动,那就是推拉。

有些机器人的膝关节,会采用直线执行器,通过推拉来模仿人类膝部肌肉的运动。当有多个直线执行器通过特定的结构组合后,还能实现关节的旋转。这样的运动方式会被应用到手腕、脚踝等部位。

要做出直线执行器,最简单的就是液压装置,之前波士顿动力的老版Atlas就是以直线液压缸为主,具有高爆发、抗冲击、功率密度大等优势。为什么是老版呢?因为新版他们也转向了电机驱动,主要是液压装置系统复杂,容易漏油,而且控制精度不如电机。

但电机只能旋转,要输出直线运动,还需要一个“转换器”,也就是丝杠。

丝杠轴上有螺纹,旋转时会带动螺母做直线运动,这个过程就像拧螺丝。为了减小摩擦,丝杠内部会加入滚珠,这就是滚珠丝杠。有的会将滚珠换成了滚柱,寿命更长、承载更高、刚性更好,这就是行星滚柱丝杠。此外还有的还会用到T型丝杠。

王闯

智元合伙人/高级副总裁/通用业务部总裁

现在用的可能比较多的就是滚柱丝杠,它对加工精度要求非常非常高,而且在一个很长的行程内,你的一致性要非常好,如果中间有一些不好的,它对于不同机器之间的控制算法就是一个很大的挑战。

有的直线执行器中也会配合上减速器,让电机输出更高扭矩。但目前行业中,直线执行器的应用比较少,主要有三个原因:动态性能差、制造难、成本高。

王闯

智元合伙人/高级副总裁/通用业务部总裁

目前整个行业量产最多的就是旋转关节。直线执行器在行业内也有一些应用,它的特点是载荷能做到更大,而且在一些状态下,如果不供电,也是能保持一个稳定的姿态,是能够自锁的。但是我们觉得它的缺点就是动态性能可能会稍微差一点,因为它的载荷大、减速比大,但动态性能差,所以没有那么敏捷的动作。还有一个比较大的难点是很难大批量地、低成本地制造,所以在当前,我们觉得还不适合做大规模的商业化。因为大家现在用的少,出货量也少,在客户场景中验证的也少,所以它整个成本都是现在居高不下的。

说完传动,我们再来说说动力本身,也就是电机与伺服系统。

Chapter 2.3 电机与伺服系统

机器人身体中的常用的电机是无框力矩电机,相比传统电机,它没有了外壳和轴承,只保留了最核心的部件,这样做是为了尽可能缩小尺寸,可以直接嵌入关节内部。

灵巧手比较特殊,用的是体积更小的空心杯电机,当然输出功率也就没那么高了。灵巧手的难度甚至比整个机器人本体还高。

身体电机的难点主要在于三块:能效与散热、体积和性能稳定性。我们先来说下能效与散热。

电子产品都会不可避免的产生热量,当热量积压过多,超过了正常工作区间后,性能就会下降,所以电机的能效,也就是真正有多少能量被用在做功上,就格外重要,一旦过热,控制系统就只能降低功率,比如空翻到一半时,突然“腿软”了,就会啪一下倒地上。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我们以前做的最早期的样品,可能10分钟之内,这些极限动作只能做一次。它的转速、转矩这些性能曲线做一次之后整个就变掉了,也有可能因为里面发热之类的原因,这个时候就需要先把它技能冷却一下,让它温度降下来之后才能继续做。再一个比较大的问题是它的能效,就是输入一定的能量有多少转化为了热量,比如说是5%,那就和3%就有巨大的差异。这些都会限制性能,哪怕我硬件能力再强,我都不敢再往上去抬性能了。

3%和5%之间看着也许没多大差别,但需要注意的是,电机的发热不是线性的。

当关节要做一次极限动作,瞬时电流可能是平时的3~5倍,发热量就是额定状态的9~25倍。这意味着热量的积累速度,远超关节被动散热的能力上限。做一次空翻,关节温度可能就从温升10度直接跳到50度。所以做完后电机需要冷却,机器人才能继续下一个动作。

要提升电机的能效,就得从电机材料、绕线工艺、结构设计上来下手,这里我们就不详细说明了。

目前很多关节的散热主要靠被动,因为机身采用了大量金属,可以想象成巨大的散热片,只有在功率非常大的关节才会额外加入风冷或液冷散热,比如腿部。

而且额外加入散热措施会带来第二个挑战,那就是体积限制。

工程师们正在想方设法尽可能缩小关节电机,一方面是为了减轻重量、降低成本,更重要的是体积越大,转动惯量也更大,改变运动状态就更难。

打个比方,当你旋转一根绳子的时候,绳子越短,转速就会更快,如果绳子变长了,转速不仅会变慢,当你想停下来时,需要的缓冲时间也会更长。

第三个难点是性能是否稳定,也就是在电机在输入多少电流时,转数是多少、能输出多大扭矩,业内称为TN曲线。这就会影响机器人的控制算法。

比如走过一段不平整的路面时,脚踝上的六维力矩传感器感受到了起伏,为了维持平衡,就需要动态调整电流,来控制电机扭矩。如果TN曲线不稳定,可能控制系统下达的还是同样的命令,但电机输出扭矩产生偏差,结果就是摔倒。

而且TN曲线还对算法的训练有着很大影响,因为机器人算法是先在仿真系统中训练,如果仿真系统中的TN曲线和现实相差太大,那实际表现也会产生偏差。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我会输入给仿真系统一个曲线,实际中这个电机能达到甚至超越这个曲线,那它想要达到的性能、想做的动作就能做到。如果反过来在低转速下ok,但是转速一高它性能就下来了,这个时候就肯定有一些极限动作就做不了,因为有一些最难的动作,要求你在极高的速度下,又有极高的爆发力。

要精确控制电机转数,还需要一套伺服系统,主要由编码器、驱动器、传感器组成。

编码器用来测量电机转子的角度、速度、位置,让系统知道电机当前在什么状态。

王闯

智元合伙人/高级副总裁/通用业务部总裁

编码器其实很关键,机器人里面因为有减速器,所以必须用双编码器,才能知道输入端和输出端两个的位置都在哪里,才能更精确的控制。

驱动器会根据编码器的反馈,以及来自“小脑”的控制指令,调整给电机的电压、电流。

传感器的种类比较多,比如力矩传感器测输出扭矩,温度传感器测电机温度、防止过热等等。

以上就是执行器里的关键部件,接下来我们再说说执行器的整体,为什么它是降本的关键?自研和采购有多大区别呢?

Chapter 2.4 研发路径与成本

根据美国银行的测算,执行器是机器人身上成本最高的部件,约占51%。

某机器人公司前采购总监

无论是手或是电机,motor(电机)和control(控制器),也就是你的肌肉(执行器)是比你的骨骼、比你的眼睛(传感器)、脑子(芯片),包括你的心脏(电池)都是要贵的。

所以执行器是未来量产降本的关键,最主要的因素就在于,中国供应链实在太卷了,此前不少需要其他国家工厂精加工的部件,现在国内都能找到替代。

比如做电机的卧龙电驱、做减速器的绿的谐波、双环传动、中大力德等等,甚至还有公司直接可以提供完整的执行器,比如三花智控、拓普等。

既然市面上可以买到现成的执行器,机器人公司为啥还要费时费力自己研发呢?我们对比下这两种模式。

如果采购成品,可以降低研发成本,提升开发效率,但相应的物料成本会更高,难以根据自己的需求去定制,性能也会有所不足。

王闯

智元合伙人/高级副总裁/通用业务部总裁

大部分(执行器)公司不会给你专门去设计你想要的东西,它卖给你的都是标准件,成本相对来说也比较高。如果一个公司它本身本体的团队人又少,关节的积累也不够,肯定是去买别人的会更好一点,会更快速地能把这个东西做出来。

如果自研的话,能更好的匹配需求和算法,性能更强,但相应地需要付出大量研发精力。

选择哪种路径更多的是公司规模与成本的考量,根据我们的调查,目前头部的机器人公司更多还是偏向自研,甚至会进驻供应商那边参与设计。

所以机器人的关节不仅仅是把零件装在一起,而是要在极小的体积内,实现力量、精度、耐久、成本、重量的平衡,可以说是整个身体中最难的部分,原因在于这是一个新兴的产业,此前供应链并不成熟,大家都是在探索阶段。

王闯

智元合伙人/高级副总裁/通用业务部总裁

(初期)很多的产线的设备都是行业内没有的,我们自己还要去设计(生产)设备。

光有强健的关节还不够,机器人又该怎么知道怎么站稳?如何感知世界?接下来我们聊聊传感器。

03 视觉系统:机器人如何感知世界 

Chapter 3.1 惯性测量单元(前庭)

现在的机器人在大部分情况下,不论人类怎么干预都很难摔倒。要实现这样的平衡,在硬件上得依靠身体中的各个传感器。

一方面是前面提到的电机伺服系统,它通过关节里的编码器和力矩传感器,实时感知每个关节的当前位置和受力情况,然后以每秒上千次的频率调整输出。

另一方面,光有“四肢的感觉”还不够,就像人类还需要靠内耳的前庭系统,来感知身体的倾斜与旋转,在机器人身上,这个部位就是惯性测量单元(IMU)。

IMU非常常见,比如当你把手机旋转时,画面也跟着旋转,就是靠IMU。

IMU是几个传感器的组合,最核心是两样东西:一个是加速度计,测量XYZ三轴的加速度,另一个是陀螺仪,测量俯仰、偏航、滚转三个轴的角速度。此外IMU还会加入磁力计,相当于是电子罗盘,用于校准。

把这几个数据融合起来,IMU就能实时感知机器人的运动状态,当我们踹他一脚时,身体会瞬间获得一个加速度,同时还会前后左右倒,IMU检测到这个变化后,会将数据传给“小脑”,计算出需要给各个关节增减多少扭矩,然后将身体拉回来。这个部件在手机、汽车等地方用得很多,所以技术和应用也相对成熟。

防摔倒靠的是IMU,而对日常行动来说,更重要的是防碰撞,避障最依赖的就是视觉系统。

Chapter 3.2 摄像头与激光雷达(眼睛)

机器人的“眼睛”,和汽车的自动驾驶非常像,但又不完全一样。常见方案是摄像头 + 激光雷达 + 毫米波雷达多传感器融合。其中的例外就是特斯拉Optimus,众所周知马斯克是坚定的纯视觉党,只用摄像头。

在传感器的使用上,机器人几乎和汽车一样,许多供应商也都是从汽车供应链上迁移而来。不过虽然都是同一种传感器,但实际的规格大不相同,我们以比较贵的激光雷达来举例。

首先是测距要求不同。汽车要跑高速,激光雷达需要看到150-200米外的障碍物。机器人主要在室内活动,10~20米就够了。测距短了,意味着激光雷达的功率、体积、成本也可以更低。

第二是点云密度和扫描方式不同。汽车识别的是车、人、路障,这些都是大物体,点云密度可以低一些,但机器人需要在桌子上拿起螺丝刀、在地上捡起硬币,这些都是小物体,所以需要更高密度的点云。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我们是希望点云要非常的密,像我们现在用的是非重复扫描,就是你在原地站一会之后,它的点云就会变得更密。这个对我们来说是非常好的,因为我们机器人很多时候并不是那么激烈地在做操作,它像人一样,人做很多事情都是慢慢地去做的,而汽车对稳定性、实时性以及重复性的要求非常高。

第三是安装位置和体积不同。车可以把激光雷达装在车顶、保险杠上,体积大一点没关系,但机器人身体较小,就必须使用更小的模组。

第四是可靠性要求不同。比如汽车常年在室外,对工作温度要求更高;而机器人受到的冲击力更大,对抗震性要求更高。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我以前做车规的话,激光雷达最低的要求是-40度到85度,但在机器人上,至少现在是完全是不需要的。所以汽车上有很多专门为可靠性做的设计,在机器人看来就是冗余的。汽车出车祸的时候,可能加速度才能达到机器人日常做一次空翻的加速度,所以我们对这些震动状态下的稳定性的要求非常高。

虽然汽车的激光雷达已经非常成熟了,但机器人的激光雷达还处于行业早期状态。

王闯

智元合伙人/高级副总裁/通用业务部总裁

我们希望体积变得更小、点云更密、望距离短一点但是FOV(视场角)大一点,这些需求其实都是还没有被满足的。

在摄像头上,根据前特斯拉人工智能硬件负责人的透露,它们选择了车规摄像头,但内部研发时的路径也一再变化。

刘向科(Kerry)

前特斯拉人工智能硬件负责人

目前的方案应该是基于车上的摄像头, 是500万像素。早期最早的方案是堆了很多摄像头的,像素都是有区别的,把帧率降低,把像素提高。为什么这么做,是因为当时Elon提了个要求,希望机器人能够做到穿针引线,当时我们算了,要做到这个要求,必须得要有超过1500万像素,才能看得见这个事情。

也是因为软件团队表示,这个事情如果要是连像素、摄像头都变了的话,对于重新训练这个模型的要求、时间的要求、还有工作量就都会大太多了。 做不到怎么办呢?就考虑在摄像头上加自动对焦。但后来好像又说这个事情,也未必是一定需要的,所以反正就是一直在变。

Chapter 3.3 触觉

接下来我们说说触觉,要实现触觉,主要分4种途径:

最常见的是压阻式,通过将压力转化为电阻,来改变电流信号,比如电子秤会用到。

第二种是电容式,用弹性介质隔开上下两层,当施加压力时电极距离变小,电容值发生变化。

第三种是压电式,只要材料受力,就会直接产生电压,比如打火机里放电的小玩意。

第四种是光学式,表面有弹性材料,受力后产生形变,由摄像头来捕捉,这是目前最热门的方式。

触觉最好是三维的,不仅可以感受到压力,还能感受到平面上的摩擦。比如当我们拿起可乐时,手会捏紧瓶子,向上抬起,如果手指感受到瓶子有下滑的摩擦力时,会加大捏的力度避免滑落。

但这也对材料和算法提出了很大的挑战。

王闯

智元合伙人/高级副总裁/通用业务部总裁

第一就是在传感器本身的层面,因为它其实本质上都是材料,任何的材料都很难在三个(XYZ)方向上很好的解耦开,所以精度就变得比一维的力难很多,怎么能把它弄准?其次是,这些三维的触觉这么复杂的数据,怎么跟操作模型结合起来,这也是非常难的,因为现在整个数据的量都非常少。

在这些挑战下,此前行业中的量产机器人,几乎不怎么搭载触觉。

王闯

智元合伙人/高级副总裁/通用业务部总裁

在整个2025年量产的产品里面,触觉用的非常少,几乎就没有,不只是我们,就整个行业都用的很少,因为这个东西不稳定。

需要考虑它长期抓东西的时候怎么能不变形,因为它稍微变形一点,可能输出的信号就完全不一样了。还有就是,不要发生性能的漂移,形状、位置这些都不能发生破损,材料又要稍微柔软一些,又要很耐磨,这本身也是很矛盾的事情。

但到了今年,情况似乎有点变化。我们的采访嘉宾表示,到了2026年,看到了规模化生产的希望,接下来就是如何在数据采集、训练中,让触觉系统更好的结合了。整体来说,触觉这个行业还非常早期,我们也期待看到未来更多进步。

除了前面提到的这些传感器外,机器人身上还需要温度、湿度、六维力矩传感器、UWB等等,这些都比较成熟,我们就不多赘述了。

传感器让机器人能感知世界,关节赋予了机器人活动的能力,但要让这两者结合,还需要一个“中枢”,接下来我们聊聊这个中枢——电气架构。

04 电气与计算:芯片整合与线束轻量化 

Chapter 4.1 芯片(大脑与小脑)

我们在之前讲机器人算法的文章中提到过,业界发展出了“System 1+System 2”这样的双系统架构,System 1负责操控四肢,System 2做复杂思考,在芯片上,也采用了“小脑+大脑”这样的组合。

为什么不用一个芯片干所有事?因为需求完全相反。

大脑芯片要思考“该怎么做事”,需要的是高算力、大内存,最好能在端侧跑大模型,延迟个几秒基本没啥影响。

目前绝大多数机器人大脑选用的是英伟达的Orin芯片,2025年英伟达还推出了性能更高、专为机器人和物理AI设计的Thor芯片,预计将成为未来主流。

特斯拉Optimus例外,它用的是自研的芯片,而且还是双芯片。

刘向科(Kerry)

前特斯拉人工智能硬件负责人

机器人因为不是自动驾驶,没有这种安全考量,Elon自己觉得,他说:不需要这个安全冗余的问题了,一个芯片就够了。做一个单芯片系统之后,他后来他一想不对,机器人的世界模型对算力的需求,是远高于自动驾驶的。自动驾驶两个都够呛,那机器人怎么可能一个能够?他自己又反应过来说:不对不对,改回两个芯片。

另外今年初的CES上,高通也发布了机器人大脑芯片Dragonwing IQ10,并且宣布了与Figure的合作。

而小脑芯片要“操控身体”,不需要特别高的算力,但实时性、稳定性、响应速度必须高,一旦延迟个几毫秒可能就会摔倒。

例如机器人空翻、跳舞时,基本是用提前录好的动作,但我们会发现它的脚还是会有一些碎步,这就是小脑在动态调节平衡,就像人类的“本能反应”一样。

王闯

智元合伙人/高级副总裁/通用业务部总裁

小脑它要求速度非常快,所以小脑里面的频率可能是1K赫兹。

目前小脑芯片通常是MCU,主流选择是意法半导体的STM32系列、恩智浦的i.MX RT系列、瑞萨的RZ系列等。

现在我们也看到了一个新趋势,行业正在试图将大脑和小脑芯片整合在一起。这方面特斯拉比较前沿,一开始走的就是这条路线。

刘向科(Kerry)

前特斯拉人工智能硬件负责人

我们就先默认当时是用Hardware 4这个电脑的自研芯片。特斯拉的大脑小脑集中在同一个芯片上面,如何通过这一个芯片,用一个什么样的通讯架构来控制整身的行动?当时我们也是花了一些时间研究这种方案,一个SOC里面既有算力的ASIC,也有一个多核的CPU,这个多核的CPU可以用来处理小脑这些东西,这个频率很高的CPU的延迟也非常的低。

除了特斯拉外,也有其他公司在研究集成方案。

比如灵境智源在今年3月发布了德沃夏克架构,在一块芯片上集成了“大脑-小脑-皮层”三个功能。那统一成一块芯片,会带来哪些好处呢?

王闯

智元合伙人/高级副总裁/通用业务部总裁

首先我觉得最大的一个优势就是,因为现在做成一块板了,整个胸腔的体积和走线都会变得很简洁。然后其次是大脑和小脑,越往后,它之间的协调就越重要,举个例子,有人向你扔了一支飞镖,你去看以及预测飞镖的轨迹,这些东西可能都是用大脑,但是你手伸出去抓到它,这个是小脑,这两个东西之间通讯越快,越有利于完成非常高难度的动作。如果大脑、小脑做在一起的话,芯片之间的通讯会非常非常快,可能大脑能够实时的去控制小脑怎么动,并以非常高的速度去反馈。

不过根据行业内的看法,统一大小脑芯片还处于非常早期的阶段,需要等机器人出货足够多、市场足够大之后,机器人公司才会像现在的智能汽车公司一样,逐渐转向一体化的自研芯片。

Chapter 4.2 电池与线束(心脏、神经、血管)

最后,还需要为全身提供能量的电池,就像机器人的心脏。核心需求是如何在更小的密度下,容量做到更高,主要供应商有宁德时代、LG、亿纬锂能等,

还有遍布全身的线束,就像神经与血管,用于设备之间的通信与供电。主要供应商有立讯精密、TE Connectivity、Amphenol等。

关于机器人的供应链种类繁多,我们就不一一介绍了,在这里放一张全景图,大家有兴趣可以放大研究。

看到这里,相信你已经学会了怎么造一台机器人,但先别急,如果你真的自己去做了,会发现哪哪都是问题,因为造机器人最大的难点,其实是各个工程之间的平衡。

最后我们再来聊聊,组装与量产的难题,以及这两年机器人突飞猛进的原因。

05 组装与量产:能动不等于好用 

如果你看过前段时间的机器人马拉松,会发现现场有不少趣事。

有的随地大小坐,引来隔壁机器人拍手叫好;有的跑着跑着脚崴了、喝醉了、胳膊掉了、冲上绿化带了,或者被减速带绊倒后“粉身碎骨”了。

当然也有表现非常亮眼的,比如荣耀的机器人,不仅包揽了前六名,还刷新了人类的半马记录。

不过这也引发了一些讨论:连手机厂商做机器人都能表现这么好,是不是意味着这行业没什么门槛呢?

Chapter 5.1 组装

业内人士的回答是:Yes,and,No。我们先说Yes的部分。

前文我们提到的各个零部件,供应商和手机、汽车行业高度重合,再往上,算法也有部分能和自动驾驶复用,这也是为什么荣耀、小米、特斯拉、小鹏会下场做机器人的原因。

某机器人公司前采购总监

Electrical & Power system(电气与计算)部分的供应商重合度能达到90%多,mechanical system(骨架结构)部分就算模具不一样,供应商也有很多类似的。电驱这一块是唯一可能和车相关性没有那么高的,因为车里面不需要有类似提供太多扭矩的东西。但是减速器、齿轮等零件在汽车里有非常多,包括sensor(传感器)也是。所以基本上80%以上的东西是可以同质的。

理论上,只要你认识这些供应商,就能自己搓出一台机器人。但“能动”和“好用”之间,却隔着一道巨大的鸿沟,这就是No的部分。

比如组装后重量分布不均,机器人的重心就偏,走路时为了保持平衡,某些关节要额外出力,功耗增加,续航减少,甚至影响步态稳定性。

又或者在实验室里跑1小时没问题,但放到真实环境跑100小时,各种毛病就出来了:比如某个螺丝松了、某根线磨损了、某个关节的润滑脂干了、某个传感器开始漂移了,这些都必须经过不断调试,才能找到平衡点。

某机器人公司前采购总监

每一个零部件,我把它拆成每个供应商,我觉得供应商的难度都不高的,我觉得最后是系统整合才是,比较难的东西。

更多是说你给了它上了constraint(约束),比方说你要把这个东西减重、轻量化做到什么(程度),但是你以人形把它框住了之后,它的力矩的大小以及它的精密度上,都要达到人类的高度,这才是难点,更多的是工程路径上的trade off(权衡)。

王闯

智元合伙人/高级副总裁/通用业务部总裁

往往市面上买到的标品,都是不能让人满意的,都离我们真正算法应用的要求来说有差距的,所以这些都是核心零部件,我们要自己动手去做。

Chapter 5.2 量产

要做出可商业化、能量产的机器人,还会面临一致性的问题。

因为每台的关节背隙、传感器零点、电机参数都不一样,要让同一套算法能稳定应用在不同批次的本体上,还需要对各个细节做调整。

王闯

智元合伙人/高级副总裁/通用业务部总裁

你放10个机器人在那,给它发同样的参数(指令),它的手伸出去的位置是不一样的。

如果做操作,可能差个几毫米,就从能抓住它变成了把它撞倒,这时候怎么把所有机器人的传感器和执行器的标定方案做好,就非常难。还有在标定完了之后,能不能保证,在使用一年之后,它很多地方老化了、传感器也有畸变了的情况下,它还能保持稳定,这个时候可能还需要一些在线的标定,就是自己能把误差分析出来。这些东西都是看不见的功夫,但是如果不做的话,后面很多问题都解决不了。

所以真正的难点不是“拼起来”,而是系统级的整合。

我们回到机器人马拉松,今年不仅速度进步了不少,整体的完成度也提升了,再看这两年机器人动作的进化,从走路,到转手绢,再到跳舞、武术,为什么这两年进化如此快呢?最重要的原因就在于供应链的成熟。

王闯

智元合伙人/高级副总裁/通用业务部总裁

在过去一两年,机器人行业还不像现在这么的被大家看好,那时候大家不会为机器人去做激光雷达,大家只会说我这个是为物流车做的,你拿来直接用吧。那个时候是求着别人的,大家对机器人都是将信将疑的。

正如我们前面说的,机器人产业链很多环节都和汽车重合,此前对供应商来说,存在内部资源博弈的问题:在产量有限的情况下,是优先供给商业化成熟的行业?还是修改产线,去押注商业市场尚未成熟的机器人?

某机器人公司前采购总监

以前市场我觉得还没有到这个级别,跟真的跑量的手机、汽车等等还可能差一到两个数量级。所以供应商也是在博弈,因为它内部资源也有限。

现在随着机器人赛道越来越热,供应商开始愿意为机器人专门开模、定制产品,相信随着需求越来越大、商业化路径更加明确,供应链还会像滚雪球一样成长。

那下一个里程碑的动作,会是什么呢?

06 下一个里程碑:从空翻到接住一片落叶 

王闯

智元合伙人/高级副总裁/通用业务部总裁

我前几天去了上海马戏城,我看了一场表演之后,我的感觉就是,机器人里还要进步的东西太多太多了。

那个蒙着眼睛在几十米高空走钢丝的演员,那个用一根筷子让几十只碗同时旋转的杂技师,他们展示的,是人类用了上百万年才进化出的东西:极致的感知、本能级的平衡、毫厘之间的触觉反馈。

虽然现在机器人能空翻、能武术,但它依然离人类遥远。

我问王闯,对机器人的下一个里程碑时刻是什么期待,他的回答其实有点让我惊讶。他的答案,不是什么更复杂更fancy的动作,而是一个非常非常基础、具备人类“感控融合”本能的“接住一片落叶”。

王闯

智元合伙人/高级副总裁/通用业务部总裁

有一片树叶,我能走过去,手伸起来正好就捏到那片树叶。

仅仅是一阵风飘过,穿过一片树林,而“它”走过去,伸出手,“恰好”接住了一片落叶。 这一天到来的时候,机器人距离我们的生活,又近了一大步。

本文为转载内容,授权事宜请联系原著作权人。