AI人形机器人研讨:与汽车行业联动,主机厂押注人形机器人赛道

佐思汽研发布《2023年人形。人形人研人形人赛机器人。机器机厂机器工业研究报告》。讨汽首要从以下几方面进行研究:

AI。车行人形机器人首要构成及使用场景;

AI大模型赋能人形机器人技能途径;

主机厂和其他。业联押注厂商。动主道AI人形机器人。人形人研人形人赛产品。机器机厂机器布局比照;

产品。讨汽硬件。车行拆解。业联押注及软件剖析;

AI人形机器人的动主道发展趋势等。

与。人形人研人形人赛机械。机器机厂机器臂、讨汽AGV比较,AI人形机器人使用场景更具通用性。

AI人形机器人是指由AI大模型赋能,具有与人相似外观和运动方法的机器人。AI大模型从语音、视觉、决议计划、操控等多方面与人形机器人结合,使机器人具有了解指令并履行指令的功用。 凭借AI大模型赋能,AI人形机器人使用场景更具通用性。 例如,2023年8月,智元机器人推出的远征A1,由百亿级。参数。的W。or。kGPT大模型赋能,具有了解指令,并对指令进行使命编列和履行闭环才能。估计2024年商用,并首先用于。工业。制作范畴如3C 制作、 轿车制作,随后逐渐走向to C使用如家庭场景。 2022年8月,小米推出的Cyberone。其搭载自研Mi-Sense 深度视觉模组+ AI 交互。算法。,具有三维空间感知才能,完结身份、手势和表情辨认。此外,在心情感知上,其能辨认85 种环境语义和 6 大类 45 种人类心情。未来将首先用于小米。智能。制作工厂、一起还支撑多种使用场景,如家庭助理、陪同机器人、教育辅佐等。

智元机器人元征A1使用场景示例。

AI人形机器人大模型从VLM向VLA进化。

2023年7月,谷歌DeepMind推出了机器人模型Robo。ti。cs Transformer 2 (RT-2),这是一个视觉-言语-动作(VLA)模型,完结了视觉言语模型与机器人动作的结合。它能够辅导机器人辨认视觉和言语,让其了解指令并做出正确的操作。

与视觉言语模型(VLM)比较,VLA的首要进化之处在于将机器人动作直接作为模型token输出,省去了VLM模型将输出的指令翻译成动作操控。信号。的过程。

RT-2的架构和练习。

636a0e70-8778-11ee-939d-92fbcf53809c.png

来历:DeepMind。

RT-2一方面吸收了VLM语义推理、问题解决、视觉解说才能,另一方面能从实在的机器人动作中完结具身使命推理,且两方面能够相互促进。

练习方法上,RT-2经过将机器人动作拆解为文本token的方式,完结了直接与视觉言语数据混合后输入VLM进行联合微调。

RT-2不仅是对现有VLM模型的简略而有用的修正,还展现了构建通用物理机器人的远景,让机器人能够推理、解决问题和解说。信息。,以在实际中履行各种使命。

谷歌DeepMind RT-2大模型。

63753192-8778-11ee-939d-92fbcf53809c.png

来历:DeepMind。

与轿车行业联动,主机厂押注人形机器人赛道。

AI人形机器人可与轿车行业联动。如在轿车生产上,用于。新能源。轿车工厂安装底盘、打螺丝,提高工厂智能化水平,下降人力本钱;在轿车出售环节上,用于门店为顾客介绍产品,提高。品牌。形象。

现在,已有包含。特斯拉。、小鹏和小米在内的厂商推出了AI人形机器人。此外,比亚迪也于2023年9月入股人形机器人。公司。上海智元新创技能有限公司,未来智元。科技。的机器人远征A1可在比亚迪工厂参加外观。检测。流程、进行安装底盘等轿车安装线上作业。

部分主机厂及其他厂商AI人形机器人产品布局。

638024f8-8778-11ee-939d-92fbcf53809c.jpg

来历:佐思汽研《2023年人形机器人工业研究报告》。

因为人形机器人与轿车之间存在技能同源,主机厂在轿车行业堆集的技能经历可直接复用到这一赛道上。 首先在软件方面,主机厂可将车端算法复用至人形机器人上。 例如,特斯拉人形机器人Optimus选用与F。SD。相同的。神经网络。“占用。网络。”来对三维环境进行建模。FSD算法在处理。传感器。数据时,具有对路途、车辆和行人等物体进行辨认的才能,可协助机器人在履行使命时辨认和定位物体。此外,Optimus的神经网络练习是彻底端到端的,可直接从。视频。输入中获取信息,并输出操控指令。依据2023年9月特斯拉发布的视频,Optimus已可仅依靠视觉对物体进行分类,并完结简略的瑜伽动作。 小鹏轿车在车端感知上选用激光雷达、。毫米波雷达。、摄像头、超声波等多种传感器,及自研的。深度学习。算法,完结对周围环境的。高精度。地图构建和实时动态追寻。该技能可使人形机器人具有在杂乱路途安稳行走的才能,及对障碍物和危险物的躲避和应对才能。 此外,小鹏选用多种模块,如规划、决议计划、操控、校准等,及自研的强化学习和多智能体协同算法,完结了对车辆运转的安全和保证。该技能可使人形机器人具有在不同场景下自主完结使命的才能,以及与其他机器人或设备协同作业的才能。

小鹏AI人形机器人。

639b0aca-8778-11ee-939d-92fbcf53809c.png

来历:小鹏。

其次在硬件方面,主机厂可将电动轿车供应链复用到人形机器人上。如共用轿车芯片、电池、摄像头号,并对轿车电机电器、热办理等做适应性更改,以下降机器人制作本钱。

例如特斯拉人形机器人的“大脑”搭载D1。芯片。(同为特斯拉车机的芯片),单芯片算力可达362。TF。LOPs,为机器人供给算力保证;头部具有3颗Auto。pi。lot摄像头(鱼眼摄像头+左右摄像头),别离操控左中右三个方向的画面;电池组学习了。电子产品。与轿车产品的规划,将一切电池的。电子。设备会集到电池组的单个。PCB。中,从传感、交融、充电办理聚集到一个体系中。

Optimus人形机器人大脑芯片D1架构。

63a56b78-8778-11ee-939d-92fbcf53809c.png

来历:特斯拉。