7月4日,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC)在上海开幕。作为具身智能的载体,人形机器人此次备受瞩目。第一财经记者在世博展览馆见到了特斯拉、达闼、星动纪元、开普勒等厂商旗下的人形机器人。展馆一侧还陈列着人形机器人“十八金刚”,吸引不少观众驻足拍照。
人形机器人量产落地蓄势待发,商业化元年也有了更具象化的体现。不久前,特斯拉CEO马斯克在年度股东大会上表示,特斯拉将于2025年开始“限量生产”Optimus(擎天柱)人形机器人,明年特斯拉将有上千台在运行的Optimus机器人。在展台边,上海开普勒探索机器人有限公司CEO胡德波则告诉记者,到明年,公司人形机器人的出货量预计有几百台,启动量产后单台成本将明显下降。记者了解到,逐渐接近量产的同时,各家人形机器人厂商就如何接入大模型、是否自己做大模型平台则有不同考虑。
多台人形机器人亮相
世博展览馆一侧,“十八金刚”引人注目,展出的人形机器人包括人形机器人(上海)有限公司旗下的青龙、智元机器人旗下的智元远征A2、傅利叶智能旗下傅利叶GR-1、中电科机器人旗下电科机器人一号、星动纪元旗下星动1号、开普勒旗下开普勒先行者K1、乐聚机器人旗下夸父4代、宇树科技旗下H1等。
其中,青龙于WAIC期间正式发布,是国内首个全尺寸开源通用人形机器人公版机,具备高机动下肢行走标配与轻量化高精度上肢作业标配,支持快速行走、敏捷避障、稳健上下坡和抗冲击干扰等四大运动功能。
记者还在展区看到多个人形机器人和双足机器人表演。5台达闼人形智能服务机器人现场摆动双手和头部,跟随音乐跳舞。工作人员现场操控傅利叶GR-1人形机器人,演示上肢动作和行走动作。逐际动力的双足机器人则在地上行走,靠近或碰到障碍物时机器人便会往后退。记者未看到特斯拉第二代Optimus的现场表演,该人形机器人放在玻璃罩内,吸引数十名观众观看拍照。
据特斯拉展台资料介绍,第二代Optimus比前一代机器人行走速度提高了30%,平衡感和身体控制能力有所改善。Optimus搭载与车辆同源的AI技术,搭载神经网络和特斯拉FSD芯片,近期Optimus在特斯拉工厂中尝试工作,明年还将有超1000个Optimus在工厂协助完成生产任务。
记者在展台看到,达闼的具身智能人形机器人XR4则搭载了RobotGPT具身智能大模型,有50个以上自由度,价格39.9万元起。达闼展台工作人员向记者介绍,大模型被用于人形机器人的技能训练,大模型也让人形机器人可以理解人类的语义,并作出相应的反应。
傅利叶展台工作人员则介绍,傅利叶GR-1全身有54个自由度,可以模仿人的各种动作,如招手、点赞,目前已在科技馆迎宾接待等场景应用,根据客户定制,价格在几十万到一百多万元之间。特斯拉人形机器人采用直线关节、滚珠丝杠,这种方案相对更稳定、精度更高但动作较慢,绑定了工业场景应用,相比之下,傅利叶人形机器人则采用电机直驱方案,爆发力相对较强,可用于教育、工业、巡检、展示等不同场景。
星动纪元相关负责人则表示,其人形机器人已用于工业领域分拣,需要跟工厂联合开发适配。
开普勒先行者K1采用自研行星滚柱丝杠执行器,双手可搬运30公斤物体。胡德波表示,明年开普勒人形机器人预计将正式进厂,今年会开始量产并开始交付,需求方包括行业需求方、AI公司和科技机构、系统集成商等,明年预计出货有几百台。随着产量增加、成本下降,今年其人形机器人便会以每台3万美元左右的价格销售。
路线分化
第一财经记者在展会现场看到,人形机器人的形态都与人类相近,但细看却有不同。以头部为例,有的人形机器人有类似眼睛、嘴巴的“器官”,有的人形机器人头部像戴了头盔或带有显示屏,有的模仿人类的五官和头发,有的头部并不像人类。不仅形态有所不同,在是否自研、如何接入大模型的问题上,各厂商所选路径也有所不同。
其中,达闼推出了机器人领域的多模态大模型RobotGPT,为多模态行为提供交互生成型AI大模型。大模型与机器人结合后,使机器人能理解人类语言并自动分解、规划和执行任务。基于此,达闼创始人黄晓庆现场介绍,“人形机器人身上已有“小脑”,问答功能则可以接入第三方大模型,不排除未来第三方公司AI也能支持人形机器人动作生成。
傅利叶则聚焦人形机器人本体,据展台工作人员介绍,傅利叶聚焦人形机器人运动控制、平衡能力与硬件,对外则提供接口以集成大模型,目前大模型已与外部合作。星动纪元也开发“小脑”部分,大模型需外部接入。
胡德波则表示,开普勒人形机器人基于硬件本体,有一个软件操作系统,软件操作系统对外开放接口,例如关节控制、视觉控制等,大模型作为软件操作系统的一个个模块,解决人形机器人“干活”时动作的自主性问题。公司会将训练后的小模型部署在人形机器人身上,但不会直接开发大模型。