每个场景需要上百万条数据:机器人如何成“人”

    2025-05-13 09:43:18

位于北京首钢园的人形机器人数据训练中心。图为工作人员训练人形工业机器人。

进入2025年,人工智能的飞跃让人形机器人迎来了属于它的新时代。如果关注全国各地人形机器人的最新动态,你会发现,信息检索的速度赶不上更新的速度,每周都有新消息。

每天重复500次

落成一个多月,位于北京首钢园的人形机器人数据训练中心很繁忙。这里聚集了100个机器人,其中80个正通过水瓶、积木等物品,练习着抓、取、放等通用技能。在真实生活场景试验场中,另外20个机器人正在进行叠毛巾、浇花、理疗、清理沙发等行为的数据采集。

“我想试一下”,参观者按捺不住地从操作员手里接过可以“控制”机器人的穿戴设备,尝试着让它拿起毛巾,再叠放整齐……并不断提醒同伴帮自己拍下这一刻。

体验过后,他们发现,“叠真的很费劲”,毛巾不时从机器人的指缝间掉落,“灵巧手”并没有那么灵巧。工作人员解释,这与教幼儿园小朋友学写字,要靠老师手把手教类似,机器人也需要人的贴身指导,进行数据学习。“它对数据的需求至少是百万级的,而且越多越好,目前这个量还远远不够”。

1260公里外的上海,有目前全国唯一的异构人形机器人训练场。这里有一百多个机器人,来自十余个不同的品牌,高矮胖瘦各不相同。每一个身边几乎都有一位年轻的操作员,每人每天的工作是将一个动作重复500次以上。工作人员介绍,每一个场景都需要上百万条准确的数据,也就是单个采集师要如此工作很长时间。

训练到什么程度数据算是够了?准确率要到99%以上才行,因为产线上尽量不能有失误;在家里倒水,100次里有10次洒了或者杯子摔了也不行。国家地方共建人形机器人创新中心总经理许彬说:“他跟三岁小孩一样,你不能指望着三岁小孩去干好多家务事,他容易给你干砸。”

“对人形的期待”

2025年,人工智能让机器人如虎添翼,各地的竞争加速了。

广东的年度目标是,在具身智能机器人领域,引进和培育3至5家独角兽企业、科技型领军企业。北京表示,到2027年,围绕具身大小脑模型、具身智能芯片、全身运动控制等方面突破不少于100项关键技术,产出不少于10项国际领先的软硬件产品。北上广之外,其他省市也加快了动作。

湖南发布了首台人形机器人“湘江1号”;湖北一次性推出十款人形机器人;四川媒体形容,成都正在“跑步”入局;无锡也在“竞速”抢占千亿“赛点”;福建计划前瞻布局元宇宙、人形机器人等未来产业赛道;泉州启动建设具身智能服务机器人创新平台;合肥计划设立100亿元未来产业基金;江西赣州设立了规模达10亿元的智能机器人产业基金;位于浙江的一个小城龙游县,也推出了自产的通用人形机器人。

“湘江1号”由湖南超能机器人技术有限公司研发。该公司董事长肖湘江告诉记者,2024年,公司其实没准备做人形机器人,“后来发现不做不行了”。

人形机器人“湘江1号”

“领导、客户、投资人会含蓄地表达,人家都是人形,你们还是轮式、履带式,是不是有点太落后了?你会感受到大家对人形的期待。再不做,可能就真的不在牌桌上了。”

很多报道将2025年形容为人形机器人的量产元年。肖湘江认为,这样的表述激进了一点,量产很重要的前提,是找到一个确实适合人形机器人当下技术成熟度的场景,需求量还得很大,这样才是可复制的。

“可以勉强讲2025年是人形机器人落地的元年,讲量产还是偏早了,或者说,这种量产也是为了量产的量产。”肖湘江预测,实现量产至少需要三年。而叠加大量资金涌入,行业可能会以超预期的速度进化。他原来觉得,5到10年才会走向应用,现在,可能会缩短至3到5年。它的发展“可能远比想象中要快”。

(来源:《南方周末》)

责编:伍芳芳

一审:伍芳芳

二审:姚瑶

三审:黄维

我要问