上海启动人形机器人数据集建设
迭代关键共性技术为未来产业提速,将向国内企业和科研团队开放
编者按 新质生产力是创新起主导作用,摆脱传统经济增长方式、生产力发展路径,具有高科技、高效能、高质量特征,符合新发展理念的先进生产力质态。因地制宜培育发展新质生产力,加快形成与新质生产力相适应的新型生产关系,上海有哪些创新探索?本报今起推出“追踪新质生产力”系列报道。
本报记者 俞陶然
人形机器人是未来产业的标志性产品之一,有望成为继计算机、智能手机、新能源汽车后的颠覆性产品,将深刻变革人类生产生活方式,重塑全球产业发展格局。
在这个产业领域,上海如何开展科研布局,为培育新质生产力提供技术支撑?日前,由上海机器人产业技术研究院牵头,联合上海交通大学、复旦大学、同济大学的科研团队,以及傅利叶智能、智元等企业,启动了人形机器人数据集建设项目“。这是一个产业共性技术研发项目。”上海机器人产业技术研究院副院长周梅杰说, “数据集建成后,将向国内企业和科研团队开放,用来训练人形机器人大模型,让机器人拥有发达的大脑和小脑。”
建设自主可控高质量数据集
随着人工智能大模型的兴起,人形机器人体内将部署专用大模型,从而能理解人类发出的指令,并完成各种任务。训练机器人大模型的原料,就是数据集。
去年7月,谷歌旗下DeepMind公司发布了机器人视觉、语言、动作模型RT- 2。今年2月, DeepMind与斯坦福大学团队联合开发出人形机器人数据集 ALOHA 2.0版,还展示了ALOHA机器人的烹饪技能。
面对国际竞争,建设自主可控的高质量数据集,成为我国发展人形机器人技术和产业的当务之急。为此,人形机器人数据集建设项目计划在未来两年里建设一个人形机器人数据采集、治理与应用验证平台。
“这是平台建设的流程图。”在上海机器人产业技术研究院的机器人智能创新实验室里,周梅杰指着大屏幕介绍,数据采集、数据上传、自动标注、数据增强、大规模回归测试、应用验证… …每个环节都由高校团队或研究院负责。两家企业的首要任务是提供机器人本体,傅利叶智能研制的GR- 1、智元打造的“远征”系列机器人将进入实验室,参与各种任务实验,帮助科研团队完成数据采集。这些数据进入原始数据库后,将自动触发分类、清洗和标注的数据加工流水线。
开源“技能包”加速培育
目前,人形机器人实验场地正在搭建中。走进机器人智能创新实验室,记者看到一个区域的上方安装了多台动作捕捉相机。不久的将来,上海机器人产业技术研究院将把这里布置成家庭场景,放置家电、沙发、楼梯等物件,并建成数据采集平台,随后开展人形机器人的家庭服务场景实验。
除了机器人本体和动作捕捉相机,数据采集平台还包括机器人传感器、控制器、遥操设备、通信模块和数采软件等部分。其中,机器人传感器对标人的感官系统,包含视觉、听觉、触觉和嗅觉等。它们采集的数据,对人形
机器人未来成为我们的家庭伴侣至关重要。
“无论是制造业还是服务业,人形机器人都有很多应用场景,将成为造福百姓的新质生产力。”参与项目的上海交大机器人研究所博导闫维新说,数据集项目对培育新质生产力具有重要价值— —通过构建机器人的原子动作集合,将开发出拧螺丝、用扳手、端水杯等一系列技能包。企业获得这些技能包后,可节省大量研发成本,加速新质生产力培育进程。
在这个项目中,复旦大学计算机学院研究员冯瑞负责数据质量评估和增强。由于采集到的多模态数据包含很多噪声,科研人员要进行处理,以提高数据质量。冯瑞表示,这是开发具身智能的一项基础工作,适合高校和科研机构来做,做成后通过开源为产业界提供技术支撑。
研发产业关键共性技术
在实验室里,记者还看到了多款圆形的人形机器人零部件。周梅杰介绍,它们是旋转关节,由上海机器人产业技术研究院自主研发。 ! 5