
高质量数据集生产平台是包含行业/领域元模型构建子平台、多模态数据采集-存储-预处理-数据标注-数据集管理-数据集封装-数据集开放-模型管理-运维管理等子平台等若干子系统的数据集管理平台。平台以《关于促进数据产业高质量发展的指导意见》等文件为政策依据,以解决AI大模型发展中的数据瓶颈问题和响应国家数据要素市场化战略,推动跨行业数据共享与流通等目标而建立。

整合分散数据、提升数据质量、构建标准化数据集

提供训练素材、加速算法开发、推动行业智能化升级




由中国兵器工业集团推荐,人形机器人(上海)有限公司联合第伍要素(上海)数据科技有限公司共同申报的 “人形机器人具身操作数据集” 成功入选国家数据局《高质量数据集典型案例名单》
1)搭建物理真实场景进行真机数据采集。打造了超5000平的人形机器人训练场,引入超过100台、多种构型的机器人在真实场景中进行多种任务与技能的数据采集,已累计形 成超100万条、2.5PB的高质量真机数据;
2)构建仿真场景进行数据合成;
3)打造集成化的具身数据平台,实现统一的数据管控;
4)多维度数据治理保障数据质量。统一跨本体、跨类型的数据质量评价标准,形成“场景-任务-原子技能”的采集与管理规范。
1)具身智能训练场的模式创新-打造了全国首个异构人形机器人训练场,建设了覆盖工业制造、民生服务、特种作业等多种场景的物理场景和仿真场景;
2)异构设备数据采集与治理的技术创新-实现了对青龙、智元、傅利叶、星海图、乐聚等多品牌、多构型机器人数据采集与治理的统一;
3)数据与模型协同进化的应用创新-整合数据采集、模型训练、推理部署三大核心模块,打造数据与模型双向联动的智能闭环系统。
