• 官方微信公众号
  • 电子信息产业网
  • 微博
第02版:综合新闻

《关于推进行业高质量数据集建设行动的实施方案》印发

本报讯 近日,国家数据局印发《关于推进行业高质量数据集建设行动的实施方案》(以下简称《方案》),提出到2028年年底,建成一批覆盖重点领域、经过应用验证的行业高质量数据集,打造一批数据驱动人工智能创新发展的典型应用场景,培育一批具备领先优势的创新型数据企业和专业人才,形成一批行业高质量数据集建设工具和标准。数据从供给到价值释放的良性循环基本形成,数据赋能人工智能创新发展的作用更加凸显,数据产业与人工智能深度融合,持续催生智能经济新增长点。

《方案》从国家层面首次对数据赋能人工智能发展作出系统性部署,围绕行业高质量数据集供给、流通、应用等关键环节,部署强基扩容、标注攻坚、提质增效、应用赋能、管理服务、价值释放六个专项行动,形成“场景牵引数据、数据驱动模型、模型赋能应用、应用创造价值”的“数据飞轮”,加快构建数据要素与人工智能协同演进的共生生态。

在实施强基扩容行动中,《方案》强调,要顺应人工智能加速向行业渗透,从对话向多模态生成、决策执行、具身智能、物理交互等范式跃迁的趋势,拓宽数据供给渠道,丰富数据供给类型,加快建设行业高质量数据集,为人工智能发展和应用提供充足“燃料”。例如,持续推进文本、代码、图像、音频、视频、点云、时序数据、科学数据等多模态高质量数据集建设,赋能人工智能预训练、指令微调、强化学习、测评等各阶段。加强知识库、知识图谱、本体等数据集建设,加快复杂任务规划、长程推理、人机交互、决策执行等数据集建设,赋能智能体等新型智能应用形态。加快重点场景物理交互、环境感知、运动控制等真机交互数据集建设,积极应用仿真模拟与合成技术扩大数据供给,赋能具身智能发展。

在实施标注攻坚行动中,《方案》指出,数据标注是将知识和经验注入到训练数据的过程,是行业高质量数据集建设不可或缺的关键环节。引导数据标注从“以人为主”向“人机协同、专家深度参与”的多层次标注模式转变,推动数据标注向专业化、智能化跃升。要推动数据标注转型升级,持续推动数据标注先行先试,扩大数据标注人才供给。

在实施提质增效行动中,《方案》要求,要推动构建符合结构完整性、内容多样性、标注准确性、模型适配性等质量标准、满足人工智能就绪(AI-Ready)的高质量数据集,降低训练推理成本,有效提升模型性能。要提升行业高质量数据集建设质效,推动高质量数据集标准体系建设和应用落地,强化高质量数据集质量测评和结果互认。

在实施应用赋能行动中,《方案》提出,坚持行业高质量数据集建设与实际应用深度融合,以模引数、用数赋模,促进高质量数据集建设与“数据要素×”“人工智能+”同频共振,全面赋能产业数智化转型。要打造“数据飞轮”应用闭环,打造行业应用标杆和典型案例,繁荣数据集协同发展生态。例如,着力打造集“数据集生产加工和流通利用、支撑模型训练应用”于一体的数据赋能工场,打造一批行业标杆,加速人工智能应用落地。打造一批数据赋能智能体解决实际问题的典型案例,推动高质量数据集规模化应用。

在实施管理服务行动中,《方案》指出,加强数据集管理,完善数据伦理和治理机制,推动落实数据权益相关制度,推进数据集建设体系更加规范有序。

在实施价值释放行动中,《方案》要求,发挥数据集的应用价值,以行业高质量数据集赋能人工智能发展。释放数据要素价值,推动数据集商业化、资产化,培育为数据付费的市场共识,探索以词元(Token)为基础的价值体系。发挥行业高质量数据集的应用价值,创新行业高质量数据集商业模式,探索行业高质量数据集资产化创新路径,培育为高质量数据付费的市场共识。 (吴丽琳)

2026-06-12 1 1 中国电子报 content_17396.html 1 《关于推进行业高质量数据集建设行动的实施方案》印发 /enpproperty-->