辛小湘丨数据“口粮”越精,AI成长越好!

黄琳   新湘评论杂志社“指点”微信公众号   2026-06-17 15:33:43

近日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》这是国家层面首次对数据赋能人工智能发展作出系统性部署

你是否有过这样的经历上下班高峰期前方一辆无人驾驶快递在路口反复启停、迟迟不通行;急着咨询一项业务,智能客服机械重复、答非所问;辅导孩子写作业,AI给出的解析不懂孩子的思维误区……

这类痛点,很多时候是“喂给”AI底层数据过于杂乱、片面。想让AI读懂大众需求、贴合生活场景,需要海量高质量的数据口粮“喂养”。

“行业高质量数据集”这个名词似乎有些硬核、有些遥远事实上,这项国家级的部署,不仅关乎国家数字领域核心竞争力与人工智能发展大局更与老百姓的生产生活、衣食住行息息相关。

放眼全球人工智能发展格局,竞争逻辑已从算法、算力的单点比拼,转向数据、算法、算力的协同博弈。法迭代日趋成熟、算力普惠加速普及,但是,行业数据仍然存在质量参差、供给分散、流通不畅、标注低端化等问题数据的“质”与“量”成为当前制约人工智能深赋能各行各业核心堵点

没有高质量数据的“喂养”,再先进的算法也难以释放数据价值,再强大的算力也难以转化为实际生产力。

此次出台的《关于推进行业高质量数据集建设行动的实施方案》紧扣数据供给、加工、流通、应用全链条,直指文本、图像、视频等多模态高质量数据集建设

方案聚焦科学研究、工业制造、农业农村等19大重点领域及低空经济、具身智能、智能驾驶5创新领域系统部署六大专项行动将数据基础能力建设上升为国家战略基建清晰传递出我国抢占数字经济发展制高点的坚定决心

海量数据从哪里来,如何融通运用?

图片

方案给出了路线图和时间表。六大专项行动前后衔接、环环相扣、层层递进如果把建设高质量数据集比作一条生产线,在供给加工前端,通过“强基扩容”标注攻坚“提质增效”三项行动,推动数据处理从劳动密集型向人机协同的智能化跃升,从源头规避标注偏差、数据失真等问题,大幅降低全社会的模型训练成本

在流通应用后端,依托“应用赋能”“管理服务”“价值释放”三项行动,探索行业高质量数据集资产化创新路径,构建以词元为基础,可量化、可定价的数据价值体系,真正激活数据要素市场。

原本分散沉淀在各行各业的闲置转化为可复用、可流通、可确权的标准化数据资产”。我们日常享受的AI便民服务,都将依托高质量数据实现迭代升级,变得更高效、更便捷、更智能。

顶层蓝图已经绘就,关键在落地见效

高质量数据集建设绝非一夕之功、一蹴而就,需要政府、企业、科研机构、行业协会等多方主体协同发力、久久为功。

图片

地方政府要做好顶层设计的“定盘星”统筹完善算力网络、数据脱敏、合规溯源等基础设施,健全数据分级分类、安全审查制度,为数据可信流通保驾护航。

市场主体要当好场景落地的“主力军”组建行业数据联合体,全面摸排行业存量数据底数,盘活内部沉睡数据资源

科研院所要做前沿技术的“攻坚队”聚焦数据标注、多模态数据治理等卡点开展技术攻关,提升数据治理能力

行业协会要成为标准引领的“润滑剂”,积极促进行业内的自律与合规建设,推动建立统一的数据标准,打造 “部门协同、领域联动”的高质量数据集发展格局。

高质量数据在人工智能服务领域有序流转一个更聪明、更贴心、更懂你的“AI时代”加速走来。


责编:万璇

一审:万璇

二审:蒋茜

三审:周韬

来源:新湘评论杂志社“指点”微信公众号

我要问