黄琳 新湘评论杂志社“指点”微信公众号 2026-06-17 15:33:43
近日,国家数据局发布《关于推进行业高质量数据集建设行动的实施方案》,这是国家层面首次对数据赋能人工智能发展作出系统性部署。
你是否有过这样的经历:上下班高峰期,前方一辆无人驾驶快递车在路口反复启停、迟迟不通行;急着咨询一项业务,智能客服却机械重复、答非所问;辅导孩子写作业,AI给出的解析不懂孩子的思维误区……
这类痛点,很多时候是“喂给”AI的底层数据过于杂乱、片面。想让AI读懂大众需求、贴合生活场景,需要海量高质量的数据“口粮”来“喂养”。
“行业高质量数据集”这个名词似乎有些硬核、有些遥远。事实上,这项国家级的部署,不仅关乎国家数字领域核心竞争力与人工智能发展大局,更与老百姓的生产生活、衣食住行息息相关。
放眼全球人工智能发展格局,竞争逻辑已从算法、算力的单点比拼,转向数据、算法、算力的协同博弈。算法迭代日趋成熟、算力普惠加速普及,但是,行业数据仍然存在质量参差、供给分散、流通不畅、标注低端化等问题,数据的“质”与“量”正成为当前制约人工智能深度赋能各行各业的核心堵点。
没有高质量数据的“喂养”,再先进的算法也难以释放数据价值,再强大的算力也难以转化为实际生产力。
此次出台的《关于推进行业高质量数据集建设行动的实施方案》,紧扣数据供给、加工、流通、应用全链条,直指文本、图像、视频等多模态高质量数据集建设。
方案聚焦科学研究、工业制造、农业农村等19大重点领域及低空经济、具身智能、智能驾驶等5个创新领域,系统部署六大专项行动,将数据基础能力建设上升为国家战略基建,清晰传递出我国抢占数字经济发展制高点的坚定决心。
海量数据从哪里来,如何融通运用?

方案给出了路线图和时间表。六大专项行动前后衔接、环环相扣、层层递进。如果把建设高质量数据集比作一条生产线,在供给加工前端,通过“强基扩容”“标注攻坚”“提质增效”三项行动,推动数据处理从劳动密集型向人机协同的智能化跃升,从源头规避标注偏差、数据失真等问题,大幅降低全社会的模型训练成本。
在流通应用后端,依托“应用赋能”“管理服务”“价值释放”三项行动,探索行业高质量数据集资产化创新路径,构建以词元为基础,可量化、可定价的数据价值体系,真正激活数据要素市场。
原本分散沉淀在各行各业的“闲置数据”将转化为可复用、可流通、可确权的标准化“数据资产”。我们日常享受的AI便民服务,都将依托高质量数据实现迭代升级,变得更高效、更便捷、更智能。
顶层蓝图已经绘就,关键在落地见效。
高质量数据集建设绝非一夕之功、一蹴而就,需要政府、企业、科研机构、行业协会等多方主体协同发力、久久为功。

地方政府要做好顶层设计的“定盘星”,统筹完善算力网络、数据脱敏、合规溯源等基础设施,健全数据分级分类、安全审查制度,为数据可信流通保驾护航。
市场主体要当好场景落地的“主力军”,组建行业数据联合体,全面摸排行业存量数据底数,盘活内部沉睡数据资源。
科研院所要做前沿技术的“攻坚队”,聚焦数据标注、多模态数据治理等卡点开展技术攻关,提升数据治理能力。
行业协会要成为标准引领的“润滑剂”,积极促进行业内的自律与合规建设,推动建立统一的数据标准,打造 “部门协同、领域联动”的高质量数据集发展格局。
当高质量数据在人工智能服务领域有序流转,一个更聪明、更贴心、更懂你的“AI时代”正加速走来。
责编:万璇
一审:万璇
二审:蒋茜
三审:周韬
来源:新湘评论杂志社“指点”微信公众号
我要问

下载APP
报料
关于
湘公网安备 43010502000374号