吕鑫 湖南日报·新湖南客户端 2025-04-30 21:04:59
湖南日报·新湖南客户端4月30日讯(通讯员 吕鑫)4月29日,在第八届数字中国建设峰会“高质量数据集和数据标注”主题交流活动上,国家数据局正式发布了全国数据标注优秀案例集名单。在首批入选的全国47个优秀案例中,长沙占到3席,入选案例数量位居全国前列,充分彰显了长沙作为全国首批国家数据标注基地的硬核实力。
在 2024 年 5 月的数字中国建设峰会上,长沙凭借其丰富的音视频文创等行业数据资源、优质的高校科研人才资源以及完备的人工智能产业链,成功入选承担国家数据标注基地建设任务的 7 大城市之一。长沙以建设国家数据标注基地为契机,加快推动数据赋能“文化+科技”融合发展,以马栏山视频文创园为龙头,打造全球高质量音视频文创数据特色开发基地。出台专项政策14条,布局1个综合标注基地和7个行业标注基地,成立省级产业联盟和市级标注协会,发布全国首个城市级标注产业图谱,吸引蚂蚁集团、阿里集团、海天瑞声等龙头企业落户。建成医疗、文旅、工业等高质量数据集36个,规模达1.5万TB,带动相关产值超40亿元,相关成果和经验在全国数据标注基地先行先试现场会上获推介。
长沙此次入选的《AI手语翻译数据标注赋能无障碍信息建设》等3个案例是长沙国家数据标注基地建设成果的生动缩影,充分体现了长沙在数据标注技术研发、行业赋能、场景创新、人才培养和产业链协同发展方面的突出优势。
《AI手语翻译数据标注赋能无障碍信息建设》由长沙千博信息技术有限公司和湖南省马栏山计算媒体研究院联合申报。该项目通过“以点带面”的线上推广方式,组建了一支超 750 人的手语标注团队,并结合数据增强技术模拟出更多样化的训练样本,成功打造了手语翻译模型。该模型已落地近千家机构应用,市场覆盖率达 90%,有效破解了全国听障人群在教育、就业、办事等多领域的信息获取障碍,为无障碍信息建设提供了有力支撑。
《铁塔视频数据标注赋能多领域智慧监测》由湖南省第二测绘院和湖南天湘和信息科技公司共同申报。该项目针对铁塔视频数据,构建了完善的采集标注规范体系,并基于 DeepSeek、文心大模型等先进技术,结合样本增强、虚拟场景融合、半监督学习等算法,实现了标注流程自动化率 72.8%,建成了中南地区规模最大、应用领域最多的铁塔视频样本库,综合成本降低 64.5%。其数据标注成果已赋能自然资源、农业农村、水利、林业、应急等多个领域的智慧应用,智能提取并推送秸秆焚烧、河湖四乱、森林火情等各类问题线索 17.7 万条,节约经济损失约 145 亿元。
《数据标注专业人才产学融合培养平台》由长沙谱蓝网络科技有限公司申报。该项目针对数据标注行业面临的标注人才短缺、社会认可度低、人员成长慢等问题,创新发展校企产学融合模式,打造了实习实训平台,并组建了标注培训师队伍、建立了技能培训认证体系、打造了智能培训工具、制定了人才晋升通道和成长保障机制,构建了系统化的人才培养模式。10 年来,该平台已为社会和企业培养了万余名标注人才,与国内 50 多所高校建立了稳定的校企合作关系,2024 年实训时长超 10 万课时。通过该平台的努力,数据标注人才的社会认可度显著提升,人才成长周期缩短 25%,数据标注质量达 99%,骨干团队年度留存率超过 90%,为数据标注行业的可持续发展提供了坚实的人才保障。
责编:李玉梅
一审:李玉梅
二审:王文
三审:刘永涛
来源:湖南日报·新湖南客户端
我要问