本报讯 (樊威 李荪 记者 邓淑华) 近日,中国信息通信研究院联合中国电信集团有限公司、沈阳市大数据管理局等多家单位共同编制的《数据标注产业发展研究报告(2025)》(以下简称《报告》)对外发布。
《报告》显示,目前,我国已建设四川省成都市、辽宁省沈阳市、安徽省合肥市、湖南省长沙市、海南省海口市、河北省保定市和山西省大同市7个数据标注基地,7个数据标注基地总规模现已达到1.7282万TB,相当于中国国家图书馆数字资源总量的6倍左右,共引进和培育标注企业223家,标注从业人员达5.8万人,带动数据标注行业相关产值超过83亿元。
近年来,随着人工智能(AI)迅猛发展,高水平数据标注的关键作用日益凸显,成为连接数据、算法与实际应用的桥梁。2024年12月,国家数据局印发《关于促进数据标注产业高质量发展的实施意见》,标志着数据标注产业已纳入国家战略布局,以“小切口”服务“大视野”达成行业共识。然而,当前该产业尚面临技术创新不足、标准体系不完善、部分企业认知模糊等问题。
《报告》全面分析了数据标注产业的发展现状,系统梳理了其在技术创新、行业赋能、生态培育、标准应用、人才培养和安全保障等六大核心要素方面的实践与进展,客观指出当前产业存在的问题与发展趋势,并提出一系列切实可行的发展建议。
数据标注产业发展的核心要素涵盖上述六大方面。我国通过建设高效标注平台、培养专业人才队伍、利用自动化工具、实施数据安全措施、制定行业标准、促进跨界合作与创新应用,全面推动数据标注产业进步。
作为人工智能发展的重要基石,数据标注产业呈现高技术含量、高知识密度和高价值应用“三高”特征,发展前景广阔。但同时,该产业仍面临顶层设计有待完善、高端人才短缺、技术创新能力不足、专业平台能力不足等挑战,需持续优化产业生态。
为推动数据标注行业发展,《报告》建议,不断加强数据标注技术创新能力、持续提升数据标注行业赋能水平、积极完善数据标注生态体系、大力推动数据标注标准编制和应用、着重强化数据标注人才培养力度、切实保障数据安全可靠。