国家政策力挺,数据标注产业迎来黄金发展期
近日,国家发展改革委、国家数据局、财政部、人力资源社会保障部四部门联合发布《关于促进数据标注产业高质量发展的实施意见》(以下简称《意见》),为数据标注产业发展指明方向,也标志着该产业正式进入政策扶持的快车道。
《意见》中明确提出,要培育一批数据标注龙头企业,鼓励企业规模化、标准化、集约化发展,支持科技创新型企业承担重点任务,提高产业链协同创新水平。到2027年,数据标注产业规模将大幅跃升,年均复合增长率超过20%。这为数据标注产业未来的发展描绘了一幅蓝图,也预示着巨大的市场机遇。
数据标注:AI发展的基石
数据标注是人工智能技术研发中不可或缺的一环,它为AI模型提供“燃料”,是AI算法训练的基石。简单来说,数据标注就是为文本、语音、图片、视频等数据“打标签”,让机器能够理解和学习这些数据。
随着人工智能技术的快速发展,数据标注的需求也日益增长。自动驾驶、低空经济、智能制造、智慧医疗等新兴产业,都离不开高质量的数据标注。目前,我国数据标注产业规模已达800亿元左右,未来增长空间巨大。
技术突破:跨领域跨模态语义对齐、4D标注、大模型标注
数据标注领域的关键技术突破主要体现在三个方面:跨领域跨模态语义对齐、4D标注和大模型标注。
- 跨领域跨模态语义对齐:实现不同领域、不同模态数据之间的语义统一和互通,提高数据标注的准确性和效率。
- 4D标注:对动态场景中的物体进行三维空间位置和时间信息的标注,应用于自动驾驶、虚拟现实等领域。
- 大模型标注:针对大型语言模型和多模态模型的数据标注,需要更高水平的专业知识和技术。
A股上市公司积极布局
多家A股上市公司已布局数据标注相关产业,例如海天瑞声、格灵深瞳、云天励飞、博彦科技等。这些公司主要围绕市场需求,积极开发数据标注产品和服务,并逐步实现产业化和规模化。
- 海天瑞声:在4D数据标注领域积累了丰富的经验,其DOTS-AD平台已在部分车企落地,相关业务收入占总营收的比例接近两成。
- 云天励飞:数据标注作为其AI模型训练的“生产要素”,主要用于提升数据规范性和模型训练效率。
- 格灵深瞳:自建数据标注平台,通过人工标注加AI模型自动化预识别的方法,为算法提供精准的基础训练数据。
产业升级:从劳动密集型向智能化转型
过去,数据标注行业较为依赖人工,属于劳动密集型产业。随着人工智能技术的进步,人机协作模式逐渐成为主流,智能化程度不断提高,从而提高了机器处理数据的效率,减少了人工参与。
未来展望
《意见》的发布为数据标注产业发展带来了重大利好,将进一步规范行业标准,提升数据质量,促进产业链协同发展。随着人工智能技术的不断发展和应用场景的不断拓展,数据标注产业必将迎来更加广阔的发展前景。这不仅是技术层面的革新,更将推动整个AI产业链的升级,为数字经济发展注入新的动力。 二级市场表现方面,相关上市公司股价也反映了市场对该产业的积极预期。