数据要素与产业加速融合 2030年我国数据产业规模将达7.5万亿元

央视网2025-05-18

央视网消息:5月17日,记者从2025数据安全发展大会上获悉,我国将培育壮大一批数据要素产业链上下游企业,预计到2030年,我国数据产业规模将达到7.5万亿元。

作为全球首个将数据纳入生产要素的国家,我国已初步构建起门类齐全的数据产业链。数据显示,2024年,我国年度数据生产总量达41.06泽字节,同比增长25%。截至目前,我国数据领域相关企业超19万家,数据产业规模超2万亿元。按照20%以上的年均增长率测算,2030年我国数据产业规模将达7.5万亿元。

国家数据局局长刘烈宏表示,当前正谋划构建横向联通、纵向贯通,协调有力的数据基础设施体系,到2029年要基本建成国家数据基础设施主体结构。

公共数据开放共享成为数据要素市场化的重要突破口。2024年,全国地市级以上的地方公共数据开放平台数量增长7.5%,开放数据量增长7.1%,高质量数据集数量同比增长27.4%。在数据要素与产业融合方面,国家正加快打通公共数据共享开放壁垒,推动公共数据与企业数据深度融合,激活海量“沉睡数据”。

构建高质量数据集加速人工智能发展

眼下,数据已超越传统生产要素,成为驱动人工智能技术突破与产业变革的核心动力。高质量数据集不仅是人工智能模型性能跃升的基石,更重塑了从技术研发到商业落地的全产业链条。那高质量数据集是如何构建的?

在浙江温州,作为全国数据要素市场化改革的“试验田”,这里构建了一套数据安全与合规体系,保障数据要素规模化流动,形成数据交易生态圈,让更多数据“活了起来”。

技术人员告诉记者,构建大模型数据集主要包含数据采集、数据清洗、数据标注、质量评估等核心环节。各环节需要根据大模型数据集的规模大、多样性足、行业垂直属性强等特点进行针对性的技术研发和适配。

数据标注与清洗是高质量数据集建设的关键环节。数据标注通过“贴标签”(如为照片标注“猫”“狗”)教会人工智能“认知世界”,未经标注的数据如同乱码教材,导致人工智能无法有效学习;数据清洗则通过剔除重复、修正错误等操作净化数据,混乱数据将直接影响人工智能训练效果。

我国数据标注产业产值超80亿

可以看到数据标注是高质量数据集建设的关键环节,那我国的相关产业发展情况如何呢?在2025数据安全发展大会发布的《2025高质量数据集研究报告》显示,随着人工智能、大模型技术迭代,我国数据标注产业产值已突破80亿元,高质量数据建设进入规模化、规范化发展新阶段。

2024年,我国开发或应用人工智能的企业数量同比增长36%,高质量数据集数量同比增长27.4%,有力支撑人工智能训练和应用。利用大模型的数据技术企业和数据应用企业同比分别增长57.21%、37.14%。

报告显示,当前我国正加速推动高质量数据集创新发展,但是仍然面临数据存量小产量低、数据集质量良莠不齐、缺乏主流高价值数据引领、数据利用效率低等问题。

大国工程看新疆丨西气东输工程惠及我国近5亿人口

2025-05-18

扎根一地 着眼全国 走向世界——浙江加快建设高能级开放强省

2025-05-18

相信中国就是相信明天

2025-05-18

多措并举打好稳就业“组合拳”

2025-05-18

多措并举打好稳就业“组合拳”

2025-05-18

“天宫”添新客!空间站发现微生物新物种 太空生物奥秘探索引期待

2025-05-18

数据要素与产业加速融合 2030年我国数据产业规模将达7.5万亿元

2025-05-18

北斗系统全面进入11个国际组织的标准体系

2025-05-18