在 2026 世界智能产业博览会开幕式上的致辞
各位领导,各位嘉宾,朋友们:
大家上午好!
很高兴来到美丽的渤海之滨天津,参加 2026 世界智能产业
博览会,我谨代表国家数据局对大会的召开表示热烈祝贺。
当前,人工智能发展呈现出鲜明的“数据驱动”特征——数
据的规模、质量、结构,深刻影响模型的智能水平和应用边界,
从数据的角度看,AI 就是数据的精炼厂。2025 年,我国数据生
产总量达到了 52.26 泽字节(ZB),占全球的 27.44%;用于人工
智能训练和推理的数据总量为 199.48 艾字节(EB),同比增长
42.86%。其中,推理数据量首次超过了训练数据量,达到 101.34
艾字节(EB)。这说明,人工智能正在从“训练驱动”向“训练
与推理双驱动”加速演进,在各行业的渗透和应用呈现爆发式增
长。
在工作实践中,我们形成并深化两个导向:
一个是“人工智能发展到哪里,数据工作就跟进到哪里”,
这是数据要精准适配人工智能发展范式变迁。
另一个是“人工智能赋能行业发展到哪里,行业高质量数据
集建设和服务就跟进到哪里”,这是数据要紧跟人工智能的行业
落地与场景应用。这两个“到哪里”已形成广泛社会共识。
下面,围绕数据赋能人工智能创新发展,我谈三点体会和思
考。
一是高质量数据集是先进制造业智能化升级的基础资源和
创新引擎。我们支持工业制造领域的链主和先行先试单位,围绕
汽车制造、船舶工业、轨道交通、有色金属等重点细分方向,建
设行业高质量数据集,目前已形成约 2.8PB 的数据规模,有力支
撑了人工智能在工业制造场景的深度应用。
人工智能在制造业的应用,已经深入到研发设计、生产制造、
质量检测等关键环节,只有把真实产线、设备运行和质量检测等
数据系统采集、治理和利用起来,才能更好支撑行业大模型和智
能体理解工业机理、适配工业场景、优化工业流程。要加大对行
业高质量数据集的投入,推动模数共振,促进数据、模型、装备、
场景深度融合。
二是高质量数据集是具身智能“感知-决策-执行”的重要基
础。具身智能有效带动机器人本体、精密传感器、具身数据等产
业链协同发展。依托视觉、触觉、音频等高质量、多模态训练数
据的支撑,人工智能才能在物理环境中进行感知决策,才能具备
在真实环境中的自主适应与任务执行能力。
今年 4 月 19 日举办的第二届“北京亦庄半程马拉松暨人形
机器人半程马拉松”比赛,首次设置了“自主导航组”,相比 2025
年首届比赛中机器人主要依赖遥操作,本届赛事自主导航参赛队
伍占比已达 38%,显示具身智能机器人正加速向“全自主”阶段
迈进。这次比赛中,获得冠军的机器人的成绩是 50 分 26 秒,打
破了人类的半程马拉松记录,比世界记录快了 6 分 54 秒。
我们观察,取得好成绩的企业,他们有一个共