在世界互联网大会乌镇峰会上的演讲:数智时
代的创新新要求
尊敬的各位专家学者、各位嘉宾,各位企业家:
大家好!
非常高兴能够参加这个论坛,这个论坛的主旨为“人工智能
引领科技创新和产业创新融合发展”,充分显示了浙江在这个领
域的远见和水平,就是挑出来这样一个主题作为我们这个会议的
主旨是非常到位的,我的内容就和我们这个主题尽可能地靠近,
我讲数智时代的创新新要求,就是要求科技创新和产业创新融合
发展。
刚刚公布的四中全会关于“十五五”规划的建议,科技这部
分就是“加快高水平科技自立自强,引领发展新质生产力”,具
体的有四点内容,原始创新、一体推进教育、科技、人才发展和
数字中国建设,在此前都在标题中出现过,这次新出现的就是
“推动科技创新和产业创新融合发展”,对我们做创新的学者来
说,这个提法是有一点特别的。
在我们的语境里面,“科技创新”原本就是“产、学、研相
结合,以企业为主体”,科技创新中间产业是在里面的,这次把
它单拎出来,和科技创新并列起来,而且这一条就是“强化企业
科技创新主体地位,推动创新资源向企业聚集等等,企业牵头组
建创新联合体,承担更多的科技任务”,就是不仅把产业从创新
体系中间单独放在了并列的重要地位,而且特别强调了企业在创
新中间的地位。强调这一条,我的体会就是和这个时代创新的新
特点有直接的关系,我们看两点。
一、产业在科技创新全链条中的地位更加突出
数智时代是一个新的创新范式它就是数据密集和 AI 驱动的,
DataAIforinnovation、forScience,就是创新的时代出现了,大数
据人工智能能够用原来人力达不到的方式出现,去做新的发展,
去做新的技术发明,去做新的产业应用,不仅改变了科学范式,
而且改变了创新范式。
我们看一下此前的范式。上面是创新的范式,有技术驱动、
需求拉动、耦合的、系统集成的,现在进入了 AI 和数据的驱动。
从科研范式有实验观测、理论推演、仿真计算,这些范式依然存
在,依然在发挥作用,但是在这个时代,新加了一个当前最重要
的范式,就是数据和 AI 驱动的范式。
为什么会带来非常重要的结果呢?其实我们团队在好几年
前就在研究这个问题,我们去年的诺贝尔物理和化学奖都是做
AI 数据驱动研究的,此前我们已经估计到了最新的科学发现应
该是数据驱动的研究了。
在这样一种研究范式下,产业的作用是此前不可比拟的,重
要性的提升是一个本质性的提升,和我们此前讲的“产、学、研
相结合,以企业为主体”已经完全不是一个时代了。这张图就是
最前沿的大模型是由谁做出来的,蓝色的是高校,紫色的是企业,
我们可以看到在 2014 年交叉点之前,最前沿的大模型都是高校
做出来的,我们看到飘到上面蓝色的线。2014 年之后最前沿的
大模型都是大平台、大企业做出来的,上升的曲线是很陡的,变
化的原因就是这个时代需要海量的数据,巨大的算法,海量迅速、
快速的投入和特别密集的人才,这个在任何一个高校是难以做到
的,只有大平台、大企业能够汇聚出来这样的力量。这是 2022、
2023、2024 年的,图都一样,最重要的发现都是大企业做出来
的。所以我们讲数据算力、算法的优势,使企业成为创新前沿的
引领者,而不是过去很多年企业是技术转化的头部,它已经变成
了创新的引领者了。
企业依据算法和优势,以多种方式创造新知识,不仅是做模
型。比如左边大家都熟知的谷歌团队用算法来预测蛋白质的结构,
以前是一个一个去看。在这个时代用算法预测的话,效率的提升
和原来感觉都不是一个学科了,他们在 20XX 年 4 月份开始之后
已经预测超过了 100 万个物种的 2.14 亿个蛋白质的三维结构,
它对后续生命科学中间药品和健康保健品的开发是革命性的奠
基了,你知道靶点怎么嵌进去,想要的人工合成化合物了,做非
常基础性的研究。中间是材料,就是高精度的计算材料,还有蛋
白,这都是最合适的领域,它可以迅速找到改善材料性能新分子
的结构,使材料的性能极大地改善。
中国现在电池方面材料的进展和我们用 AI 算法进行的改进
是直接相关的,除了这些之外,很多的应用场景也需要企业来作
为主体。比如说我们讲的精准医疗、精准健康,海量的个人,每
个人要知道太多的数据,不光是体检的数据、家庭的遗传、生
活物理的世界、职场、家庭、心理健康程度,需要计算的东西非
常多,才可能有真正精准、个性化的健康干预,所以需要有很多
算力和算法数据审查的能力,这个都需要在一线才能及时获得一
线创新的要素。
创新的要素我们说 VC、PE 看来好像不活跃,最重要的就是
这个时代到底什么技术能够创新成功,需要组合的因素太多了。
我们做一个新的零部件结构的创新,你需要看很多的东西,材料
支持不支持,工艺稳定不稳定,全产业链能不能匹配,商业模式
成本怎么样,市场是不是需要,市场上一条产业链上每一条线都
在创新,到底谁最后能够把全产业链匹配起来,实际上是一个智
能体的海量的匹配和计算的过程。所以这个时候真