AI怎样改变所有学科?从“工具的革命”到“革命的工具”-深度-知识分子

AI怎样改变所有学科?从“工具的革命”到“革命的工具”

2天前
导读
本文系上海人工智能实验室主任、清华大学惠妍讲席教授周伯文在2025年中关村论坛上的讲稿。在周伯文看来:科学研究,是研究者、研究工具和研究对象一切关系的总和,当前的AI for Science在单点取得了可观的进展,实现了工具层面的革新,然而要成为“革命的工具”,需要采用“通专融合AGI”方式。
4.11‍‍‍‍‍‍‍
知识分子
The Intellectual

图片来源:Pixabay.com
编者按

本文系上海人工智能实验室主任、清华大学惠妍讲席教授周伯文在2025年中关村论坛上的讲稿。

在周伯文看来:科学研究,是研究者、研究工具和研究对象一切关系的总和,当前的AI for Science在单点取得了可观的进展,实现了工具层面的革新,然而要成为“革命的工具”,需要采用“通专融合AGI”方式。


撰文 | 周伯文

 ●                   ●                    


202315日,《自然》杂志发表了一篇具有重要影响力的封面论文,对过去七十年间多个学科领域每篇论文的平均影响力进行了系统性分析。研究结果显示,尽管在这一阶段全球科研论文发表数量和专利数量持续增长,但其实际影响力却快速下降。这一现象广泛存在于生命、物理、社会等学科领域,也包括计算机科学。



与此同时,人工智能领域正在加速发展。自2012年以来,arXiv平台上的人工智能相关研究论文数量已呈现指数级增长,且在去年获得诺奖。这些宏观背景促使我们深入思考,人工智能与科学研究如何深度融合?科学论文和专利影响力下降的原因,并不是科学家的能力或素质比此前下降了,而是因为科学这座大厦经过100多年的修建已经越来越完善,每个学科变成一个小房子”——如何打通这些小房子之间的壁垒?如何让每个领域的工作带来更大影响力?这对研究者和研究工具提出了更高的要求。


在上述背景下,运用人工智能帮助科学研究已经成为普遍共识。这一共识体现在美国顶尖人工智能研究机构的行动上,例如OpenAI宣布与美国多个国家级实验室开展紧密合作,运用人工智能助力重大科研突破;AnthropicxAIThinking Machines等多家企业也把理解宇宙、帮助科学、更好地思考设为远期目标。


01

“工具的革命”正在悄然发生



从科学研究最新进展来看,在生命科学、数学、生物、材料科学等具体领域,用人工智能助力科学研究已经不再是新鲜事——科学研究工具的革命已经悄然发生。在这个重要的时间节点上,如何系统性思考,进行顶层设计,面向ScienceAI进行有组织的科研,是需要思考和讨论的重要话题。


2024年诺贝尔化学奖得主,DeepMind公司CEO Demis Hassabis在诺奖颁奖典礼上总结了适合AI发展的科研领域的三个标准:第一,存在巨大的组合搜索空间;第二,具备清晰明确的目标函数;第三,拥有大量可靠数据,或者具有高效准确合成数据的方法。这三个标准在过往的成功案例中已经得到了充分验证,但是尚未充分考虑到AI在未来三到五年的发展可能带来的巨大潜力。



我认为,AI对所有科研工作的作用都可以归纳为它如何帮助研究对象、研究工具,以及研究者三个层面。上述关于研究领域的选择标准都可以被归纳为研究工具,即如何利用人工智能更高效地解决计算问题AI for Computation。然而,完整的科学研究过程不仅包含计算环节,还涉及多个重要方面:首先是对研究对象,AI如何提升对研究对象的观察、理解和表征,这些表征最终都会转化为数据AI for Data。在这些数据的表征、理解、获取和修改等各个环节,AI分别能发挥哪些作用是一个重要问题,同时也是重大机会。其次是研究者AI for Innovator,即科学家本身。科学研究的天花板往往取决于研究者自身的认知局限。随着学科划分越来越细,要做出具有重大影响力的工作,仅靠单一领域的专业知识和经验已经远远不够。如何帮助科学家提出更好的问题、找到更有价值的研究方向,都是AI for Science应该着力解决并且可能带来巨大回报的领域。


02

AI for Science的内核到底是什么?


这就引申出另一个问题——如何定义AI for Science,如何将AI for Science翻译成中文?


针对这个问题,我们曾访谈了来自不同学科领域的上百位科学家,特别是青年科研人员。主要存在两种观点:第一种观点认为,AI for Science主要是指人工智能作为科研工具,重点在于如何具体应用;第二种观点则认为,for Science是修饰语,AI是核心词,重点是打造真正能驱动科学研究的AI这一悬而未决的问题。DemisAI科学家最后都把问题收敛成AI for Computation,而要让AI在科学研究中取得实质性突破,还有大量工作要做。


那么,什么才是for ScienceAI


科学家通常同时具备广博的通识能力和精深的专业知识,这种通专融合的能力正是优秀科学家的核心特质,这一理念也恰好与人工智能的发展趋势不谋而合。


人工智能的发展路径可以抽象成一个二维路线图:横轴表示专业深度,纵轴表示泛化能力。在Transformer架构出现之前,人工智能发展主要沿着专业深度方向推进,从深蓝到AlphaGo都是典型代表。GPT系列模型出现后,通过智能压缩,在提升模型泛化能力方面取得重大突破,但此类模型专业深度严重不足。目前学界已经开始认识到这一发展路径的局限性,通过在预训练后增加后训练来提升模型推理深度,但其专业度仍然有限。要真正通过通专融合的路径来解决科学问题,AI方面仍然有很多工作要做。


高泛化性+高专业性的右上角区域是最具价值的领域,当前的技术路线都在迂回曲折地向这个方向逼近,那么有没有更高效的方法?



在单点的科学研究上,人工智能已经成为非常重要的新型研究工具,可谓带来了工具的革命。如果能找到通专融合的突破口,就可能创造出革命的工具,进而通过工具的革命发现更具革命性的新工具。


基于对科学研究的长期思考,我认为科学研究是研究者、研究工具和研究对象一切关系的总和。任何科学研究都离不开三大要素:研究者、研究工具和研究对象。研究者在认知驱动或好奇心驱使下,选择合适的工具来理解研究对象,提出新的理论并进行验证。


在传统的科研关系中,人类研究者通常是单一领域的专家,对研究工具具备一定知识,对研究对象采用单维或低维的数据表征。AI for Science可以在多个层面发挥作用:在单一节点上,可以帮助研究者理解文献、增强计算工具的能力,或丰富研究对象的表征维度。当前的AI for Science在这些方面已经取得了可观的进展,在单点上实现了工具层面的革新。


03

AI for Science的未来:推动科研范式的系统性变革


AI的价值远不能止步于此。当我们将整个科研过程视为研究者、工具和对象三者之间的动态系统而非孤立节点时,人工智能将发挥更大价值,促成三者之间相互作用、协同演进、螺旋式上升的新型科研范式大变革,进而创造出真正革命性的工具。


具体而言,人工智能可以帮助研究者在多个方面获得提升:在研究者层面,可以帮助研究者更好地产生跨领域的想法,帮助判断哪些科研假设更具价值;在研究工具层面,能够自主构建新工具,或实现已有工具的创新性组合,完成组合爆炸;在研究对象层面,可以实现高度泛化、无损压缩和体量庞大的数据获取。一个关键问题在于,研究者对研究对象的表征往往受限于自身的认知水平,很多潜在有价值的信息由于存储或带宽限制而被舍弃。在人工智能的加持下,研究者就可以更全面、更交叉地审视研究对象,这种深入理解又会促使研究工具的改进,进而提升研究者的认知水平;认知提升后,研究者就能提出更优质的科学问题和工具组合,从而形成良性迭代循环。这正是AI for Science的最大机遇所在——不在于单点突破,而在于推动整个科研范式的系统性变革。


整个变革过程可以分为三个层次:首先是AI for Data,即对研究对象的表征;其次是AI for Computation,即对计算范式的革新;最后是AI for Innovator,即对研究者能力的提升。这三个层次最终将融合形成一个完整的闭环系统。以下为几个例子:


第一个例子是突破对研究对象的理解。我们在上海人工智能实验室开发了一个基于注意力机制的大气数据表征模型,该模型能够捕获多维特征,同时保持线性计算复杂度。通过无损数据压缩,可以在更大规模上研究气象变化。这种方法具有很高的普适性,已成功应用于神经科学和生物学等领域,获取的数据在广度和深度上相比传统方法提高2-3个数量级,使得许多以往被忽视的现象得以显现。后续还有很多工作,例如探索如何更低成本地获取高质量数据。



第二个例子是推动计算范式的革新。在气象建模中采用多模态模型进行表征,计算精度相比传统基于物理方程的方法显著提升。以一次台风登陆上海的过程为例,黄线是实际观测路径,蓝色虚线是欧洲气象中心基于物理模型的预测路径,而粉线是我们大模型的预测路径。结果显示,人工智能模型在台风登陆后的短期预报精度上比物理模型提高10倍以上,在中长期预报方面也有突破性进展。



我们主要在清华完成的蛋白质多组学数据研究PROTEUS,则进一步展示了人工智能如何融合研究对象、研究工具和研究者,并最终对科学研究形成循环推动作用。该研究的数据来源非常广泛,远超单个科学家所能掌握的范围;而且除了现有的组学数据外,全球范围内还在持续产生大量新数据。通过融合这些数据,并结合对数百万篇文献的理解,可以产生众多有价值的科研方向,包括基础研究领域的疾病机制解析、临床应用中的治疗靶点筛选等。面对如此繁杂的研究对象和海量分散的信息,很少有科学家能够全面掌握并提出最优的科学假设。传统科研模式下,科学家通常在局部数据和有限认知基础上提出假设,而这些假设是否满足全局最优则无从得知。



引入AI的研究方法完全颠覆了这一模式:首先将多组学数据视为AI for Innovator(研究对象)的扩展,采用多种方法整合这些数据;然后通过对现有文献和新发表成果的分析,自动识别数据中呈现的现象;根据现象分类,系统自动调用多种生物信息学工具进行组合分析,初步提出新的研究方向;经过深度推理后,自动生成科学假设;最后将这些假设呈现给科学家,通过人机协作方式评估其科学价值。使用以上方法在10个不同数据集上生成360多条科学假设后,将这些假设与人类科学家提出的假设进行匿名对比评估,结果显示,人工智能生成的假设在新颖性和相关性方面显著优于人类专家的假设。


需要强调的是,上述对比关注的是质量而非数量,因为在数量上AI毫无疑问具有绝对优势。这一突破性进展促使我们重新思考科学假设的生成方式,包括如何采集新数据或从新角度观察现有数据。在这个过程中,AI系统获得了一个新任务:对已有观察结果提出新的数据解析,并在此过程中构建新工具,然后对数据和工具再次提出新假设;基于这些新数据和工具,又将开启下一轮研究迭代。目前我们正在进行第二阶段工作:根据AI生成的假设设计新的观测方案和工具,开展验证实验——这意味着研究对象、研究工具和研究者三者之间已经形成了互相赋能,良性螺旋式上升的迭代循环。


以下的研究框架图可以更好地说明这一机制:研究者的主要作用是提供基础研究方向,将研究方向作为命题输入AI系统。AI系统会对研究对象、现有数据和文献进行全面分析,提出新的研究问题和对象。在传统科研中,不同科学文献之间往往缺乏联系,而AI能够发现这些潜在关联,这些新关联就是创新的科学假设。AI系统会调用合适的工具对假设进行初步验证,然后将结果反馈给人类研究者,由他们决定后续研究方向、假设验证和新实验设计。目前这一循环的基础版本已经实现,随着各个环节的不断完善,将会进一步显现更大的价值。


04

从“工具的革命”到“革命的工具”


最后总结一下核心观点:第一,For Science需要新的AI;第二,科学研究需要人工智能在包含研究者、研究工具、研究对象的全要素总和中发挥系统性作用,而非仅限于单点突破。如果AI仅做单点突破,人与人之间的交流成本还会持续提升;只有让AI发挥系统性作用,才能有效降低交流成本。由于信息吞吐率的本质差异,人与人之间的交流成本始终高于AIAI、模型与数据,因此迫切需要促进AI内部的高效信息交互,而非单纯提升人际交流效率。第三,一旦完成以上两步,AI将从工具的革命过渡到革命的工具


AI for Science目前仍处于工具的革命阶段,就像从计算器到计算机程序,无论是Basic语言、Python语言还是现在的自然语言,都是在工具上进步。但是科学革命需要革命的工具。为了推动AI for Science的发展,上海人工智能实验室创新性地启动了AI4S攀登者行动计划,打造一个科学工作者和AI工作者双向奔赴、协同攻关的新模式。该计划在今年春节前发布,目前已收到来自全世界500多个不同科研机构的申请,显示大家对AI for Science领域寄予厚望。



该计划除了强调AIScience的双向奔赴之外,也在组织模式上进行了多处创新:一是目标导向,聚焦重大科学问题攻关,要求大规模协同创新;二是紧密组织地进行科研,要求AIScience的研究人员必须在一起,组成一个初创团队;三是开放,因为这类研究课题往往没有标准答案和既定流程,需要学术机构的自由探索氛围。该计划希望通过融合企业、创业团队和学术机构的优势,形成独特的组织形式。


按照科技部的指导方针,设立以下几个重点攻关方向:一是聚焦重大科学问题的创新突破;二是沉淀共性关键技术问题,如提升AI for Science的系统性能力;三是打造产业标杆,将AI for Science的价值最终体现在新材料、新工艺等实际应用上,产生经济效益和社会效益。


目前第二批申请已经启动,采取滚动支持机制,欢迎感兴趣的科研团队积极参与。


最后给读者留下几个值得深思的问题:第一,大语言模型能解决所有科学问题吗?如果不能,我们怎么提升它的能力?第二,当前的科研评价体系是对科学家进行评估,AI与人类科学家的价值是否应该有差异化的评估体系?第三,包括推理、运行时计算等在内的Scaling Law能否带来革命的工具?是否还有新的技术路线?


以上就是今天的分享,谢谢大家。



作者简介:周伯文,上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授、电子工程系长聘教授。)


参与讨论
0 条评论
评论
暂无评论内容
订阅Newsletter

我们会定期将电子期刊发送到您的邮箱

GO