人工智能(AI)工具正在改变科学研究的方式。AlphaFold基本解决了蛋白质结构预测难题;DeepMD大大提高了分子模拟的效率和精度;而新兴的大型语言模型,如ChatGPT等,也正在科学研究领域开疆拓土。
在《国家科学评论》(National Science Review, NSR)组织的这场圆桌讨论中,来自中、美两国的5位专家讨论了“AI for Science”(AI4S)的概念、发展、瓶颈和机遇,也分享了他们对AI与Science之间关系的理解。
张林峰:让我们从一个基本问题开始讨论:什么是“AI for Science”?
鄂维南:AI for Science是一种新的研究范式,我们使用AI工具来增强我们做科学研究的能力,这和我们用计算机来助力科学研究是类似的。具体来说,基于AI的算法可以极大地提高基于第一性原理进行建模的效率和准确性。AI还可以通过提供新的实验设计、更准确和高效的实验表征算法,甚至新的实验设备,来改进我们做实验的方式。此外,AI领域的工作流程和开源、协作的精神,也为科学研究带来启发。
Roberto Car:在我看来,AI提供了一套可以促进科学发现的工具,以机器学习和深度神经网络为代表。要做到这一点,需要开发一些具体的工具。我想在我的研究领域中引用三个例子。
首先,AI可以在量子力学和经典的粗粒度模型之间架起一座桥梁。在这一领域,AI已经极大地提高了用于分子模拟的分子粗粒度模型的精度和时间/空间范围。这种增强似乎只是一种量变,但在这些领域,量变可以产生质变。正如Philip Anderson所指出的:more is different。这类工具已经带来了新的发现。
第二个例子是,AI可以设计具有特定性能的新材料和新分子。我并没有直接从事这个领域的研究,但我知道有很多人在做这件事,而AI可以利用大量数据——来自实验、理论和模拟的数据——来预测哪些材料或分子可能更适合某些目的。
第三个例子是,AI可用于分析实验数据,比如,可以通过提高软件的信噪比来提升探针的选择性。
王涵:除了Roberto提到的这些例子,AI工具也在改变我们处理科学数据的方式。特别是,大语言模型可以非常有效地从科学数据和文献中提取出知识和关键点。
此外,AI也正在改变科学软件的开发方式,可以自动生成代码、检测软件漏洞,并为我们提供提高代码效率的建议。所有这些AI工具都大大提高了科学研究的效率。
David Srolovitz:AI确实会颠覆我们阅读文献的传统方式。过去,当我们想要对一个领域的文献进行详尽的阅读和理解,我们会让一名研究生去读这些文献,并起草一篇综述文章。但在未来,我们将可以让大语言模型来做这件事。文献数量如此庞大,我认为人类没有能力消化这么多的信息。
张林峰:除了阅读论文,大语言模型还会给AI4S带来哪些新的可能性?
David Srolovitz:我最近就在“玩”这些模型。我们尝试了其他人报道过的一个案例:让大模型去预测一种材料是玻璃、无定形体还是晶体。我们给了它15个例子,然后让它去分类另外10种材料,结果它在几秒钟内就给出答案,准确率达到70%。这很有意思,而更有意思的是,当你问模型“你为什么给出这些结果?”,它会给你理由。虽然它给出的不一定是合理的理由,但它确实能够回答这个问题。
关于这些模型的进一步开发,我认为提示工程(Prompt Engineering)是一个有趣的方向,这可以帮助我们更好地指导模型,让它们能够做更多令人惊奇的事情。
王涵:生成式模型技术对科学研究很有帮助。例如,许多科学问题需要对高维概率分布进行采样,这就是一个生成问题。在这方面已经有成功的例子,使用生成式工具,比如扩散模型和生成式对抗性网络(GAN),可以生成高维分布的样本。
另一个例子是,条件扩散模型可用于设计在给定条件下具有特定性质的分子。这为解决分子和材料设计问题提供了新的可能性。
张林峰:大模型助力科学研究的一个很好的出发点是它们的图像阅读能力。例如,可以用大模型来阅读电子显微镜照片,并从图像生成结构。
目前,我们正在尝试开发新的工具来提高大语言模型理解科学文献的能力。特别是,在文献中,分子会以文本、分子式、图像等不同形式表示,目前的模型不能很好地将这些信息结合起来,进行透彻的理解。
鄂维南:大模型可能会为新问题、新想法提供建议,还有助于将不同的学科结合在一起。
David Srolovitz:我想从偏哲学的角度谈谈人工智能和科学之间的关系。我曾认为人工智能的方法是反科学的,因为它往往是获得“答案”,而非“理解”。但科学的使命恰恰就是去获得“理解”。
不过我已经改变了想法。原因是我开始意识到,当我们能够获得很多可信的答案,这些答案将可以提供有价值的提示,去引导科学的发展。这类似于模拟。作为一名理论研究者,我总是把模拟看作是在理论成熟之前窥探答案的一种方法。
随着时间的推移,我也意识到,有些事是只有拥有大量数据才有可能实现的。海量数据使我们能够以前所未有的方式识别和理解事物。正如我刚才提到的,如果你要求大语言模型解释它们是如何得出某些答案的,它们能够给出解释。但是显然,目前它们给出的解释还不足以让我们这样的科学家满意。在可解释的人工智能方面,还有很长的路要走。
无论如何,人工智能正在改变我们做科学的方式,我认为我们正处于新科学范式的早期阶段。
王涵:我认为当前大语言模型的一个主要弱点是,它们不能像人类一样进行有逻辑的推理。这可能就是它们难以解释它们所给出的答案的原因。
David Srolovitz:没错。但是你认为,像人类一样推理能够给出更好的答案吗?我对此不太确定。
Roberto Car:我同意来自AI工具的新数据可以提供新的洞察,但是当你获得这些数据之后,仍然需要人类科学家来决定下一步需要进行怎样的分析。这是人工智能无法做到的。
人工智能的确正在产生一种新的科学研究范式,但这并不意味着传统的研究理念将被取代或抛弃。相反,传统的理论研究需要加强,才能更好地验证机器学习模型的鲁棒性。这些模型允许我们将模型预测外推到比训练发生的环境更广泛的环境中。但是通常很难在严格的数学边界上去验证这些预测。
例如,正如我提到的,在模拟中,人工智能在量子力学计算和分子模拟之间架起了桥梁。但在大规模系统中,如果训练数据中没有考虑到一定会发生的罕见事件,人工智能工具就可能会失败。也就是说,当我们需要用物理直觉和物理思维的基本工具来分析问题时,就会促进新的理论模型的发展——这些模型最终将由新的微分方程来表示,将可以比现有模型更好地描述复杂系统的动力学。
鄂维南:人工智能经常给人一种黑魔法的印象,但我认为实际情况未必如此。目前,人工智能还非常像是一个工程实验场。但我认为随着时间的推移,这种情况将会改变,人们将开始找到一些指导原则。事实上,在这个方向上已经有了很多进展,尽管出于某种原因,更大的AI社区似乎还没有意识到这些成果。所以我认为,人工智能也将会成为一个比较科学的学科。
人工智能的确更擅长获得答案,而不是理解。但这也未必一定如此。一个例子是,可以使用知识图谱来理解不同分子之间的关系。我不确定这是否已经实现,但这肯定是一个有益的方向。我们创建了一个关于经济学的知识图谱,它有助于揭示不同的经济参数是如何相互关联的。我相信这样的尝试在科学上是非常有帮助和有启发性的。
Roberto Car:在我的印象中,人工智能模型可以做常规分析,但很难做到任何需要创造力的事情。但我有可能是错的,或者在不久的将来,我将会是错的。
鄂维南:我认为人工智能可以创造,但现在要讨论细节还为时过早。
David Srolovitz:目前的生成式模型可以创作艺术品,而且我感觉它们在这方面的表现非常出色。这是创造力吗?我不确定。说到这里,我其实一直认为原子间势能是一门科学艺术。15年或20年后,科学研究可能不再遵循我们所熟悉的方式。
王涵:我对艺术作品生成模型的理解是,它们生成的图片或多或少是训练数据中已有的艺术风格的组合,而不能生成全新的艺术风格。不过实际上,大多数人类艺术作品也都是对现有艺术风格和作品的组合,而人工智能可以以创造性的方式进行这种组合。
David Srolovitz:就连科学研究也是这样,我认为大多数的研究工作都是在用新的方式去组合已有的事物。
张林峰:谁应该是AI4S的主要推动者,科学家还是科技公司?利益相关方如何相互合作?
鄂维南:我希望科学界能够成为AI4S革命的引领者。科技公司需要时间去掌握必要的科学背景知识。更重要的是,科学界一直是科学研究的主力军。未来,AI方法将全方位融入科学研究,如果我们失去了领导地位,将处于相当困难的境地,就像是在大语言模型中发生的情况一样。
David Srolovitz:很显然,没有一个研究团队能够独立创建出有竞争力的大语言模型。作为科学家,我们不应该试图写出我们自己的版本。我们应该做的是学习如何驾驭它、训练它、设计它,从而去做我们想做的事情。就像没有一个研究团队会试图建造自己的强子对撞机一样。它们是科学家们可以利用的工具。
鄂维南:归根结底,这是一个投入和产出的问题。目前,虽然已经展现出商业机会,AI4S在很大程度上仍然是一个科学研究的方向。这对资助机构来说是一个很好的机会。中国国家自然科学基金委员会就资助了支持AI4S的重大研究计划。
王涵:我认为,公司的利益可能并不总是与科学家的利益一致。如果不能产生利润,公司就不会为科学家开发工具。这可能是科学界和公司之间的主要分歧。这个分歧可以通过政府投资来填补,但我不知道这会不会足够。
David Srolovitz:现在,科学研究人员,甚至包括军事技术的研究人员,都在学习如何利用商用软件和技术去解决自己关心的科学问题。尽管这些技术不是为他们开发的,但他们也可以学会如何利用它。所以我认为,如果一些AI工具不是为科学家设计的,我们面临的挑战将是,要学习如何利用它们来做我们作为科学家想做的事情。
张林峰:开发AI4S工具,例如我们所开发的DeePMD-kit,依赖于众多社区伙伴的共同努力。在开发过程中,我们面临的挑战和瓶颈会不断转移。
最初,主要挑战在于模型设计和软件开发。随后,为了满足不同用户的需求,我们需要的是既通晓软件操作又理解科学问题的技术人才。此后,高性能计算和云计算等基础设施成为了新的瓶颈。目前,在积累了大量数据的基础上,我们有了发展大原子模型的可能性、但也因此再次面临模型和软件开发的新瓶颈。
在这个过程中,我们也致力于发展一个名为DeepModeling的开源社区,并为这些工具构建一个稳定的用户平台,叫做玻尔空间站。我们期望该界面能够像个人电脑或智能手机一样直观易用,允许不同用户自由探索并解决他们各自的问题。
Roberto Car:我不确定我们是否需要创建一个界面,将所有的AI4S工具集成在一起,但是一定程度的集成是肯定会出现的,也是非常有益的。这就需要不同的子社区之间进行更多的互动,包括模拟研究者、材料设计者、实验研究者等。
David Srolovitz:一个事实是,科学家并不擅长开发接口或者标准化工具集。科学家比公司更擅长的是提出好的问题,这对科学本身至关重要。
Roberto Car:我们同时需要公司和科学家。我们需要一个开放的环境,在这个环境中,可以轻松地交流信息,每个人都可以查看数据,并且可以自由地提出新的问题。如果我们能让这个环境维持下去,就会有很大的进步。但不幸的是,要创造这样的环境有许多困难。
David Srolovitz:对。开放至关重要。然而令人大失所望的是,每当有一项将会改变经济和社会的技术出现时,不同的国家都会试图将其发展为自己独有的优势。我对人工智能技术以及它能为科学所做的贡献非常乐观,但是这种“独占”可能会比其他任何事情都更严重地阻碍技术的发展。不过这让我想起了电影《侏罗纪公园》中那句著名的台词,“生命总会找到出路”。我认为我们最终会打破这种局面,问题是需要多长时间。
张林峰:谢谢大家的讨论。作为总结,请给出你认为AI4S目前面临的一个瓶颈,以及你的一个建议。
Roberto Car:AI4S在分子模拟领域的一个瓶颈是,它不能很好地处理电子转移现象。电子转移对于各种化学反应都是必不可少的,但由于我们还不能捕捉到精确的电子坐标,所以仍然很难模拟这种现象。要解决这一问题,不仅需要人工智能技术的发展,还需要超越当前基于基本物理定律(如波恩-奥本海默近似和密度泛函理论)的科学范式的新的建模方法。
我对AI4S的一个建议是我们已经讨论过的:我们需要尽一切努力去维持一个开放的研究环境,并按照科学的规律和方法运作。
David Srolovitz:展望未来,我真的很有兴趣看到更多关于“可解释的人工智能”的发展,去理解人工智能预测背后的道理。现在在这个领域有很多工作要做,我对此很乐观。我还认为,这些进步对科学的好处可能比对计算机科学和人工智能技术的好处更大。
王涵:对我来说,下一个重要的机会将是大原子模型。最终的目标是建立一个元素周期表的通用模型,但是这个目标可能不会在可预测的未来实现。但是大原子模型,作为原子模拟的预训练模型,在不久的将来将会实现。
大原子模型的瓶颈是数据集。训练集中的数据范围越广,模型的泛化能力就越强。但是和可以从各种来源获得语言材料的大语言模型不同,大原子模型需要的训练数据非常有限且非常昂贵,例如精细晶体结构和DFT计算结果等。
鄂维南:AI4S目前最大的瓶颈是缺乏好的数据。我的一个建议是使用新的基于人工智能的模型来生成高质量的数据。要实现这一点,我们还需要进一步提高模拟能力。例如,尽管基于人工智能的算法极大地提高了从头计算和分子动力学模拟的精度,但距离能够使用这些新工具来模拟我们感兴趣的真实系统,仍有相当大的距离,可以模拟的时间尺度仍然有限,对缺陷进行建模仍然相当昂贵。
*本文英文原文“A panel discussion on AI for science: the opportunities, challenges and reflections”发表于《国家科学评论》(National Science Review, NSR)Forum栏目:https://doi.org/10.1093/nsr/nwae119
本文来自微信公众号“知识分子”,作者 赵维杰
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0