专访斯坦福Arc创始人Patrick Hsu:独家揭秘未来AI制药路线图

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
专访斯坦福Arc创始人Patrick Hsu:独家揭秘未来AI制药路线图
5877点击    2025-06-29 12:46

Arc 研究所创始人 Patrick Hsu 访谈实录


来源:Arc Institute's Patrick Hsu on Building an App Store for Biology with AI


整理:Charles


AI新药价值论 原创编译 转载请注明


Arc 研究所(Arc Institute)由联合创始人 Patrick Hsu 等人创立,作为CRISPR先驱张锋的得意弟子之一,Patrick致力于将前沿 AI 与生物学融合以重塑科学发现。近期,他与合作者创建了名为 EVO 2 的生物学基础模型,该模型通过学习生命的基础信息层——DNA,来解释和生成跨所有生命领域的基因序列。


专访斯坦福Arc创始人Patrick Hsu:独家揭秘未来AI制药路线图


在本次访谈中,作为基因组编辑和生成式生物学领域的先驱,Patrick Hsu 分享了他对 AI 与生物学结合的看法,详细介绍了 EVO 模型的原理、在药物研发之外的广阔应用,以及他对科研范式、瓶颈与未来图景的思考。他认为,AI for Bio 的潜力远不止于药物设计,更在于构建一个对生物学全尺度的综合理解。


目录


• 01 AI for Bio 的真正瓶颈与广阔前景


• 02 EVO 模型:直接从 DNA 学习分子逻辑


• 03 愿景:为生物学构建一个“应用商店”


• 04 AI 如何影响药物研发的流程与文化


• 05 未来预测:从虚拟细胞到编程生理学


01. AI for Bio 的真正瓶颈与广阔前景


关于 AI 新药研发的现状


Patrick Hsu:即使我们能完美设计出无数药物分子,仍然必须在动物和人身上进行测试,这才是真正的瓶颈。通过监管流程需要数年时间。我想强调一点,机器学习在生物学领域的应用(ML for Bio)不仅仅是药物设计,这只是生物学潜力的一个重要但狭窄的部分。


关于生物学的统一理论与 AI 的应用


Patrick Hsu:我一直对一个想法很感兴趣:生物学其实有一个统一的理论——进化论。它作用于生物学的所有尺度,从行星到生态系统,再到个体、细胞和分子。我们实验室训练了一系列名为 EVO 的模型,灵感就来源于此,试图将生物序列与生物功能直接联系起来。


诺贝尔奖曾授予蛋白质领域的 AI 应用,但蛋白质只是由 DNA 编码的一部分。作为基因组生物学家,我认为生命所需的一切,包括 RNA 和调控元件,都编码在 DNA 中。因此我们提出疑问:能否直接在基因组上训练一个长上下文模型,让它通过理解 DNA 中嵌入的所有信息,学习分子相互作用如何导致生物功能?事实证明,这种方法非常有效,例如我们的模型在预测致乳腺癌突变方面已是同类最佳,并能设计新的 CRISPR 系统。


02. EVO 模型:直接从 DNA 学习分子逻辑


关于 EVO 模型的工作原理


Patrick Hsu:你可以将 EVO 理解为一个高效的长上下文模型,它通过“预测下一个碱基”的方式进行训练。就像语言模型通过预测下一个词来学习语法一样,EVO 通过预测下一个碱基、氨基酸或基因,学会了构成一个细胞的分子逻辑。


一个具体的应用是解读“意义不明的变异”(VUS)。基因测序会发现大量突变,除了少数已知的致病突变,大多数突变的功能我们并不清楚。科学家们称之为 VUS,这其实是一种花哨的说法,意思是“我们完全不知道这是怎么回事”。但 EVO 模型对这些突变有自己的“看法”,并且在判断其是否致病方面,表现达到了顶尖水平。


关于为何不进行“实验室在环路中”的湿实验


Patrick Hsu:我们从 DNA 入手,原因有二。首先,我们认为 DNA 是生命最基础的信息层。其次,从实用角度看,这是我们拥有数据最多的地方。这些数据来自整个科学界,过去超过 25 年里,所有发表论文的测序数据都必须上传到公共数据库,如“序列读取档案”(Sequence Read Archive)。这里汇集了地球上几乎所有物种的基因组。


可以说,进化本身就是一场已经完成的宏大实验。正是基因突变让我们彼此不同,也让我们与其它物种不同。我们的模型通过观察这个包含数万亿 Token 的庞大数据集来学习其中的规律。这就是 EVO 系列模型的核心洞见:如果你能准确预测下一个碱基,这个碱基或许就决定了你是健康,还是会患病。


03. 愿景:为生物学构建一个“应用商店”


关于从序列直接到功能


Patrick Hsu:像 AlphaFold 那样遵循“序列-结构-功能”的路径非常优美。但我们使用 EVO 的方式更直接,就像使用 ChatGPT:DNA 进去,DNA 出来。有趣的是,我们人类并不擅长说“DNA 语言”。使用 EVO 的感觉,就像你在使用一个俄语模型,但其中只有 1% 的词是英语。你需要构建大量的注释和可解释性工具来理解模型的输出。我们对生物语言模型的提示工程探索才刚刚开始。


关于 EVO 开源后的生态


Patrick Hsu:我希望是每一个人都来参与。当一个工具能显著降低使用门槛时,它就会变得有用。我相信未来会出现一个由各种模型组成的“动物园”,不仅用于分子建模,更会覆盖科学方法的每一步。如果 2025 年是“AI Agent之年”,科学智能体将是一个巨大的热点。我们希望在 EVO 这样的基础层之上,人们能构建一个生物学的“应用商店”。


关于 Arc 研究所的角色


Patrick Hsu:我们创立 Arc 的初衷,是希望有一个“母舰”,能够支持长期的、多学科交叉的研究,以攻克那些单一大学或公司难以解决的重大问题。我们不以在顶级期刊上发表论文为首要目标,而是更关心能否创造出有形的、能被广泛使用的技术和平台,并最终真正治愈某些疾病。


04. AI 如何影响药物研发的流程与文化


关于 AI 在药物开发中的作用


Patrick Hsu:这是一个非常深刻的问题。制药公司大部分的钱都花在了药物开发(development)上,而非药物发现(discovery)。AI 在这里确实大有可为。目前,AI 的一个实际用途是处理海量的监管文件,进行总结和撰写。


但更根本的是,这个行业的成功率大约只有 10%。为什么 FDA 监管如此严格?因为如果 90% 的药物最终都会失败,他们必然会极度关注安全性。AI 的承诺在于,如果我们能将成功率从 10% 提升到 20%、30% 甚至 50%,整个行业的逻辑都将被改变。


关于 AI 对科研文化的影响


Patrick Hsu:过去的科学论文充满了远见和宏大叙事,而今天的论文则非常务实,文化氛围是“给我看数据”。这是因为我们缺乏预测能力,一切都得在实验室里通过“猜测和检验”(guess and check)来完成。而模型的价值在于,一个即使只有中等预测能力的模型,也足以带来变革。当模型有了预测力,人们就会更愿意相信预测结果,这会成为一种新的证据,从而改变科研文化,让研究不再那么依赖繁琐的试错。


关于模型动物到人体的转化难题


Patrick Hsu:因为这些都是不完美的模型。我们之所以要按部就班地走完细胞、类器官、小鼠、猴子、人体的实验流程,正是因为我们没有预测能力,所以必须在真实世界中一步步验证。这个过程耗时耗力。预测模型的希望不仅在于其预测能力本身,更在于它能让你以大规模并行的方式模拟实验。你可以同时运行一万个智能体进行虚拟测试,而不需要花费五年时间和数亿美元去等待一个结果。要实现这一点,我们需要一个值得信赖的“预言家”(trusted oracle)。


05. 未来预测:从虚拟细胞到编程生理学


关于对未来的时间表预测


Patrick Hsu


  • 到 2025 年:我希望我们能实现“即点即用”地设计出功能完整的抗体药物,并能从头设计全新的酶。


  • 到 2030 年:我的预测是我们能拥有准确且有用的“虚拟细胞”模型。我们需要为细胞建立一个类似蛋白质数据库(PDB)的预训练数据库,这将帮助我们设计更好的药物靶点,提高新药研发的成功率。


  • 到 2050 年:希望远早于此,我们能看到科学超级智能的出现,实现科研方法的端到端闭环,拥有一个完全自动化的、垂直整合的湿实验平台。


关于更前沿的研究方向


Patrick Hsu:我花了很多时间思考如何编程生理学(program physiology)。我们通常思考的生物编程是药物范式,如分子如何结合蛋白。但想想激素或者像 Ozempic 这样的药物,它们能以非常强大的方式编程你的思维、感受和行为。


我们实验室正在深入研究内感受(interoception)——即你的身体如何与大脑对话。例如,运动后的“跑步者高潮”与肠道中的一种特定细菌有关,它能产生一种分子,通过神经系统促使大脑释放多巴胺。反过来,长期的心理压力也会通过大脑信号引起肠道炎症甚至溃疡。如果我们能理解并调控这些深层机制的“旋钮”和“开关”,就可能开创一种全新的药物范式,不再是还原论的“分子-靶点”模式,而是更接近整体的、让你“感觉更健康”的模式。


文章来自于微信公众号“AI新药价值论”,作者是“Charles”。


关键词: EVO 2 , AI访谈 , Arc , Patrick Hsu , AI制药
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md