把论文,变成会动的智能体?
这样论文就不再是静态的PDF文件,研究成果不仅可以「开口说话」,还能主动帮你把事做了。
传统科研论文的阅读门槛很高,往往需要读者投入大量精力去理解论文内容。
为了解决这一难题,斯坦福大学研究人员提出了Paper2Agent,让论文一键变身AI智能体。
这样一来,学术成果可以直接被「调用」,而不用再经历从阅读、理解再到最终应用的漫长转化过程。
https://arxiv.org/abs/2509.06917
Paper2Agent是一个可将科研论文转化为「研究助手型」AI智能体的自动化框架。
而且,它还可以实现多智能体协同作业。
研究人员利用Paper2Agent成功构建了AlphaGenome智能体,用于解释基因组变异,还做了Scanpy与TISSUE智能体,用于开展单细胞和空间转录组分析。
结果显示,Paper2Agent不仅能复现原论文结果,也能准确处理新的用户请求。
Paper2Agent提供了将科研论文转化为智能体的自动化工作流。
它的核心思路,是把论文封装成一个MCP服务器。
转化流程共分为三步:
1.识别论文的关键贡献(数据集、方法、模型或工作流)。
2.将这些关键贡献封装为MCP服务器,并明确其输入、输出与使用说明。
3.将MCP服务器连接至LLM驱动的智能体,实现自然语言查询与自主执行。
Paper2Agent概述
Paper2Agent生成的论文智能体具有以下特点:
Paper2Agent基于MCP生态系统,构建了两个关键组件:
每个MCP服务器包括三个核心组件:
研究人员借助Claude Code完成了对Paper2Agent的对接与调用。
整个流程,从识别论文相关的代码库开始(图1B)。
随后,调用两个专用智能体和一个测试智能体。
完成验证后,工具与环境将被打包为MCP Python文件,可部署至Hugging Face等远程服务器。
最后,通过将MCP服务器与AI智能体连接,生成一个功能完整的论文智能体,用户就可以通过自然语言访问该论文的方法。
研究人员通过三个案例,来展示Paper2Agent如何将不同类型的科研论文转化为可靠的交互式AI智能体。
AlphaGenome Agent
基因组数据解读
AlphaGenome是一款AI模型,用于预测人类DNA中单核苷酸变异(SNV)或突变对多种基因调控过程的影响。
Paper2Agent将AlphaGenome论文转化为可交互的智能体,使用户能够自动解读基因组数据。
在无人干预的情况下,Paper2Agent在一台普通笔记本上,仅用约3小时便生成了22个AlphaGenome MCP工具,全面覆盖论文中的方法创新。
这些MCP工具可复用于未来应用,它们涵盖了单变异与批量变异评分、序列级预测、组织本体探索以及丰富的可视化功能。
研究人员进一步对AlphaGenome智能体进行了基准测试,评估其在数值与图表输出上的表现,是否可以媲美人类专家手动配置与运行代码的结果(图2C)。
结果显示AlphaGenome智能体在这些查询中均实现100%准确率,所有结果与原报告完全一致。
研究人员还演示了AlphaGenome智能体在GWAS位点解读中的应用能力,并验证了其是否能复现原论文的分析过程。
以使用AlphaGenome来解释「chr1:109274968:G>T与低密度脂蛋白胆固醇(LDL-C)相关的原因」为例(图2D),智能体构建了解决此任务的详细计划,并最终输出一份综合解读报告。
在这一过程中,研究人员还发现了Paper2Agent的重要优势:
只需一个提示词,用户即可基于独立的模型证据重新评估已发表的研究结论。
TISSUE智能体
不确定性感知的单细胞空间转录组分析
TISSUE是一篇近期发表的研究论文,提出了一种用于不确定性感知的单细胞空间转录组分析的新方法(见图3A)。
研究人员通过Paper2Agent自动生成了TISSUE智能体。
这一案例,适用于这样一个常见科研场景:
研究人员希望将新方法应用于自己的数据,但由于时间有限,很难深入理解代码库、配置运行环境,或掌握方法的特性与输入要求。
TISSUE智能体可以提供问答支持,帮助用户准备输入数据、理解方法功能,从而解决了这一难题。
对于TISSUE MCP服务器,Paper2Agent共生成了6个工具,涵盖空间基因表达预测、预测区间构建,以及面向不确定性的下游分析等(见图3A)。
值得注意的是,TISSUE智能体还可作为交互式指南使用(见图3B)。
研究人员评估了TISSUE智能体在构建空间转录组预测的预测区间方面的能力,发现智能体无需用户额外干预,便自动执行了整个TISSUE流程(见图3C)。
这说明智能体不仅能使用单个工具,还能独立完成从数据加载、预处理、插补到不确定性估计的整套分析流程。
最后,研究人员还展示了如何通过将TISSUE论文中的「数据可用性」部分转化为结构化注册表,来进一步利用MCP资源(见图3D)。
用户可以通过查询筛选出特定物种的数据集,而无需手动浏览多个数据仓库。
Scanpy智能体
用于单细胞数据预处理
Scanpy是一个广泛使用、功能强大的单细胞转录组分析工具包。
在实际应用中,研究者往往只用到Scanpy功能的一部分。
Paper2Agent不仅支持将完整方法转化为工具,也能抽取其中的关键部分,以构建更针对性的智能体,聚焦于某一特定分析任务。
研究人员聚焦于Scanpy最常见的使用场景:单细胞数据的预处理与聚类。
Paper2Agent用了约45分钟,便在一台笔记本电脑上生成了7个工具(见图4A)。
通过这些工具,用户可以通过自然语言提示让Scanpy智能体对其单细胞数据进行质控处理。
许多用户偏好从头到尾的预处理与聚类流程,即工具按既定顺序依次执行。
这类分析流程不仅常见于单细胞研究,也普遍存在于科学领域的其他复杂数据处理中。
然而,执行这些流程通常很具挑战性:AI智能体要么必须「预先知道」正确的执行顺序,要么依赖用户输入结构化良好的提示词明确指定步骤。
为解决这个问题,研究人员使用MCP提示词来规范流程。
MCP提示词提供了一种标准化方法,这些提示词由Paper2Agent直接从论文和代码库中自动推理得出,无需人工整理。
这种机制显著提高了复杂分析任务的可复现性与易用性。
例如,Scanpy智能体的MCP提示词就完整编码了一套标准的预处理与聚类流程,包括质控、标准化、特征选择、降维、图构建、聚类和细胞类型注释,并确保其按正确顺序执行(见图4B)。
研究人员使用三个公开单细胞数据集对Scanpy智能体的性能进行了评估,结果显示智能体输出的结果与人类研究者处理同样数据时的结果一致(图4C)。
这表明基于MCP提示词驱动的Scanpy智能体,能够流畅运行完整流程,使先进的单细胞分析更加易用和可复现。
作者简介
Jiacheng Miao
Jiacheng Miao现为斯坦福大学博士后,与Jonathan Pritchard和James Zou合作。在这份工作中,Jiacheng Miao与其他研究者共同提出了Paper2Agent。
2025年,Jiacheng Miao在威斯康星大学麦迪逊分校获得博士学位,导师是Qiongshi Lu和Lauren Schmitz。2019年,Jiacheng Miao在南京大学数学系完成了本科学业。
Jiacheng Miao的研究方向是构建可靠的AI co-scientists以加速科学发现,并使用Perturb-seq解释与疾病相关的基因。
2025年,Jiacheng Miao获得了NOMIS & Science青年探索者奖。
参考资料:
https://arxiv.org/abs/2509.06917
文章来自于微信公众号 “新智元”,作者 “新智元”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0