Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量
9825点击    2026-07-05 09:59

Anthropic 在 6 月 30 日发布了 Claude Science。


原文链接:https://www.anthropic.com/news/claude-science-ai-workbench


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


如果只看发布稿,这很容易被理解成“Claude 又加了一套科研插件”。但我看完之后,感觉它想做的事情比插件更重一点:它不是只帮你读论文、写代码、画图,而是想把文献、数据库、代码环境、计算资源、图表、手稿和结果审查放进一个连续的科研工作台里。


这件事对生信人很有吸引力。


因为我们日常工作里,真正消耗时间的往往不是某一个算法,而是流程太碎。文献在 PubMed,数据在 SRA、GEO、Ensembl、UniProt,分析在 Jupyter、R、命令行和服务器之间切换,稍微上点规模还要碰 SLURM、conda、scratch、路径、权限和日志。


Anthropic 给 Claude Science 的定位,就是面向科学家的 AI workbench。它宣称可以调用 60 多种科研 skills 和 connectors,覆盖基因组学、单细胞、蛋白质组学、结构生物学、化学信息学等方向;还能在本地、远程 SSH、HPC 登录节点上工作,必要时接入计算资源;输出的图表、代码、环境和消息历史也会保留,方便审计和复现。


这些说法听起来都很对。


但问题是,科研工具不能只看发布稿。尤其是生信工具,demo 里跑得很顺,不代表换到自己的服务器、自己的目录、自己的调度系统上还能顺。


所以我这次没有让 Claude Science 总结论文,也没有让它写一段脚本。


我给它做了一个更接近生信日常的实战测试:连接一台远程服务器,摸清环境,补齐缺失软件,提交 SLURM 作业,下载公开 RNA-seq 数据,建立 Salmon 索引,跑两个酵母样本的转录本定量,最后把结果取回来。


这件事不复杂,但很真实。


因为生信里很多工作不是“写一段代码”这么简单,而是卡在一堆杂事上:服务器有没有 conda?有没有 sra-tools?能不能联网?salmon 装没装?作业往哪个分区投?scratch 目录在哪里?大文件要不要拉回本地?这些问题单看都不难,但每次换环境都要重新确认。


所以我想试的不是 Claude Science 会不会写命令,而是它能不能像一个真正干活的人一样,把一件远程分析任务推进到完成。


结论先说:这次它跑通了。


但真正让我觉得有意思的,不是它成功跑出了结果,而是它在中间遇到配置问题时,知道先停下来,而不是硬投一个必然失败的作业。


热点归热点,我给它安排了一个真任务


在真正开跑之前,还有一个很关键的问题:Claude Science 到底在哪里跑这些分析?


它不是把所有东西都塞进本地聊天窗口里硬跑。我的理解是,它会先判断“这活儿应该落在哪个算力环境上”。


本地沙箱资源是有限的,当前只有 8 CPU、8 GiB 内存、没有 GPU。对于一些轻量步骤,比如解析表格、整理结果、画图、跑下游统计,本地可以处理。但生信里很多步骤不适合硬扛,比如下载 SRA、解压 FASTQ、建 Salmon 索引、跑比对或定量、处理大矩阵,这些任务动不动就超过本地内存或耗时很长。


所以我这次先在 Compute 面板里配置了一台远程主机,也就是后面提到的 99。


Claude Science 的运行方式大概是这样:先用 list_compute


 看当前有哪些远程算力,再用 compute_details


 读取这台机器的提交方式、调度系统和资源信息。如果没有远程算力,它会提示这类任务容易在本地 OOM,建议先加一台远程主机。等我把 99 配好之后,它再重新检查,并把重活投到远程服务器上。


远程作业是提交后不阻塞的模式。它把脚本和输入送到服务器,作业在 SLURM 上跑,几分钟到几小时都可以;完成后再把结果、日志和小文件回收到当前工作区。原始 FASTQ、SRA、索引这些大文件则尽量留在远程 scratch,不来回搬。


这点对生信很重要。


如果一个 AI 工具只能在本地小沙箱里跑,那它最多适合 demo。要真的处理生信数据,它必须知道什么时候该把计算派到服务器,什么时候只把结果拿回来。


于是我让 Claude Science 在一台叫 99 的远程服务器上跑一个小型 RNA-seq 冒烟测试。


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


任务目标很明确:


  • 选择两个公开的酿酒酵母 RNA-seq 双端样本


  • 下载酵母参考转录组


  • 用 Salmon 建索引


  • 对两个样本做转录本定量


  • 回收 quant.sf 和日志


  • 汇总比对率、表达转录本数量和合并 TPM 矩阵


我没有提前告诉它服务器环境是什么,也没有手动帮它准备 salmon。


这点很重要。因为我不是在测试“Claude Science 能不能运行一段我已经准备好的流程”,而是在测试它能不能先理解环境,再决定怎么跑。


第一步:它没有急着投作业,而是先摸环境


Claude Science 一开始做的事情比较像一个靠谱的生信同事。


它没有直接写脚本投作业,而是先确认 99 的计算环境:


  • 72 CPU


  • 192 GB 内存


  • SLURM 调度


  • debug 分区


  • 有 conda 和 apptainer


  • sra-tools 已安装,prefetchfasterq-dump在 base 环境里


  • salmon 没装


  • 可以联网,Ensembl 返回 200


  • 家目录所在盘剩余 114 GB


这个顺序是对的。


如果一上来就写 Salmon 流程,很容易投上去才发现环境不完整。尤其是远程服务器和集群环境,失败往往不是算法问题,而是路径、环境、权限、调度器、网络这些外围问题。


它发现 salmon 没装之后,没有把这个问题留到作业里临时处理,而是先建了一个专用 conda 环境:


/home/*/miniconda3/envs/salmon_env


里面装了 Salmon 1.10。


这一步我觉得比“会写 salmon quant 命令”更重要。因为真实工作里,能不能把环境准备和作业执行分开,决定了后面流程是否稳定。


第二步:它自己选了适合冒烟测试的数据


Claude Science 没有随便找一个大数据集开跑,而是选了两个比较小的酿酒酵母 RNA-seq 样本:


  • SRR453569:4.03M read pairs,约 355 MB


  • SRR453566:5.73M read pairs,约 500 MB


这个选择也合理。


酿酒酵母转录组小,Salmon 索引很快,样本数据量也不会太夸张,适合用来测试整条链路是否跑通。对于第一次连接一台新服务器,我更希望它先跑一个小而完整的任务,而不是一上来就上人类单细胞或大规模队列。


这也是我对 AI 跑科研任务的一个基本要求:它不只是要会执行,还要知道任务规模和测试目的匹配。


这次的目的不是发表结果,而是验证 Claude Science 能不能打通远程生信作业链路。选酵母小样本,是一个稳妥选择。


第三个细节:scratch_root 卡住了


这次实战里最有价值的细节,反而不是成功的部分,而是失败的部分。


Claude Science 写好作业后,准备提交到 99,但提交前卡住了:主机配置里没有登记


scratch_root


简单说,就是它不知道远程作业工作目录应该放在哪里。


它先在 99 上建了一个目录:


/home/*/cs_scratch


然后尝试通过提交参数绑定 scratch 目录。但连续两次发现 submit 并没有读取这个配置,问题仍然卡在主机注册级别。


这时候它没有继续盲试第三次,而是停下来告诉我:


scratch_root


是主机注册级设置,不是作业提交参数;它编辑的 details 备注文档只是给下次会话看的说明,不是实时主机配置;需要我在面板里把 scratch_root 配好。


这个细节很关键。


如果是普通聊天助手,很可能会继续改脚本、换参数、重新投,最后制造一堆看起来很努力但没有意义的失败。Claude Science 这次的表现更像一个知道边界的执行者:它能判断“这个问题不是脚本层能解决的,需要用户去改主机配置”。


于是我帮它在面板里补好 scratch_root 之后,它重新提交,作业成功进入队列。


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


这一步让我对它的定位更清楚了:它不是一个完全自动驾驶的科研系统,但它已经能承担大量“工程推进”的工作,并且在权限和配置边界处把人叫回来


作业实际跑了什么


最终提交的作业 ID 是:


9eabb346-d7cd-4942-a51f-7a098baa4d61


运行环境:


  • 主机:ssh:99


  • 调度器:SLURM


  • 分区:debug


  • 资源:8 CPU / 16 GB


  • scratch 根目录:/home/*/cs_scratch


作业做了三件事:


第一,下载酵母 cDNA 参考转录组,来源是 Ensembl release-110,对应 R64-1-1。


第二,用prefetchfasterq-dump下载两个 SRA 样本,并转成双端 FASTQ。


第三,使用 Salmon 建索引,然后分别对两个样本做 quant。


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


所有计算都在服务器上完成。大文件,比如 SRA、FASTQ、索引,都留在远程服务器上;本地只回收 quant.sf、运行日志和汇总结果。


这个设计很实用。


很多时候我们不希望把几 GB、几十 GB 的中间文件全部拉回本地。真正需要带回来的往往只是聚合结果、日志和可复查的表格。Claude Science 这次的文件回收策略是合理的:重活留远程,轻结果取回来


中间也不是一帆风顺


作业刚提交时,Claude Science 预计 10 到 15 分钟完成。


实际跑了 25 分钟还没结束。


它没有只是说“还在运行”,而是去查了实际进度。结果发现:


  • 参考转录组已经下载完成


  • SRR453569 已完成 prefetch 和 fasterq-dump


  • SRR453566 正在 prefetch


  • 第二个样本的 SRA 下载是当前瓶颈


这又是一个很真实的生信细节。


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


很多流程慢,不是因为计算慢,而是因为远端下载慢。SRA 下载速度波动很常见。能定位到“当前瓶颈在第二个样本 prefetch”,比泛泛地告诉你“作业仍在运行”有用得多。


后面作业成功完成,exit 0。


结果是否合理


最终 Claude Science 取回了两份 quant.sf 和 Salmon 日志,并汇总了结果。


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


这个结果看起来是合理的。


酵母参考转录组 6571 条 cDNA,两个样本 TPM>0 的转录本都在 6350 左右,比对率 81% 到 85%。它还检查了高表达转录本,看到核糖体蛋白、TDH3 这类高丰度基因,符合常识。


这一步不能说是很深入的生物学分析,但作为一次冒烟测试足够了。


我关心的不是这两个酵母样本有什么新发现,而是 Claude Science 能不能完成从远程环境检查到结果合理性判断的闭环。至少这一次,它做到了。


产物也整理得比较清楚


本地取回的 artifact、远程服务器保留的文件以及关键资产都列举的很清晰:


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


Claude Science 发布后,我让它在服务器上跑了一次 RNA-seq 定量


它还提醒我:scratch 是工作目录,不是永久存储;如果后面要加更多样本,可以保留索引和 FASTQ 复用;如果只是冒烟测试,可以清理工作目录腾空间。


这个提醒很像真实生信工作里的收尾动作。


很多 AI 工具能帮你生成结果,但不会提醒你远程文件到底在哪里、哪些可以复用、哪些该清理。Claude Science 这次把资产分成“本地 artifact”“远程留存文件”“服务器环境资产”三层,我觉得这个整理方式很适合团队协作。


我觉得它最有价值的地方


这次实战下来,我觉得 Claude Science 最有价值的地方不是写代码。


Salmon 定量的命令本身并不难。很多生信人都能写:


salmon index


salmon quant


真正麻烦的是把这件事放到一台陌生服务器上,并且从头到尾跑完。


它做了几类我平时很不想重复做的工作:


  • 先检查服务器硬件和调度环境


  • 判断 conda、mamba、sra-tools、salmon 是否可用


  • 发现软件缺失后单独建环境安装


  • 选择适合测试目的的小数据集


  • 提交 SLURM 作业


  • 跟踪作业运行状态


  • 定位 SRA 下载瓶颈


  • 只回收必要结果,避免搬运大文件


  • 汇总结果并判断是否合理


  • 记录远程资产路径,提示是否清理


这些工作没有哪个特别高深,但每一个都真实存在。


如果一个 AI 工具只能帮我写脚本,它只是一个代码助手。如果它能把这些上下游杂事一起处理掉,它才开始接近“科研工作台”。


这也是 Claude Science 和普通聊天助手最大的区别。


它还不能替代什么


这里要说谨慎一点。


这次测试成功,只能说明 Claude Science 在我的这个任务里,打通了远程服务器环境检查、软件安装、SLURM 提交、SRA 下载、Salmon 定量、结果回收和资产整理这一条链路。


它不能直接外推成“Claude Science 已经能接管所有组学分析”。


不是说它做不到,而是我这次还没有测试到。


这次任务本质上是一个 RNA-seq 定量冒烟测试。任务边界很清楚:两个酵母样本、一个参考转录组、一个 Salmon 定量流程。它更像是在验证“能不能把远程生信作业跑通”,而不是验证“能不能完成一个完整组学研究”。


后面至少还有几类能力需要继续测:


第一,多样本统计分析。


这次只有两个样本,没有真正进入差异表达的统计检验,也没有处理分组、批次、重复数、离群样本这些问题。下一步如果要测试完整 RNA-seq 分析,就应该让它从 sample metadata 开始,完成 Salmon 定量、tximport、DESeq2、PCA、相关性热图、MA plot、火山图和差异基因表。


第二,生物学解释能力。


这次它判断比对率 81% 到 85% 合理,也检查了高表达转录本是否符合酵母 RNA-seq 常识。但这还不等于它能可靠解释复杂生物学问题。比如换成环境胁迫、肿瘤队列、单细胞亚群或多组学整合,它能不能把差异基因、通路、文献和数据库证据串起来,还需要专门测试。


第三,复杂数据和复杂环境。


这次数据规模不大,物种也简单。后面如果换成人类 bulk RNA-seq、单细胞矩阵、空间转录组、蛋白组或多组学,数据量、环境依赖和中间文件都会复杂很多。它能不能稳定处理更大的数据、更多样本和更长流程,还不能从这次结果里直接推出。


第四,人工介入边界。


scratch_root 这次就是例子。它能识别问题,也能指出应该怎么改,但最终面板配置还是需要我来完成。这不是坏事,反而说明这种系统更适合人机协作,而不是完全无人值守。


第五,可复查和可复现。


我愿意继续用它的前提,是它能留下脚本、日志、路径、参数、环境和产物。没有这些,AI 跑出来的结果再快,也不适合进入严肃分析。这次它在这方面表现不错,但后面流程变长以后,还要继续看它能不能把证据链保持住。


所以这一节不是给 Claude Science 下结论,而是给这次测试划边界。


第一期我只能说:它把一个真实远程 RNA-seq 定量作业跑通了。


但这个“只能说”,其实已经不低了。


因为它不是在一个准备好的 notebook 里运行几行命令,而是在一台真实服务器上完成了环境探测、依赖安装、scratch 配置排查、SLURM 投递、下载进度跟踪、结果回收和资产整理。这里面任何一步出问题,普通 AI 聊天助手都很容易停在“给你一段建议”。


Claude Science 这次至少证明了一点:它已经不只是能告诉我怎么做,而是能在一定边界内替我把事情推进下去。


至于它能不能从文献问题出发,选择数据集,跑完整差异表达,再把结果解释成一个可审查的小型组学分析,这是下一期要测的内容。


这次测试给我的判断


Claude Science 这次让我看到的,不是一个“更会聊天的 Claude”,而是一个能接入真实计算环境的科研执行层。


它的价值不在于替代生信人,而在于替你处理那些重复、琐碎、但必须认真做的流程工作。这个能力如果稳定下来,对生信人是很有吸引力的。


如果你每天只是让 AI 改几段代码,Claude Science 可能显得有点重。


但如果你的工作经常涉及远程服务器、SLURM、conda 环境、公共数据库下载、分析流程追踪、结果回收和团队复用,那它的意义就不一样了。


不是因为这次 Salmon 定量有多难,而是因为它证明了一件事:AI 工具开始能从“给建议”走向“接作业”。它不只是告诉我该怎么做,而是真的在服务器上把任务跑完,并且把中间资产整理清楚。


这对生信人来说,是一个很重要的变化。


过去我们说 AI for Science,很多时候还停留在“模型能不能解决科学问题”。但这次测试让我觉得,另一个同样重要的方向是:AI 能不能把科研里的工程杂活组织起来。


生信工作本来就站在科学问题、数据资源、计算环境和软件流程的交叉点上。谁能把这些碎片连接起来,谁就能真正改变工作效率。


Claude Science 现在还只是 beta,也肯定还有很多边界需要测试。


但至少这一次,它不是在 demo 里看起来有用,而是在一台真实服务器上,把一次 RNA-seq 定量作业跑完了。


这已经足够让我认真关注它的下一步。


以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~


谢谢你看我的文章,我们,下次再见。


文章来自于微信公众号 “生物信风港”,作者 “生物信风港”

AI转型,免费服务,就找AITNT