他们从四家顶尖AI实验室辞职,打造能自己跑实验的AI系统,目标是让科学家实现Vibe Research

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
他们从四家顶尖AI实验室辞职,打造能自己跑实验的AI系统,目标是让科学家实现Vibe Research
8092点击    2026-06-26 10:21

他们从四家顶尖AI实验室辞职,打造能自己跑实验的AI系统,目标是让科学家实现Vibe Research


Harsh Mehta 在 Anthropic 的时候,启动了一个后来被称为 autoresearch 的内部平台(不是 Karpathy 那个)。最初这个项目只有他一个人,功能是让 AI 自主完成 AI 研发中的一系列流程环节:提出实验假设、编写代码、调度算力、评估结果,再决定下一步做什么。


他一个人搭出雏形后,这个平台逐步扩展成 Anthropic 内部的核心研发能力之一。


2025 年 12 月,Mehta 和同事 Behnam Neyshabur 一起离开 Anthropic,他决定将之前工作扩展成一家公司。2026 年初,两人在旧金山注册了 Mirendil,致力于构建一套能自主循环处理 AI 研发问题的系统。6 月 25 日,公司正式亮相,同时宣布完成 2 亿美元种子轮融资,由 a16z 和 Kleiner Perkins 联合领投,英伟达跟投,估值约 10 亿美元。


他们从四家顶尖AI实验室辞职,打造能自己跑实验的AI系统,目标是让科学家实现Vibe Research

图丨Mirendil 团队(来源:X)


今年 3 月,就有报道称这家公司正在以 10 亿美元估值谈判 1.75 亿美元融资,当时轮次尚未关闭。最终金额超过了彼时的报道。对一家成立不到半年、团队只有 20 人的公司来说,2 亿美元的种子轮,在整个硅谷融资记录里也称得上罕见。


不过,在顶尖人才贵得离谱的硅谷,这个团队的履历在某种程度上也确实配得上这个估值。


Neyshabur 是 SAM 优化器的共同发明者。在 Google 时,他曾联合领导 Minerva 项目,这是最早能够进行复杂数学推理的大模型之一;之后,他又参与了 Gemini 在数学和代码方面的预训练工作。


到了 Anthropic,Neyshabur 联合领导 Discovery 团队,目标是构建 AI Scientist,同时也参与了 Claude computer-use 功能背后的研发工作。


Mehta 则是 Anthropic 的高级研究科学家。除了独立搭建 autoresearch 平台的初版,他还负责将这套自动化研发能力在公司内部规模化推广。


另外两位联合创始人,则补上了工程和执行力的拼图。Shayan Salehian 是 xAI 的早期工程师,从 Twitter 时代就在公司,后来参与了 Grok 模型的后训练、推理和 Agent 基础设施,哪里最关键就出现在哪里。


Tara Rezaei 今年 23 岁,MIT 毕业,奥赛奖牌得主,曾在 OpenAI 做早期学生研究员。


目前,Mirendil 创始团队一共 20 人,分别来自 Anthropic、xAI、Google DeepMind 和 OpenAI 四家机构。


Neyshabur 在 a16z 发布的一段访谈中解释了 Mirendil 背后的思路。


科学家和工程师最核心的能力,是在某个领域持续深入,积累出越来越精细的专业判断。但越深入,专长也会越窄,覆盖的只是所有可能研究方向中很小的一块。而几乎所有科学领域的进步,又都依赖这种持续深入的能力。


Mirendil 要做的,是让一个 AI 系统也能够被指向某个特定方向,然后快速迭代、快速变深。Neyshabur 把这称为“self-accelerating AI”。


落到产品上,Mirendil 训练的是专门擅长 AI 研发任务的前沿模型,再围绕这些模型搭建一整套系统,让它能够自主提出实验方案、调配 GPU、跑训练、比较 checkpoint、评估结果,然后进入下一轮循环。


a16z 在投资博文中的形容是:这像一个专为 AI 研究构建的编码智能体,只不过它能够控制自己的 GPU。


这件事的逻辑起点,来自团队对当下 AI 研发现状的观察:今天,任何一个想用 AI 做药物发现或材料科学研究的实验室,首先都得把自己变成一个前沿 AI 实验室。这个门槛太高了,需要数百亿美元资金和数十万块 GPU。


Mirendil 赌的是,这个门槛可以被大幅压低。如果 AI 研发本身可以被自动化、被产品化,那么掌握领域知识的科学家,就不再需要同时掌握大规模训练的全部工程能力。


a16z 在博文里把这个愿景称为“vibe research”:让不那么技术化的用户,也能跑自己的前沿实验。


a16z 还用 Cursor 举了一个例子,说明他们为什么看好这条路径。Cursor 最初完全依赖第三方模型,后来开始基于开源模型构建自己的 Composer 模型,现在已经开始在 SpaceX 做前沿模型的预训练。


产品的性能和经济性,在每个阶段都有提升;而建模工作本身,也会像大实验室的集中式研发一样不断积累和复利。并不是每个组织都需要走到预训练这一步,但大多数组织都会因为能够自主跑实验、更新模型权重而获得实际收益。


a16z 的博文里还提出了一个更大的判断框架。他们认为,AI 能力的真正民主化需要两样东西:一是可供任何人扩展的前沿开源模型,二是实验室级别的研究平台,让普通工程师也能做前沿 AI 工作。


Mirendil 定位于第二个。至于第一个,a16z 写道:“这个缺口目前由中国模型填补,但这可能不是长期解决方案。”


这句话的潜台词并不难理解。在美国头部 VC 眼中,当前开源前沿模型领域由中国公司主导,是一个结构性事实。DeepSeek、千问以及 GLM,都是绕不开的名字。


但他们不认为这个格局是稳态,也不打算长期依赖它。投资 Mirendil,在某种意义上也是对这种焦虑的回应:如果不能确保开源模型的自主供给,那至少可以投资一个能降低整个 AI 研发门槛的平台层。


参考资料:


1.https://a16z.com/announcement/investing-in-mirendil/


2.https://t.co/HGdS8Gwt9W


文章来自于"DeepTech深科技",作者 "加洋"。

AI转型,免费服务,就找AITNT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md