全球首个自主科研Agent挑战赛!零人工干预冲击CNS成果SOTA,科研变天?
全球首个自主科研Agent挑战赛!零人工干预冲击CNS成果SOTA,科研变天?如果科研中的文献阅读、代码演进、实验验证都可以由智能体自主完成,科学发现的方式会被重新定义吗?自主科研智能体(Autonomous Research Agent)的兴起,正在把这一设想带入现实:科学家有望回归科学品味和探索源头,智能体承担科研全链路的繁琐工作,两者在人机协同的闭环中共探新的重大科研突破。
如果科研中的文献阅读、代码演进、实验验证都可以由智能体自主完成,科学发现的方式会被重新定义吗?自主科研智能体(Autonomous Research Agent)的兴起,正在把这一设想带入现实:科学家有望回归科学品味和探索源头,智能体承担科研全链路的繁琐工作,两者在人机协同的闭环中共探新的重大科研突破。
2026 开年已两个月,Agent 依然是全球最引人注目的 AI 赛道之一。OpenClaw(原 Clawbot)掀起的那波 Agent 热潮至今仍在发酵,甚至让「一人公司」概念第一次真正有了落地的可能性。
在 Princeton 发布 SWE-Bench 之后,用真实世界代码仓库+可执行测试评测大模型软件工程能力,几乎已成为学术界与工业界的共识。围绕 SWE issue 的评测范式迅速发展,也催生了一系列 SWE 系列 benchmark,在刻画模型 bug 修复能力方面发挥了重要作用。
伴随多模态大模型的发展,GUI Agent正成为人机交互的新范式。
近日,Flowith 宣布完成千万美元种子轮和种子+轮融资。种子轮为祥峰投资(Vertex Ventures)等机构,种子+轮为红杉中国种子基金、江远投资(LongRiver)等多家顶尖机构联合领投,融资资金将主要用于研发以及全球化市场拓展。
冲刺多智能体第一股,毛利率超80%。
5天时间,AI就搞定了原本需要6个月完成的菲尔兹奖级数学成果的形式化证明。
你见过 7B 模型在拼图推理上干翻 GPT-5 吗?
当 AI agent 需要一个「家」的时候,它们没有住进独立的 App,而是搬进了聊天软件。
让AI自己写高性能GPU代码,字节Seed与清华AIR团队做到了。