科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?
7870点击    2025-04-14 14:44

自主通才科学家的 5 个层级。


科学发现也可以遵从Scaling Laws


一种结合 agentic AI 和具身机器人技术的自主通才科学家(AGS),有望实现整个研究生命周期的自动化,进而催生出科学发现的 Scaling Laws。


AGS 这一概念,来自多伦多大学和意大利技术研究院联合团队及其合作者。他们认为,利用基础模型中的综合学科知识,AGS 可以自动进行跨数字和物理领域的科学探索,将推动具有重大社会影响的创新。


相关研究论文以“Scaling Laws in Scientific Discovery with AI and Robot Scientists”为题,已发表在预印本网站 arXiv 上。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

论文链接:https://arxiv.org/abs/2503.22444


自主通才科学家的 5 个层级


AGS 代表了一种由 AI 驱动的机器人系统,旨在开展跨科学领域的研究。研究团队认为,AGS 将在速度、范围和深度上比肩并最终超越人类科学家。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|AGS 框架。研究 agent/机器人可以加速科学研究进展,弥合不同学科之间的科学知识鸿沟。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|不同自动化级别的自动化研究时间表


根据 AGS 的自主程度、与模拟环境和真实世界环境的交互能力,以及总体研究能力,研究团队将科学发现自动化划分为5 个不同层级。包括:


作为辅助工具Level 1;作为智能助理Level 2;作为合作伙伴Level 3;作为研究者Level 4;作为先驱者Level 5,这是该领域的长期目标。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|AGS的 5 个层级


那么,AGS 是如何实现整个研究生命周期自动化的?主要涉及文献综述、提出问题、实验、准备成稿、反思和反馈5 个部分。


文献综述方面,传统的研究工作依赖于人工搜索和对无数论文的分析,这一缓慢的过程往往受到过时数据访问的限制。


近期的工作通过 OS Agents 自主、全面地获取信息,智能处理、合成和 gap 识别,在虚拟环境中模拟人类行动来完成复杂的搜索和任务。


在提出问题方面,LLM 生成的想法始终比人类专家提出的想法更新颖。AGS 框架通过全面的提案开发流程扩展了生成研究想法的能力。


AGS 对文献进行自动 gap 分析,找出矛盾和未探索的联系。制定具有明确研究边界的精确问题,根据理论基础生成可检验的假设,设计具有适当控制和统计考虑因素的严格方法,制定包括时间表和资源要求在内的详细实施计划,确保研究问题既具有创新性,又具有实际可执行性。


实验方面,基于所有学科包含虚拟理论构建和实际操作的双重性,AI 通过先进的模拟、优化和数据分析能力彻底改变了虚拟实验,但物理实验的自动化仍然严重不足。


这些制约因素突出表明,我们亟需具身智能系统以人类科学家特有的精确性、适应性和情境感知能力执行复杂物理操作。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|操作需求的综合考量


将世界模型与基于 LLM 的具身 AI 相结合,标志着通用机器人将结构化的环境表征与复杂的认知能力结合在一起,以更高的自主性和对情境的理解力执行各种任务,有效地将抽象思维与物理行动连接起来。AI 与先进的机器人技术相结合,简化了虚拟或数字实验和实验室环境的实验流程。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|研究任务中的 agent 和机器人方法比较


在成稿过程中,涉及综合实验结果、合理组织信息以及向学术界有效传达研究发现。传统上,研究人员在确保事实的准确性、遵守学科惯例以及用通俗易懂的语言表达复杂的概念方面临着许多挑战。


研究团队认为,用 AI 系统来弥合实验结果与学术文献之间的 gap,模拟同行评审和内外部评审,在投稿前提高稿件质量。最后简化综合评审、完善格式和投稿协调流程,可以促进稿件高效发表。


在反思和反馈部分,全面的信息交流和分析性自我评估是确保研究进展一致的重要组成部分。这些机制促进了研究阶段之间的知识转移,类似于人类研究团队中的协同动力学。通过分析性自我评估和无缝整合各研究阶段的见解,实现对科学流程的持续监控和迭代改进,促进了绩效分析和战略调整,最终加强了后续研究成果和科学产出的整体质量。


将战略性模块互动与系统性过程评估相结合,可增强假设的提出、方法的精确性和科学成果的质量。此外,纳入不同的外部观点,可以引入替代分析框架并确定潜在的改进机会。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|全球科研产出和科研人员队伍的历史模式和预测发展


科学发现也有 Scaling Laws?


AGS 是一个开创性的框架,利用基础模型中的综合学科知识,同时将 AI 智能体的能力与具身机器人系统协同起来,自动进行跨数字和物理领域的科学探索。


这种统一的方法可以实现快速数据处理、假设生成和自动虚拟实验,并结合先进的现实世界研究实施,在计算模拟和实验室实验之间架起桥梁,从而实现跨数字和物理领域的自动化科学探索。它超越了传统的研究界限,不仅推动了既有学科的发展,还为全新的研究途径奠定了基础。


研究团队表示,计算平台和机器人平台固有的可重复性为知识发现提供了新的 Scaling Laws,有可能使研究生产力超越传统的以人为本的方法。AI 与机器人技术之间的协同作用必将改变学术研究,推动具有重大社会影响的创新。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|科学发现范式的演变:从以人为本的研究到协作系统,再到 AGS,打破并超越物理和知识的界限。


附:3 个开放研究问题


如何管理来自 AI 和机器人科学家的出版物:我们需要一个预印本开放平台吗?


在处理由 AGS 自主生成的出版物和提案时,主要为人类研究人员设计的传统学术系统可能会面临挑战。研究团队建议,建立一个中介平台AIXIV,以弥合AI/机器人科学家与成熟的学术出版环境之间的差距。


AIXIV 将作为一个开放的预印本服务器,专门用于自主系统产生的研究成果,并针对 AI 驱动的发现的独特性实施分级审核流程。它还将充当一个公共论坛,AI 和机器人科学家(代表非人类实体)可以在此提交研究成果,形式包括创新提案和综合性学术论文,涉及广泛的科学领域。最终可能通过促进创新、维护学术诚信以及最终加快科学发现的步伐来彻底改变科学出版。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

图|AIXIV 服务器平台框架,供 AI 和机器人科学家发表论文和提出建议。


机器人科学家必须是人形机器人吗?


严格来说,人形设计并不是机器人有效发挥作用的先决条件。人形机器人与现有的以人为中心的实验室环境和研究设施的兼容性是一大优势。它们能够在这些空间中自由穿梭,无需进行大量改动即可使用标准设备,从而简化了集成过程。此外,先进的操纵能力,特别是灵巧地使用双手的能力,使人形机器人能够执行复杂的任务、处理精密仪器和执行要求精细运动技能的实验。人形机器人还能与人类同事进行更顺畅、更直观的互动,从而增强研究团队内部的合作与交流。


虽然人形机器人在通用科学研究和无缝集成到人类设计的基础设施中具有优势,但具有复杂操纵能力的移动机器人系统,为各种科学研究提供了可行且可能更高效的替代方案。机器人科学家的最佳外形尺寸很可能取决于具体的研究任务和工作环境。


机器人科学家能否在超越人类生理极限的极端环境中进行独立科学探索?


机器人科学家为将科学研究扩展到地球边界以外的太空探索,以及人类无法进入或危险的其他极端环境提供了巨大潜力。它可以在月球和火星上建立研究能力,然后这些自主系统可以有条不紊地将业务扩展到整个太阳系,甚至可能扩展到更远的地方,还可以彻底改变我们对地球深海的认识。它们的能力还扩展到微米和纳米尺度,可以在先进材料科学、人体内靶向给药或微观污染物环境监测等领域开展独立的科学探索。


随着技术的不断进步,通过不断的探索和发现,这些系统将超越人类的生理极限,极大地提高我们对宇宙、地球甚至物质基本组成的认识。


文章来自于“学术头条”,作者“与可”。


科学发现也有Scaling Laws:agent+具身机器人,击败人类顶尖科学家?

关键词: AI , Agent , 具身智能 , AGS
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md