
NeurIPS 2024 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测
NeurIPS 2024 | 真实世界复杂任务,全新基准GTA助力大模型工具调用能力评测利用语言模型调用工具,是实现通用目标智能体(general-purpose agents)的重要途径,对语言模型的工具调用能力提出了挑战。
利用语言模型调用工具,是实现通用目标智能体(general-purpose agents)的重要途径,对语言模型的工具调用能力提出了挑战。
近期,LLM领域有不少关于系统1和系统2思考的讨论,在Agent方向上这方面的讨论还很少。如何让AI agents既能快速响应用户,又能进行深度思考和规划,一直是一个巨大的挑战。
微软发表了一篇播客,宣布在其Microsoft Cloud for Healthcare中推出新的医疗保健数据功能和AI工具,包括通过Azure AI Studio中的新医疗保健AI模型、Microsoft Fabric中的医疗保健数据功能、Copilot Studio中的医疗保健AI agents服务以及AI驱动的护理工作流程解决方案。
近日,MIT团队推出了自动搞科研的AI系统——SciAgents。在仿生材料的研究中,模型揭示了以前被认为无关的一些跨学科联系,实现了超越传统人类研究方法的规模、精度和探索能力。
如果您正在探寻人工智能未来的辉煌篇章,那么答案就在这里。 OpenAI的领导者Sam Altman和Greg Brockman最近表示:“现在正是我们展望未来的最佳时机。”他们预见了一个新时代,用户将不再只是与单一的模型对话,而是与由众多多模态模型和工具构成的系统互动,这些系统能够代表用户执行操作。
本文出自启元世界多模态算法组,共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥,研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。
通过从信息转向行动——想象一下能够完成复杂工作流程的虚拟同事——这项技术预示着生产力和创新的新浪潮。
近日,清华大学电子系城市科学与计算研究中心的研究论文《EconAgent: Large Language Model-Empowered Agents for Simulating Macroeconomic Activities》获得自然语言处理顶会 ACL 2024杰出论文奖(Outstanding Paper Award)。
智东西8月29日消息,据Constellation Research今日报道,美国SaaS龙头Salesforce公布了截至2024年7月31日的2025财年第二季度业绩,第二财季Salesforce营收为93.2亿美元,同比增长8%。该公司将第三财季营收指引上调至93.1亿美元至93.6亿美元,同比增长7%;并维持2025财年全年营收指引为377亿美元至380亿美元,同比增长8%-9%。
AI 崛起,能够自主规划并执行多个步骤的 Agents,正成为用户的接口,也成为开发者的核心着力点。