AI资讯新闻榜单内容搜索-GAIA

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GAIA
Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

近日,来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索,让智能体能够从其他任务的成功经验中学习,显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报
6626 点击    2025-07-25 16:50
开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。

来自主题: AI技术研报
6140 点击    2025-06-05 11:50
AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

这次,引领者又是中国公司!在5月中旬拿到GAIA榜首的这个AI版office,直接结合了Deep Research和通用Agent两大神器的优点,从此office三件套彻底进入第四代。

来自主题: AI资讯
4899 点击    2025-05-23 12:32
OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

CAMEL-AI 团队在 Manus 上线后 1 天内推出的 OWL 就是其中最具代表性的一个,项目实测成绩达到开源界 GAIA 性能天花板,达到了 58.18%,超越 Huggingface 提出的 Open Deep Research 55.15% 的表现。

来自主题: AI资讯
7973 点击    2025-03-29 09:57
3天后,我觉得可以再来聊聊Manus了。

3天后,我觉得可以再来聊聊Manus了。

3天后,我觉得可以再来聊聊Manus了。

甚至很多人嘲讽,国外的论坛和自媒体还没动静,只有国内AI自媒体吹,所以一定都是收钱的营销号。那现在,海外热度开始爆了,是不是也都收钱了?

来自主题: AI资讯
9128 点击    2025-03-10 11:53
解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

自媒体的反应堪称狂热:“通用Agent终于实现了!”“这是继DeepSeek之后的又一技术革命!”这样夸张的赞誉随处可见。从Benchmark来看,它的表现确实非常亮眼,在GAIA测试中超越了之前的各种Agent以及OpenAI的DeepResearch。

来自主题: AI技术研报
8146 点击    2025-03-09 02:07
邀请码炒到10万?OpenManus深夜开源打脸!Manus X账号遭冻结,平替光速上线

邀请码炒到10万?OpenManus深夜开源打脸!Manus X账号遭冻结,平替光速上线

邀请码炒到10万?OpenManus深夜开源打脸!Manus X账号遭冻结,平替光速上线

离了个大谱,Manus全网邀请码一票难求?激动人心的是,开源界凌晨来了一场核爆攻击,用3小时代码量开源了平替项目——OpenManus,免费体验不要邀请码!同时发布的还有另一个「Manus同款」OWL,直接干到GAIA基准测试开源最强!

来自主题: AI资讯
6955 点击    2025-03-08 10:59
OWL:复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!

OWL:复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!

OWL:复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!

最近AI圈最炸的瓜,毫无疑问是——Manus!一个AI Agent,不仅能刷GAIA Benchmark,还能远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」。听起来确实很能打?但我们 CAMEL-AI的🦉OWL项目看完Manus视频,集体摊手:就这?0天复刻走起!

来自主题: AI资讯
9904 点击    2025-03-07 14:33