AI资讯新闻榜单内容搜索-GAI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GAI
搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好

搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好

搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好

当前,Agentic RAG(Retrieval-Augmented Generation)正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中,搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面,部分方法优化的目标与真实下游需求存在偏离,另一方面,搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报
6447 点击    2025-06-17 09:46
开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。

来自主题: AI技术研报
5993 点击    2025-06-05 11:50
AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

AI版Office全网首测,键盘鼠标彻底退休!打工人沸腾

这次,引领者又是中国公司!在5月中旬拿到GAIA榜首的这个AI版office,直接结合了Deep Research和通用Agent两大神器的优点,从此office三件套彻底进入第四代。

来自主题: AI资讯
4794 点击    2025-05-23 12:32
OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

OWL团队万字分享:复现Manus最好的团队,如何看待Agentic AI的落地现状?

CAMEL-AI 团队在 Manus 上线后 1 天内推出的 OWL 就是其中最具代表性的一个,项目实测成绩达到开源界 GAIA 性能天花板,达到了 58.18%,超越 Huggingface 提出的 Open Deep Research 55.15% 的表现。

来自主题: AI资讯
7849 点击    2025-03-29 09:57
3天后,我觉得可以再来聊聊Manus了。

3天后,我觉得可以再来聊聊Manus了。

3天后,我觉得可以再来聊聊Manus了。

甚至很多人嘲讽,国外的论坛和自媒体还没动静,只有国内AI自媒体吹,所以一定都是收钱的营销号。那现在,海外热度开始爆了,是不是也都收钱了?

来自主题: AI资讯
9020 点击    2025-03-10 11:53
解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

解构Manus AI:这是通用Agent革命,还是精巧缝合怪?

自媒体的反应堪称狂热:“通用Agent终于实现了!”“这是继DeepSeek之后的又一技术革命!”这样夸张的赞誉随处可见。从Benchmark来看,它的表现确实非常亮眼,在GAIA测试中超越了之前的各种Agent以及OpenAI的DeepResearch。

来自主题: AI技术研报
8027 点击    2025-03-09 02:07
邀请码炒到10万?OpenManus深夜开源打脸!Manus X账号遭冻结,平替光速上线

邀请码炒到10万?OpenManus深夜开源打脸!Manus X账号遭冻结,平替光速上线

邀请码炒到10万?OpenManus深夜开源打脸!Manus X账号遭冻结,平替光速上线

离了个大谱,Manus全网邀请码一票难求?激动人心的是,开源界凌晨来了一场核爆攻击,用3小时代码量开源了平替项目——OpenManus,免费体验不要邀请码!同时发布的还有另一个「Manus同款」OWL,直接干到GAIA基准测试开源最强!

来自主题: AI资讯
6851 点击    2025-03-08 10:59
OWL:复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!

OWL:复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!

OWL:复刻Manus通用智能体,完全开源!GAIA Benchmark最强性能!

最近AI圈最炸的瓜,毫无疑问是——Manus!一个AI Agent,不仅能刷GAIA Benchmark,还能远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」。听起来确实很能打?但我们 CAMEL-AI的🦉OWL项目看完Manus视频,集体摊手:就这?0天复刻走起!

来自主题: AI资讯
9723 点击    2025-03-07 14:33
上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

上交大o1复现新突破:蒸馏超越原版,警示AI研发"捷径陷阱"

自从 OpenAI 发布展现出前所未有复杂推理能力的 o1 系列模型以来,全球掀起了一场 AI 能力 “复现” 竞赛。近日,上海交通大学 GAIR 研究团队在 o1 模型复现过程中取得新的突破,通过简单的知识蒸馏方法,团队成功使基础模型在数学推理能力上超越 o1-preview。

来自主题: AI技术研报
5078 点击    2024-11-22 16:46