AI资讯新闻榜单内容搜索-RAGEN

规避文献幻觉，准确率提升13.2%！细粒度检索智能体 | ACL'26

为解决科研中对单篇文献深度解析的需求，佐治亚大学团队提出IntrAgent，专注单篇内容，避免大模型幻觉。通过段落排序与迭代阅读机制，精准提取实验细节与元数据。

来自主题: AI技术研报

10647 点击 2026-06-04 16:38

Meta华人实习生搞出超级智能体！自己写代码实现自我进化

能无限进步的「超级智能体」来了！

来自主题: AI技术研报

6692 点击 2026-03-26 15:19

微软｜搞定长时程、跨应用的Agent，竟然只靠<20%的摘要记忆，反超全文投喂

作为大家的测评博主，我最近发现一个巨有意思的现象：现在市面上大部分评估 Agent 的基准测试，倾向于考核“单项技能”，而非“综合任务”。比如，你让 AI 点份外卖，它能完成；但如果要求它策划一场涵盖预算、选址、菜单、宾客邀请与流程安排的晚宴，它很可能就原地就 G 了。

来自主题: AI资讯

9534 点击 2025-08-20 11:49

实测能“生娃”的MasterAgent，我用1句话拉起了自家AI团队

果然只要坚持每天测Agent，总能开出金的。Agent们好用但不便宜，有没有那种不烧积分，一句话就能定制多个智能体的Agent开发平台呢？今天就有了！

来自主题: AI产品测评

9633 点击 2025-08-05 12:52

深度｜全国产化的MasterAgent：一句话交付专业协同智能体组合

引言：越过AGI喧嚣，生产力正呼唤“成果交付型”AI

来自主题: AI资讯

12607 点击 2025-07-30 11:46

卷疯了！这个清华系Agent框架开源后迅速斩获1.9k stars，还要“消灭”Prompt？

随着大模型能力的突破，“可调用工具的智能体”已经迅速从实验室概念走向应用落地，成为继大模型之后的又一爆发点。

来自主题: AI资讯

9133 点击 2025-06-28 16:44

论文秒变海报！开源框架PosterAgent一键生成顶会级学术Poster

你好研究僧，听说刚刚中了顶会，却还在愁怎么做Poster（学术海报）？

来自主题: AI技术研报

9964 点击 2025-06-04 09:24

李飞飞/DeepSeek前员工领衔，复现R1强化学习框架，训练Agent在行动中深度思考

什么开源算法自称为DeepSeek-R1（-Zero）框架的第一个复现？

来自主题: AI技术研报

9521 点击 2025-04-25 15:35

清华LeapLab开源cooragent框架：一句话构建您的本地智能体服务群

刚刚，清华大模型团队 LeapLab 发布了一款面向 Agent 协作的开源框架：Cooragent。

来自主题: AI技术研报

9470 点击 2025-04-23 14:46

智能体模拟二战和战国时代！用LLM模拟推演战争，会改变历史吗？

我们是否还有另一个选择，可以让人类完美通关历史？来自密歇根和罗格斯大学的学者利用LLM对历史上的战争进行模拟推演结果，会是我们的参考答案吗？

来自主题: AI资讯

10285 点击 2023-12-29 10:12

AI资讯新闻榜单内容搜索-RAGEN

规避文献幻觉，准确率提升13.2%！细粒度检索智能体 | ACL'26

Meta华人实习生搞出超级智能体！自己写代码实现自我进化

微软｜ 搞定长时程、跨应用的Agent，竟然只靠<20%的摘要记忆，反超全文投喂

实测能“生娃”的MasterAgent，我用1句话拉起了自家AI团队

深度｜全国产化的MasterAgent：一句话交付专业协同智能体组合

卷疯了！这个清华系Agent框架开源后迅速斩获1.9k stars，还要“消灭”Prompt？

论文秒变海报！开源框架PosterAgent一键生成顶会级学术Poster

李飞飞/DeepSeek前员工领衔，复现R1强化学习框架，训练Agent在行动中深度思考

清华LeapLab开源cooragent框架：一句话构建您的本地智能体服务群

智能体模拟二战和战国时代！用LLM模拟推演战争，会改变历史吗？

微软｜搞定长时程、跨应用的Agent，竟然只靠<20%的摘要记忆，反超全文投喂