AI资讯新闻榜单内容搜索-GAI

登顶Hugging Face GAIA全球榜首！中兴超级智能体终结「AI黑盒」时代

在杭州奥体中心演唱会现场，一套名为「Co-Sight 2.0」的AI系统成功保障了网络稳定，其背后是中兴通讯研发的、新近登顶Hugging Face GAIA全球权威榜单的超级智能体。

来自主题: AI资讯

8636 点击 2025-10-15 14:32

开源RL框架Verlog来了，专为LLM智能体打造，400回合不成问题

具体而言，Verlog 是一个多轮强化学习框架，专为具有高度可变回合（episode）长度的长时程（long-horizon） LLM-Agent 任务而设计。它在继承 VeRL 和 BALROG 的基础上，并遵循 pytorch-a2c-ppo-acktr-gail 的成熟设计原则，引入了一系列专门优化手段，从而在任务跨度从短暂交互到数百回合时，依然能够实现稳定而高效的训练。

来自主题: AI技术研报

7879 点击 2025-10-09 11:16

可灵2.5Turbo实测｜顶尖AI视频模型，真能打平CG吗？

可灵正式发布了他们的 2.5 Turbo （app.klingai.com）版本视频模型，作为超创提前试了一下，这次的进步真的很大。

来自主题: AI产品测评

12117 点击 2025-09-24 10:07

你的设想被证实了！不微调模型也能微调Agent，Memento霸榜GAIA｜UCL最新

你或许也有过这样的猜想，如何让AI智能体（Agent）变得更聪明、更能干，同时又不用烧掉堆积如山的算力去反复微调模型？

来自主题: AI技术研报

11679 点击 2025-09-01 09:58

深度｜Agent 全球爆发，Agent Infra是否是搭上这趟快车的关键？

京东云于今年 7 月正式开源了JoyAgent‑JDGenie，这是业内首个“完整产品级”通用多智能体系统——覆盖前端／后端／智能体框架／执行引擎以及众多子 Agent（如报告、代码、PPT 智能体）；在权威 GAIA 基准测试中取得 75.15% 整体准确率，，显著超越 OWL、OpenManus 等同类开源产品。

来自主题: AI资讯

9257 点击 2025-08-20 12:26

代季峰陈天桥联手AGI首秀炸场！最强开源深度研究模型，GAIA测试82.4分超OpenAI

最强开源深度研究模型来了。 MiroMind ODR（Open Deep Research），来自代季峰加盟陈天桥的技术首秀。首先，它做到了性能最强，GAIA测试结果更是达到了82.4分，超过了一众开源闭源模型，其中包括Manus、OpenAI的DeepResearch。

来自主题: AI资讯

9633 点击 2025-08-10 16:33

史上最大高质量科学推理后训练数据集开源，快速让Qwen3等变“科学家”

有史规模最大的开源科学推理后训练数据集来了！上海创智学院、上海交通大学（GAIR Lab）发布MegaScience。该数据集包含约125万条问答对及其参考答案，广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域，旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

来自主题: AI技术研报

8272 点击 2025-08-09 15:52

腾讯AI Lab开源即王炸：GAIA同级最强Agent框架

当AI智能体（Agent）开发的浪潮涌来，很多一线工程师却发现自己站在一个尴尬的十字路口：左边是谷歌、OpenAI等巨头深不可测的“技术黑盒”，右边是看似开放却暗藏“付费墙”的开源社区。大家空有场景和想法，却缺少一把能打开未来的钥匙。

来自主题: AI资讯

8244 点击 2025-08-07 11:04

AI游戏创新大赛线下终极对决！世纪华通发起，ChinaJoy见证最终冠军诞生

7月23日，由世纪华通发起，中国音数协游戏工委、浦东新区区委宣传部（文体旅游局）、上海市网络游戏行业协会指导，联合中国国际数码互动娱乐展览会、澎湃新闻、光源资本、钟鼎资本、36氪、联想集团等多方力量共同打造的“数龙杯”全球AI游戏及应用创新大赛（英文简称“Digiloong GAIC”）在上海举办线下路演活动。

来自主题: AI资讯

7953 点击 2025-07-28 10:40

Agent KB：经验池让Agents互相学习！GAIA新开源SOTA，Pass@1性能最高提升6.66

近日，来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索，让智能体能够从其他任务的成功经验中学习，显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报

9684 点击 2025-07-25 16:50