AI资讯新闻榜单内容搜索-GAI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: GAI
你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新

你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新

你的设想被证实了!不微调模型也能微调Agent,Memento霸榜GAIA|UCL最新

你或许也有过这样的猜想,如何让AI智能体(Agent)变得更聪明、更能干,同时又不用烧掉堆积如山的算力去反复微调模型?

来自主题: AI技术研报
7019 点击    2025-09-01 09:58
深度|Agent 全球爆发,Agent Infra是否是搭上这趟快车的关键?

深度|Agent 全球爆发,Agent Infra是否是搭上这趟快车的关键?

深度|Agent 全球爆发,Agent Infra是否是搭上这趟快车的关键?

京东云于今年 7 月正式开源了JoyAgent‑JDGenie,这是业内首个“完整产品级”通用多智能体系统——覆盖前端/后端/智能体框架/执行引擎以及众多子 Agent(如报告、代码、PPT 智能体);在权威 GAIA 基准测试中取得 75.15% 整体准确率,,显著超越 OWL、OpenManus 等同类开源产品。

来自主题: AI资讯
5993 点击    2025-08-20 12:26
代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

代季峰陈天桥联手AGI首秀炸场!最强开源深度研究模型,GAIA测试82.4分超OpenAI

最强开源深度研究模型来了。 MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。 首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。

来自主题: AI资讯
6658 点击    2025-08-10 16:33
史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

史上最大高质量科学推理后训练数据集开源,快速让Qwen3等变“科学家”

有史规模最大的开源科学推理后训练数据集来了! 上海创智学院、上海交通大学(GAIR Lab)发布MegaScience。该数据集包含约125万条问答对及其参考答案,广泛覆盖生物学、化学、计算机科学、经济学、数学、医学、物理学等多个学科领域,旨在为通用人工智能系统的科学推理能力训练与评估提供坚实的数据。

来自主题: AI技术研报
5837 点击    2025-08-09 15:52
腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

腾讯AI Lab开源即王炸:GAIA同级最强Agent框架

当AI智能体(Agent)开发的浪潮涌来,很多一线工程师却发现自己站在一个尴尬的十字路口:左边是谷歌、OpenAI等巨头深不可测的“技术黑盒”,右边是看似开放却暗藏“付费墙”的开源社区。大家空有场景和想法,却缺少一把能打开未来的钥匙。

来自主题: AI资讯
5910 点击    2025-08-07 11:04
AI游戏创新大赛线下终极对决!世纪华通发起,ChinaJoy见证最终冠军诞生

AI游戏创新大赛线下终极对决!世纪华通发起,ChinaJoy见证最终冠军诞生

AI游戏创新大赛线下终极对决!世纪华通发起,ChinaJoy见证最终冠军诞生

7月23日,由世纪华通发起,中国音数协游戏工委、浦东新区区委宣传部(文体旅游局)、上海市网络游戏行业协会指导,联合中国国际数码互动娱乐展览会、澎湃新闻、光源资本、钟鼎资本、36氪、联想集团等多方力量共同打造的“数龙杯”全球AI游戏及应用创新大赛(英文简称“Digiloong GAIC”)在上海举办线下路演活动。

来自主题: AI资讯
6276 点击    2025-07-28 10:40
Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

Agent KB:经验池让Agents互相学习!GAIA新开源SOTA,Pass@1性能最高提升6.66

近日,来自 OPPO、耶鲁大学、斯坦福大学、威斯康星大学麦迪逊分校、北卡罗来纳大学教堂山分校等多家机构的研究团队联合发布了 Agent KB 框架。这项工作通过构建一个经验池并且通过两阶段的检索机制实现了 AI Agent 之间的有效经验共享。Agent KB 通过层级化的经验检索,让智能体能够从其他任务的成功经验中学习,显著提升了复杂推理和问题解决能力。

来自主题: AI技术研报
7510 点击    2025-07-25 16:50
搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好

搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好

搜索智能体RAG落地不佳?UIUC开源s3,仅需2.4k样本,训练快效果好

当前,Agentic RAG(Retrieval-Augmented Generation)正逐步成为大型语言模型访问外部知识的关键路径。但在真实实践中,搜索智能体的强化学习训练并未展现出预期的稳定优势。一方面,部分方法优化的目标与真实下游需求存在偏离,另一方面,搜索器与生成器间的耦合也影响了泛化与部署效率。

来自主题: AI技术研报
7002 点击    2025-06-17 09:46
开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

开启 AI 自主进化时代,普林斯顿Alita颠覆传统通用智能体,GAIA榜单引来终章

智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可扩展性与泛化能力。

来自主题: AI技术研报
6600 点击    2025-06-05 11:50