AI资讯新闻榜单内容搜索-训练

微软｜搞定长时程、跨应用的Agent，竟然只靠<20%的摘要记忆，反超全文投喂

作为大家的测评博主，我最近发现一个巨有意思的现象：现在市面上大部分评估 Agent 的基准测试，倾向于考核“单项技能”，而非“综合任务”。比如，你让 AI 点份外卖，它能完成；但如果要求它策划一场涵盖预算、选址、菜单、宾客邀请与流程安排的晚宴，它很可能就原地就 G 了。

来自主题: AI资讯

7721 点击 2025-08-20 11:49

OpenAI高管自爆：Scaling不死，GPT-5「双轴训练」撕开智能天花板

奥特曼称GPT-5「比人聪明」，但OpenAI首席运营官Lightcap澄清：这不是AGI。这只是能力过剩的冰山一角——我们仍有十年产品可建，模型越智能，融合越要精妙。GPT-5标志着从纯智商到反思能力的全面跃进。

来自主题: AI资讯

7272 点击 2025-08-20 11:22

思维链可无限延伸了，MIT等打破大模型上下文天花板

大模型的记忆墙，被MIT撬开了一道口子。 MIT等机构最新提出了一种新架构，让推理大模型的思考长度突破物理限制，理论上可以无限延伸。这个新架构名叫Thread Inference Model，简称TIM。

来自主题: AI资讯

6779 点击 2025-08-20 11:10

ICCV 2025 | 跨越视觉与语言边界，打开人机交互感知的新篇章：北大团队提出INP-CC模型重塑开放词汇HOI检测

目前的 HOI 检测方法普遍依赖视觉语言模型（VLM），但受限于图像编码器的表现，难以有效捕捉细粒度的区域级交互信息。本文介绍了一种全新的开集人类-物体交互（HOI）检测方法——交互感知提示与概念校准（INP-CC）。

来自主题: AI技术研报

6453 点击 2025-08-20 11:05

2396部黄片，一片罚15万，Meta用BT偷黄片训练AI，遭天价索赔

你有没有想过，Meta 训练 AI 用的数据里，有可能不只是维基百科、小说、YouTube 视频……而是你在某个晚上偷偷下载的成人电影？你没听错。是色情片。而且不是三两个，而是 2396 部！

来自主题: AI资讯

7551 点击 2025-08-19 12:05

Meta没做的，英伟达做了！全新架构吞吐量狂飙6倍，20万亿Token训练

英伟达发布全新架构9B模型，以Mamba-Transformer混合架构实现推理吞吐量最高提升6倍，对标Qwen3-8B并在数学、代码、推理与长上下文任务中表现持平或更优。

来自主题: AI资讯

7243 点击 2025-08-19 11:35

英伟达新研究：小模型才是智能体的未来

大模型OUT，小模型才是智能体的未来！这可不是标题党，而是英伟达最新论文观点：在Agent任务中，大语言模型经常处理重复、专业化的子任务，这让它们消耗大量计算资源，且成本高、效率低、灵活性差。

来自主题: AI资讯

6991 点击 2025-08-19 11:24

超越RAG和DAPT！华人团队新研究引热议：即插即用、无需改变原参即可让模型化身领域专家

一个小解码器让所有模型当上领域专家！华人团队新研究正在引起热议。他们提出了一种比目前业界主流采用的DAPT（领域自适应预训练）和RAG（检索增强生成）更方便、且成本更低的方法。

来自主题: AI资讯

7664 点击 2025-08-19 11:01

AI时代还用德尔菲法？其实“少数人”远比“多数人”更有价值｜谷歌最新

每当需要处理复杂领域中高度不确定性或缺乏历史数据的问题时，纯粹的科学证据不足、存在矛盾或过于复杂，通常我们就需要依赖专家们的集体智慧来形成共识，指导实践。德尔菲法（Delphi method）是半个多世纪以来最常用的一种专家共识方法。

来自主题: AI资讯

6936 点击 2025-08-19 10:47

字节Seed开源长线记忆多模态Agent，像人一样能听会看

字节Seed发布全新多模态智能体框架——M3-Agent。像人类一样能听会看、具备长期记忆，并且免费开源！？

来自主题: AI技术研报

6047 点击 2025-08-19 10:16

AI资讯新闻榜单内容搜索-训练

微软｜ 搞定长时程、跨应用的Agent，竟然只靠<20%的摘要记忆，反超全文投喂

OpenAI高管自爆：Scaling不死，GPT-5「双轴训练」撕开智能天花板

思维链可无限延伸了，MIT等打破大模型上下文天花板

ICCV 2025 | 跨越视觉与语言边界，打开人机交互感知的新篇章：北大团队提出INP-CC模型重塑开放词汇HOI检测

2396部黄片，一片罚15万，Meta用BT偷黄片训练AI，遭天价索赔

Meta没做的，英伟达做了！全新架构吞吐量狂飙6倍，20万亿Token训练

英伟达新研究：小模型才是智能体的未来

超越RAG和DAPT！华人团队新研究引热议：即插即用、无需改变原参即可让模型化身领域专家

AI时代还用德尔菲法？其实“少数人”远比“多数人”更有价值 ｜谷歌最新

字节Seed开源长线记忆多模态Agent，像人一样能听会看

微软｜搞定长时程、跨应用的Agent，竟然只靠<20%的摘要记忆，反超全文投喂

AI时代还用德尔菲法？其实“少数人”远比“多数人”更有价值｜谷歌最新