AI资讯新闻榜单内容搜索-模型训练

LLM近期重大架构进化一览：从Gemma 4到DeepSeek V4

过去一段时间，很多人对大模型都有一个明显感受：token 总是不够用。

来自主题: AI技术研报

7829 点击 2026-05-19 15:32

伯克利神作背刺OpenAI：持续学习才是真神！

伯克利等发布FST框架：通过快慢分层解决大模型持续学习死局。

来自主题: AI技术研报

8475 点击 2026-05-19 15:31

你的AI Agent越用越蠢？港中大、浙大戳破「记忆」的谎言

你是否在使用Agent工作或者写代码时，总感觉上下文不够用？或者感觉反复使用Agent时并没有变得更聪明？感觉目前的记忆方案仍然不够用？今日，香港中文大学联合浙江大学发布的一篇论文关注了这个问题，并引起了学术界广泛讨论：你以为Agent在「记忆」，其实只是在记备忘录。

来自主题: AI技术研报

9095 点击 2026-05-19 15:00

让大模型学会「自己教自己」！京东&中科院信工所连发三篇论文定义Self-Taught RLVR

最近，京东和中科院信工所展开了Self-Taught RLVR的系列研究，并连发三篇后训练新作。

来自主题: AI技术研报

7394 点击 2026-05-19 14:59

Agent Harness Engineering：Agent的底盘工程综述｜CMU、耶鲁、Amazon

经常切换使用CC、Codex、OpenClaw这类Agent的人会发现：同一个模型，放进不同系统里，表现可能完全不同。

来自主题: AI技术研报

9508 点击 2026-05-19 14:58

ICML 2026 | 突破3DGS光度多义性瓶颈：北航/新国立提出AmbiSuR，重塑高保真3D几何重建

近年来，3D 高斯泼溅（3D Gaussian Splatting, 3DGS）凭借其卓越的新视角合成能力和实时的渲染效率，极大地推动了神经渲染技术的发展。然而，当研究者试图直接从 3DGS 中提取精确的 3D 几何表面（Mesh 等）时，往往会面临严重的几何失真问题。

来自主题: AI技术研报

8648 点击 2026-05-19 14:57

王云鹤眼中的Harness：复杂优化问题，AGI灵魂争夺之战

最近一段时间，Agent 又一次成为 AI 圈最热的关键词。

来自主题: AI技术研报

10706 点击 2026-05-19 10:58

多Agent协作反而让模型变蠢，AI也有「旁观者效应」

全行业都在押注多Agent。

来自主题: AI技术研报

11895 点击 2026-05-19 10:02

ICML 2026｜告别「单线程」思维，智能体进化出了原生的并行推理大脑

近年来，大语言模型在「写得长、写得顺」这件事上进步飞快。但当任务升级到真正复杂的推理场景 —— 需要兵分多路探索、需要自我反思与相互印证、需要在多条线索之间做汇总与取舍时，传统的链式思维（Chain-of-Thought）往往就开始「吃力」：容易被早期判断带偏、发散不足、自我纠错弱，而且顺序生成的效率天然受限。

来自主题: AI技术研报

10026 点击 2026-05-19 10:01

ICML 2026 | 只用少量Thinking Tokens，大模型依然能深度思考

近年来，Chain-of-Thought（CoT）推理已经成为提升大语言模型和多模态大语言模型复杂问题求解能力的重要技术路径。

来自主题: AI技术研报

7306 点击 2026-05-19 10:01