定位大模型「作弊」神经回路!新研究首次揭示:虚假奖励如何精准激活第18-20层记忆
定位大模型「作弊」神经回路!新研究首次揭示:虚假奖励如何精准激活第18-20层记忆无需真实奖励,哪怕用随机、错误的信号进行训练,大模型准确率也能大幅提升?
无需真实奖励,哪怕用随机、错误的信号进行训练,大模型准确率也能大幅提升?
哈工大、鹏城实验室、新加坡国立、复旦、北大联合发布了一篇重磅综述《AI Meets Brain: A Unified Survey on Memory System from Cognitive Neuroscience to Autonomous Agents》,首次打破认知神经科学与人工智能之间的学科壁垒,系统性地将人脑记忆机制与 Agents 记忆统一审视,
最近,奥特曼的焦虑肉眼可见。去年年底,谷歌Gemini 3横空出世,一举横扫各大榜单,将ChatGPT狠狠拽下了神坛。为了抢回AI皇冠,奥特曼不得不拉响「红色警报」。
上海AI Lab联合多家机构开源的Yume1.5,针对这一核心难题提出了时空信道联合建模(TSCM),在长视频生成中实现了近似恒定计算成本的全局记忆访问。
我正在用 ChatGPT 给自家的狗生成一张穿着鹈鹕服装的搞笑照片。几秒钟后,图片出来了——狗狗的装扮很完美,但图片左侧莫名其妙多了一个「Half Moon Bay」(半月湾)的标志。
在上一篇文章中,我们系统梳理了AI Agent 记忆机制的全景综述AI Agent最新「Memory」综述 |多所顶尖机构联合发布。今天我将带您了解一项最近很火的Agent记忆项目「HINDSIGHT」
如今,以 DeepSeek-R1 为代表的深度思考大模型能够处理复杂的推理任务,而DeepSearch 作为深度思考大模型的核心搜索器,在推理过程中通过迭代调用外部搜索工具,访问参数边界之外的最新、领域特定知识,从而提升推理的深度和事实可靠性。
多模态推理又有新招,大模型“记不住教训”的毛病有治了。
一页纯文本的记忆是看不清世界的。
走上了堪称是“最佳 AI 转型路径”之后,他也在读研期间和合作者针对 AI 记忆开展了一项研究,借此发明出一种名为 LightMem(轻量记忆)的技术。在 LongMemEval 和 LoCoMo 这两个专门用于考察 AI 长期记忆能力的基准测试上,LightMem 回答问题的准确率全面超越之前的冠军模型,最高提升了 7% 以上,在某些数据集上甚至提升了将近 30%。