AI资讯新闻榜单内容搜索-语言模型

深入感知级别图像理解：UniPercept 统一图像美学、质量与结构纹理感知

尽管多模态大语言模型（MLLMs）在识别「图中有什么」这一语义层面上取得了巨大进步，但在理解「图像看起来怎么样」这一感知层面上仍显乏力。

来自主题: AI技术研报

7093 点击 2026-01-08 15:23

腾讯混元3年变形始末｜独家

2023年启动大模型研发以来，腾讯第一次把大语言模型变成一把手工程，负责人是个27岁的年轻人；

来自主题: AI资讯

9239 点击 2026-01-08 09:27

深度｜2026年，AI将从炒作走向务实

如果说2025 年是 AI 接受现实检验之年，那么 2026 年这项技术将走向实用化。业界焦点已从构建日益庞大的语言模型，转向更艰巨的使命——让 AI 真正可用。

来自主题: AI资讯

8697 点击 2026-01-07 17:20

空间智能终极挑战MMSI-Video-Bench来了，顶级大模型全军覆没

空间理解能力是多模态大语言模型（MLLMs）走向真实物理世界，成为 “通用型智能助手” 的关键基础。但现有的空间智能评测基准往往有两类问题：一类高度依赖模板生成，限制了问题的多样性；另一类仅聚焦于某一种空间任务与受限场景，因此很难全面检验模型在真实世界中对空间的理解与推理能力。

来自主题: AI技术研报

8808 点击 2026-01-06 09:50

DeepSeek-OCR是「长文本理解」未来方向吗？中科院新基准给出答案

DeepSeek-OCR的视觉文本压缩（VTC）技术通过将文本编码为视觉Token，实现高达10倍的压缩率，大幅降低大模型处理长文本的成本。但是，视觉语言模型能否理解压缩后的高密度信息？中科院自动化所等推出VTCBench基准测试，评估模型在视觉空间中的认知极限，包括信息检索、关联推理和长期记忆三大任务。

来自主题: AI技术研报

6561 点击 2026-01-06 09:30

MIT发现让AI变聪明的秘密，竟然和人类一模一样

你有没有发现，你让AI读一篇长文章，结果它读着读着就忘了前面的内容？你让它处理一份超长的文档，结果它给出来的答案，牛头不对马嘴？这个现象，学术界有个专门的名词，叫做上下文腐化。这也是目前AI的通病：大模型的记忆力太差了，文章越长，模型越傻！

来自主题: AI技术研报

10177 点击 2026-01-04 16:53

MIT团队推出递归语言模型！不改架构、不扩窗口，上下文处理能力扩展百倍

新年伊始，MIT CSAIL 的一纸论文在学术圈引发了不小的讨论。Alex L． Zhang 、 Tim Kraska 与 Omar Khattab 三位研究者在 arXiv 上发布了一篇题为《Recursive Language Models》的论文，提出了所谓“递归语言模型”（Recursive Language Models，简称 RLM）的推理策略。

来自主题: AI技术研报

7684 点击 2026-01-04 14:51