AI资讯新闻榜单内容搜索-模型

憋了4个月，阿里最大最强模型Qwen3-Max-Thinking正式版发布！附一手实测

阿里巴巴推出了Qwen3-Max-Thinking，这是阿里千问系列目前能力最强的旗舰级推理模型，在19项权威基准测试中，Qwen3-Max-Thinking跟GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型打得有来有回，搭配测试时扩展（TTS）能力后，能在不少基准测试上达到SOTA。

来自主题: AI资讯

8860 点击 2026-01-27 11:21

上海交大给具身智能发了一张“统考卷”，这会是机器人的LMArena吗？

用多样化的任务与公开透明的机制，堵上具身大模型刷榜的捷径。

来自主题: AI资讯

8750 点击 2026-01-27 10:14

美联储杀人，AI埋尸？牛津曝光L型死局：10亿打工人再无归路

这是一份迟到三年的行业复盘。牛津大学最新的实证研究撕开了那层遮羞布：2022年全球科技大裁员爆发时，ChatGPT甚至尚未发布。周期性缩编被伪装成技术性迭代，AI替资本背了三年的锅，直到今天真相才被彻底复位。

来自主题: AI资讯

9271 点击 2026-01-27 09:41

让Agent画思维导图稳固长期记忆：新框架实现稳定长期学习，准确率提升38%

思维导图曾被证明可以帮助学习障碍者快速提升成绩，那么当前已经可堪一用的智能体系统如果引入类似工具是否可以帮助改善长期学习记忆能力呢？有研究团队做出了探索性尝试。

来自主题: AI技术研报

5359 点击 2026-01-27 09:40

北大AI研究颠覆认知：我们看到的不是真实，而是被语言润色过的现实

近日，北京大学朱毅鑫教授课题组、北京大学毕彦超教授课题组和山西医科大学第一医院王效春团队通过结合 AI 模型和大脑损伤患者的数据，发现语言其实是一副无形的智能眼镜，时刻在悄悄修饰着我们看到的世界。我们可能以为视觉就是眼睛看到什么就是什么，但是这项成果说明了视觉从来都不是孤立的。事实上，当我们在看图片的时候，其实不只是在看，而是在进行被语言调制过的看。

来自主题: AI技术研报

7547 点击 2026-01-27 09:27

DeepSeek-R1推理智能从哪儿来？谷歌新研究：模型内心多个角色吵翻了

过去两年，大模型的推理能力出现了一次明显的跃迁。在数学、逻辑、多步规划等复杂任务上，推理模型如 OpenAI 的 o 系列、DeepSeek-R1、QwQ-32B，开始稳定拉开与传统指令微调模型的差距。直观来看，它们似乎只是思考得更久了：更长的 Chain-of-Thought、更高的 test-time compute，成为最常被引用的解释。

来自主题: AI技术研报

5779 点击 2026-01-26 15:02

斯坦福×英伟达发布AI推理新范式，刷新了多领域SOTA

斯坦福与英伟达联合发布重磅论文 TTT-Discover，打破「模型训练完即定型」的铁律。它让 AI 在推理阶段针对特定难题「现场长脑子」，不惜花费数百美元算力，只为求得一次打破纪录的极值。从重写数学猜想到碾压人类代码速度，这种「激进进化」正在重新定义机器发现的边界。

来自主题: AI技术研报

6877 点击 2026-01-26 14:23

关于多模态大模型Token压缩技术进展，看这一篇就够了

近年来多模态大模型在视觉感知，长视频问答等方面涌现出了强劲的性能，但是这种跨模态融合也带来了巨大的计算成本。高分辨率图像和长视频会产生成千上万个视觉 token ，带来极高的显存占用和延迟，限制了模型的可扩展性和本地部署。

来自主题: AI技术研报

8762 点击 2026-01-26 14:22

AI圈开年王炸：Agent Skill 正式登场

2026 年才开始，全球 AI 行业就迎来了第一个开年王炸。不是来自某个更大的模型参数，不是某家实验室刷新了榜单分数，而是一个看似不起眼、却迅速破圈的概念——Agent Skill。

来自主题: AI技术研报

6140 点击 2026-01-26 14:21

AAAI 2026杰出论文奖 | ReconVLA：具身智能研究首次获得AI顶级会议最佳论文奖

在长期以来的 AI 研究版图中，具身智能虽然在机器人操作、自动化系统与现实应用中至关重要，却常被视为「系统工程驱动」的研究方向，鲜少被认为能够在 AI 核心建模范式上产生决定性影响。

来自主题: AI技术研报

6499 点击 2026-01-26 14:21