AI资讯新闻榜单内容搜索-模型

不止于量化：最新综述用「时-空-构」三维视角解构KV Cache系统级优化

近期，来自墨尔本大学和华中科技大学的研究者们发布了一篇深度综述，从 MLSys 的思维出发，用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化方法进行了系统性梳理与深入分析，并将相关资源整理成了持续维护的 Awesome 资源库，方便研究者与从业人员快速定位与落地。

来自主题: AI技术研报

5919 点击 2026-01-16 14:24

o1从榜首暴跌至#56，Claude 3 Opus坠入#139。LMSYS榜单揭示残酷真相：大模型的「霸主保质期」只有35天！这不是技术迭代，这是对所有应用层开发者的降维屠杀。

来自主题: AI资讯

6371 点击 2026-01-16 10:54

大语言模型（LLMs）的爆发式增长引领了人工智能领域的范式转移，取得了巨大的工程成功。然而，一个关键的悖论依然存在：尽管 LLMs 在实践中表现卓越，但其理论研究仍处于起步阶段，导致这些系统在很大程度上被视为难以捉摸的「黑盒」。

来自主题: AI技术研报

6300 点击 2026-01-16 10:09

胡宇航（网名 “U 航”），毕业于美国哥伦比亚大学，博士学位，首形科技创始人。长期专注于机器人自主学习的研究工作。研究成果发表于《Nature Machine Intelligence》，《Science Robotics》等国际顶级期刊。

来自主题: AI技术研报

7525 点击 2026-01-16 10:03

机器学习部署在边端设备的时候，模型总是存储在云端服务器上（5G 基站），而模型输入输出总是在边端设备上（例如用照相机拍摄照片然后识别其中的目标）。在这种场景下，传统有以下两种方案完成机器学习的推理：

来自主题: AI技术研报

9963 点击 2026-01-16 10:01

谷歌正式发布了由最新Gemini3模型驱动的“Personal Intelligence”功能。它将谷歌旗下四大应用的数据池进行了底层连接，让AI获得了跨应用权限。

来自主题: AI资讯

9569 点击 2026-01-15 19:48

上个月你刚花 20 美元订阅了 ChatGPT Plus，转头这个月朋友圈就被「Claude 秒杀一切」刷屏，再过一个月可能又换成「Gemini 吊打一切」。

来自主题: AI资讯

7895 点击 2026-01-15 10:39

感谢AI！

来自主题: AI技术研报

7215 点击 2026-01-15 10:35

在3D角色动画创作领域，高质量动作资产的匮乏长期制约着产出的上限。

来自主题: AI技术研报

7770 点击 2026-01-15 09:26

如果人类的大脑像现在的LLM Agent一样工作，记住每一句今天明天的废话，我们在五岁时就会因为内存溢出而宕机。真正的智能，核心不在于“存储”，而在于高效的“遗忘”与“重组”。

来自主题: AI技术研报

8851 点击 2026-01-15 09:22