AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

近期,来自墨尔本大学和华中科技大学的研究者们发布了一篇深度综述,从 MLSys 的思维出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化方法进行了系统性梳理与深入分析,并将相关资源整理成了持续维护的 Awesome 资源库,方便研究者与从业人员快速定位与落地。

来自主题: AI技术研报
5919 点击    2026-01-16 14:24
35天,版本之子变路人甲:AI榜单太残酷!

35天,版本之子变路人甲:AI榜单太残酷!

35天,版本之子变路人甲:AI榜单太残酷!

o1从榜首暴跌至#56,Claude 3 Opus坠入#139。LMSYS榜单揭示残酷真相:大模型的「霸主保质期」只有35天!这不是技术迭代,这是对所有应用层开发者的降维屠杀。

来自主题: AI资讯
6371 点击    2026-01-16 10:54
跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

大语言模型(LLMs)的爆发式增长引领了人工智能领域的范式转移,取得了巨大的工程成功。然而,一个关键的悖论依然存在:尽管 LLMs 在实践中表现卓越,但其理论研究仍处于起步阶段,导致这些系统在很大程度上被视为难以捉摸的「黑盒」。

来自主题: AI技术研报
6300 点击    2026-01-16 10:09
人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」

人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」

人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」

胡宇航(网名 “U 航”),毕业于美国哥伦比亚大学,博士学位,首形科技创始人。长期专注于机器人自主学习的研究工作。研究成果发表于《Nature Machine Intelligence》,《Science Robotics》等国际顶级期刊。

来自主题: AI技术研报
7525 点击    2026-01-16 10:03
仅需一个混频器的无线射频机器学习推理,登上Science Advances!

仅需一个混频器的无线射频机器学习推理,登上Science Advances!

仅需一个混频器的无线射频机器学习推理,登上Science Advances!

机器学习部署在边端设备的时候,模型总是存储在云端服务器上(5G 基站),而模型输入输出总是在边端设备上(例如用照相机拍摄照片然后识别其中的目标)。在这种场景下,传统有以下两种方案完成机器学习的推理:

来自主题: AI技术研报
9963 点击    2026-01-16 10:01
Gemini盘活了谷歌全家桶,“原生”自带你10年的记忆

Gemini盘活了谷歌全家桶,“原生”自带你10年的记忆

Gemini盘活了谷歌全家桶,“原生”自带你10年的记忆

谷歌正式发布了由最新Gemini3模型驱动的“Personal Intelligence”功能。它将谷歌旗下四大应用的数据池进行了底层连接,让AI获得了跨应用权限。

来自主题: AI资讯
9569 点击    2026-01-15 19:48
35 天,成了 AI 模型的斩杀线

35 天,成了 AI 模型的斩杀线

35 天,成了 AI 模型的斩杀线

上个月你刚花 20 美元订阅了 ChatGPT Plus,转头这个月朋友圈就被「Claude 秒杀一切」刷屏,再过一个月可能又换成「Gemini 吊打一切」。

来自主题: AI资讯
7895 点击    2026-01-15 10:39
不得了,这个新技术把视频压缩到了0.02%!

不得了,这个新技术把视频压缩到了0.02%!

不得了,这个新技术把视频压缩到了0.02%!

感谢AI!

来自主题: AI技术研报
7215 点击    2026-01-15 10:35
让Agent记住一切是愚蠢的:SimpleMem用「结构化语义压缩」登顶记忆SOTA

让Agent记住一切是愚蠢的:SimpleMem用「结构化语义压缩」登顶记忆SOTA

让Agent记住一切是愚蠢的:SimpleMem用「结构化语义压缩」登顶记忆SOTA

如果人类的大脑像现在的LLM Agent一样工作,记住每一句今天明天的废话,我们在五岁时就会因为内存溢出而宕机。真正的智能,核心不在于“存储”,而在于高效的“遗忘”与“重组”。

来自主题: AI技术研报
8851 点击    2026-01-15 09:22