AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

不止于量化:最新综述用「时-空-构」三维视角解构KV Cache系统级优化

近期,来自墨尔本大学和华中科技大学的研究者们发布了一篇深度综述,从 MLSys 的思维出发,用一套新颖的「时间 - 空间 - 结构」系统行为视角对 KV cache 优化方法进行了系统性梳理与深入分析,并将相关资源整理成了持续维护的 Awesome 资源库,方便研究者与从业人员快速定位与落地。

来自主题: AI技术研报
5611 点击    2026-01-16 14:24
跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

跳出「黑盒」,人大刘勇团队最新大语言模型理论与机理综述

大语言模型(LLMs)的爆发式增长引领了人工智能领域的范式转移,取得了巨大的工程成功。然而,一个关键的悖论依然存在:尽管 LLMs 在实践中表现卓越,但其理论研究仍处于起步阶段,导致这些系统在很大程度上被视为难以捉摸的「黑盒」。

来自主题: AI技术研报
5846 点击    2026-01-16 10:09
DeepSeek连发两篇论文背后,原来藏着一场学术接力

DeepSeek连发两篇论文背后,原来藏着一场学术接力

DeepSeek连发两篇论文背后,原来藏着一场学术接力

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

来自主题: AI技术研报
10108 点击    2026-01-16 10:06
人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」

人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」

人脸机器人登上Science Robotics封面:用AI教会仿生人脸机器人「开口说话」

胡宇航(网名 “U 航”),毕业于美国哥伦比亚大学,博士学位,首形科技创始人。长期专注于机器人自主学习的研究工作。研究成果发表于《Nature Machine Intelligence》,《Science Robotics》等国际顶级期刊。

来自主题: AI技术研报
6995 点击    2026-01-16 10:03
仅需一个混频器的无线射频机器学习推理,登上Science Advances!

仅需一个混频器的无线射频机器学习推理,登上Science Advances!

仅需一个混频器的无线射频机器学习推理,登上Science Advances!

机器学习部署在边端设备的时候,模型总是存储在云端服务器上(5G 基站),而模型输入输出总是在边端设备上(例如用照相机拍摄照片然后识别其中的目标)。在这种场景下,传统有以下两种方案完成机器学习的推理:

来自主题: AI技术研报
9534 点击    2026-01-16 10:01
不得了,这个新技术把视频压缩到了0.02%!

不得了,这个新技术把视频压缩到了0.02%!

不得了,这个新技术把视频压缩到了0.02%!

感谢AI!

来自主题: AI技术研报
6882 点击    2026-01-15 10:35
“Claude Cowork 杀死了我的创业公司”

“Claude Cowork 杀死了我的创业公司”

“Claude Cowork 杀死了我的创业公司”

AI 不再仅仅是操作和交互的对象,它开始成为 Coworker。

来自主题: AI技术研报
9275 点击    2026-01-15 09:27
让Agent记住一切是愚蠢的:SimpleMem用「结构化语义压缩」登顶记忆SOTA

让Agent记住一切是愚蠢的:SimpleMem用「结构化语义压缩」登顶记忆SOTA

让Agent记住一切是愚蠢的:SimpleMem用「结构化语义压缩」登顶记忆SOTA

如果人类的大脑像现在的LLM Agent一样工作,记住每一句今天明天的废话,我们在五岁时就会因为内存溢出而宕机。真正的智能,核心不在于“存储”,而在于高效的“遗忘”与“重组”。

来自主题: AI技术研报
8415 点击    2026-01-15 09:22
视觉模型既懂语义,又能还原细节,南洋理工&商汤提出棱镜假说

视觉模型既懂语义,又能还原细节,南洋理工&商汤提出棱镜假说

视觉模型既懂语义,又能还原细节,南洋理工&商汤提出棱镜假说

作者来自 Nanyang Technological University(MMLab) 与 SenseTime Research,提出 Prism Hypothesis(棱镜假说) 与 Unified Autoencoding(UAE),尝试用 “频率谱” 的统一视角,把语义编码器与像素编码器的表示冲突真正 “合并解决”。

来自主题: AI技术研报
9837 点击    2026-01-15 09:20
官宣,Milvus开源语义高亮模型:告别饱和检索,帮RAG、agent剪枝80%上下文

官宣,Milvus开源语义高亮模型:告别饱和检索,帮RAG、agent剪枝80%上下文

官宣,Milvus开源语义高亮模型:告别饱和检索,帮RAG、agent剪枝80%上下文

RAG与agent用到深水区,一定会遇到这个问题: 明明架构很完美,私有数据也做了接入,但项目上线三天,不但token账单爆了,模型输出结果也似乎总差点意思。

来自主题: AI技术研报
9237 点击    2026-01-15 09:19
端到端智驾新SOTA | KnowVal:懂法律道德、有价值观的智能驾驶系统

端到端智驾新SOTA | KnowVal:懂法律道德、有价值观的智能驾驶系统

端到端智驾新SOTA | KnowVal:懂法律道德、有价值观的智能驾驶系统

一个智能驾驶系统,在迈向高阶自动驾驶的过程中,应当具备何种能力?除了基础的感知、预测、规划、决策能力,如何对三维空间进行更深入的理解?如何具备包含法律法规、道德原则、防御性驾驶原则等知识?如何进行基本的视觉 - 语言推理?如何让智能系统具备世界观和价值观?

来自主题: AI技术研报
7632 点击    2026-01-15 09:18
这一次,谷歌Veo 3.1教Sora做视频!角色0变形,4K竖屏直接满分

这一次,谷歌Veo 3.1教Sora做视频!角色0变形,4K竖屏直接满分

这一次,谷歌Veo 3.1教Sora做视频!角色0变形,4K竖屏直接满分

今天,谷歌Veo 3.1终于迎来重磅升级,表现力直接爆表! 这一次,谷歌特别优化了移动端体验。只需上传一些「素材图片」(ingredient images),就能轻松创作出更有趣、更有创意、画质极佳的视频。

来自主题: AI技术研报
7611 点击    2026-01-14 17:07
500万次围观,1X把「世界模型」真正用在了机器人NEO身上

500万次围观,1X把「世界模型」真正用在了机器人NEO身上

500万次围观,1X把「世界模型」真正用在了机器人NEO身上

还记得那个穿着「Lululemon」紧身衣、主打温柔陪伴的家用人形机器人 NEO 吗?

来自主题: AI技术研报
7494 点击    2026-01-14 15:35
AAAI 2026|AP2O-Coder 让大模型拥有「错题本」,像人类一样按题型高效刷题

AAAI 2026|AP2O-Coder 让大模型拥有「错题本」,像人类一样按题型高效刷题

AAAI 2026|AP2O-Coder 让大模型拥有「错题本」,像人类一样按题型高效刷题

在 AI 辅助 Coding 技术快速发展的背景下,大语言模型(LLMs)虽显著提升了软件开发效率,但开源的 LLMs 生成的代码依旧存在运行时错误,增加了开发者调试成本。

来自主题: AI技术研报
9064 点击    2026-01-14 15:28
Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起

Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起

Sebastian Raschka 2026预测:Transformer统治依旧,但扩散模型正悄然崛起

站在 2026 年的开端回望,LLM 的架构之争似乎进入了一个新的微妙阶段。过去几年,Transformer 架构以绝对的统治力横扫了人工智能领域,但随着算力成本的博弈和对推理效率的极致追求,挑战者们从未停止过脚步。

来自主题: AI技术研报
9149 点击    2026-01-14 15:25
DeepSeek最新论文 Engram 解读,牛逼!

DeepSeek最新论文 Engram 解读,牛逼!

DeepSeek最新论文 Engram 解读,牛逼!

今天DeepSeek又发表了一篇论文,让AI解读,仔细读完,觉得很牛逼。

来自主题: AI技术研报
9731 点击    2026-01-14 11:50
发现一个贼牛的开源项目,AI一键生成完整视频

发现一个贼牛的开源项目,AI一键生成完整视频

发现一个贼牛的开源项目,AI一键生成完整视频

从ChatGPT爆火以后,就总有“AI太牛了,自己是不是要失业了”等等类似的声音出现。

来自主题: AI技术研报
9595 点击    2026-01-14 11:46
2025 AI 趋势报告:Agents 正在跨越鸿沟

2025 AI 趋势报告:Agents 正在跨越鸿沟

2025 AI 趋势报告:Agents 正在跨越鸿沟

2025 年,AI 智能体“跨过了鸿沟”,开始被更广泛、务实的用户群体采用,不再只是少数发烧友或愿景家在用。

来自主题: AI技术研报
7530 点击    2026-01-14 10:47
不会封号的Claude Code使用方法!已稳定测试一个月,还能共享给团队。

不会封号的Claude Code使用方法!已稳定测试一个月,还能共享给团队。

不会封号的Claude Code使用方法!已稳定测试一个月,还能共享给团队。

哈喽,大家好,我是刘小排。 使用Claude Code最大的痛点是什么?其实不是贵,而是封号。因为就算使用Claude Max Plan 每月$200美金,虽然看上去贵,但是一个月能轻松用上价值数千美金甚至上万美金的token,是很便宜的。

来自主题: AI技术研报
6169 点击    2026-01-14 10:03
不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?

不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?

不上云、不租卡,如何优雅地在本地微调Qwen-VL-30B?

假如你是一个致力于将 AI 引入传统行业的工程团队。现在,你有一个问题:训练一个能看懂复杂机械图纸、设备维护手册或金融研报图表的多模态助手。这个助手不仅要能专业陪聊,更要能精准地识别图纸上的零件标注,或者从密密麻麻的财报截图中提取关键数据。

来自主题: AI技术研报
10178 点击    2026-01-13 16:38
华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

华为推出软工代码智能体SWE-Lego,解锁SFT训练极致性能

“软工任务要改多文件、多轮工具调用,模型怎么学透?高质量训练数据稀缺,又怕轨迹含噪声作弊?复杂 RL 训练成本高,中小团队望而却步?”

来自主题: AI技术研报
5750 点击    2026-01-13 16:36
一个模型统一4D世界生成与重建,港科大One4D框架来了

一个模型统一4D世界生成与重建,港科大One4D框架来了

一个模型统一4D世界生成与重建,港科大One4D框架来了

近年来,视频扩散模型在 “真实感、动态性、可控性” 上进展飞快,但它们大多仍停留在纯 RGB 空间。模型能生成好看的视频,却缺少对三维几何的显式建模。这让许多世界模型(world model)导向的应用(空间推理、具身智能、机器人、自动驾驶仿真等)难以落地,因为这些任务不仅需要像素,还需要完整地模拟 4D 世界。

来自主题: AI技术研报
8059 点击    2026-01-13 16:13