AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
对抗KV Cache压缩的脆弱性:两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性:两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性:两行代码以最坏风险控制防御底层假设崩塌

随着大模型长上下文能力快速增长,海量 KV Cache 存储需求急剧增加,各类 KV Cache 压缩方法如雨后春笋般涌现。然而,这些方案在真实场景中的工程落地却常常陷入困境。

来自主题: AI技术研报
8744 点击    2026-03-25 13:41
Ψ₀刚刚开源了!迈向通用人形机器人的基座模型

Ψ₀刚刚开源了!迈向通用人形机器人的基座模型

Ψ₀刚刚开源了!迈向通用人形机器人的基座模型

人形机器人在春晚舞台上大放异彩!然而,人们在看惯了机器人跳舞、后空翻,乃至武术表演之后,不禁开始思考:机器人何时才能真正走进大众生活,解决日常生活中的琐碎任务,从而解放人类的双手?

来自主题: AI技术研报
7352 点击    2026-03-25 13:40
LeCun的世界模型单GPU就能跑了

LeCun的世界模型单GPU就能跑了

LeCun的世界模型单GPU就能跑了

LeCun世界模型最新进展,开源了一套极简训练方案,单GPU就能跑。

来自主题: AI技术研报
6298 点击    2026-03-24 17:25
ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

近期,基于捷径化概率流路径(shortcut probability flow trajectory)并从头训练的一步扩散生成模型,展现出强大的实证有效性。然而,这类方法的提出通常建立在较为复杂的理论推导之上,并且往往与具体实现细节高度耦合。这带来一个直接的问题:究竟哪些设计是方法成立的本质要素,哪些又只是可以灵活替换的实现组件。

来自主题: AI技术研报
6922 点击    2026-03-24 17:19
Sand.ai重磅更新MagiAttention,正在定义分布式Attention性能新标杆

Sand.ai重磅更新MagiAttention,正在定义分布式Attention性能新标杆

Sand.ai重磅更新MagiAttention,正在定义分布式Attention性能新标杆

2025 年 4 月,Sand.ai 开源了 MagiAttention v1.0.0,定义了下一代分布式 Attention 的全新设计和系统框架。历经一年的深耕,今天 Sand.ai 正式发布:MagiAttention v1.1.0,以更成熟的原生算子组件,重新定义 Hopper 与 Blackwell 两代架构分布式 Attention 的性能上限。

来自主题: AI技术研报
6049 点击    2026-03-24 16:31
MiniMax 定理:压缩即智能

MiniMax 定理:压缩即智能

MiniMax 定理:压缩即智能

我们在很多地方都看到了一个词,叫「压缩即智能」

来自主题: AI技术研报
6722 点击    2026-03-24 16:30
科研数据不再碎片化!一张可计算图,连起整个科研世界

科研数据不再碎片化!一张可计算图,连起整个科研世界

科研数据不再碎片化!一张可计算图,连起整个科研世界

UIUC研究团队打造ResearchArcade,将ArXiv论文、OpenReview评审、图表代码等碎片数据连接成动态知识图谱。模型可直接学习引用关系、修改轨迹与审稿互动,让AI更好辅助科研写作、修订与预测,为下一代科研智能体奠定统一数据基础。

来自主题: AI技术研报
7542 点击    2026-03-24 16:30
破解在线长时序重建难题!纯视觉、单卡实时的公里级流式3D重建|CVPR'26

破解在线长时序重建难题!纯视觉、单卡实时的公里级流式3D重建|CVPR'26

破解在线长时序重建难题!纯视觉、单卡实时的公里级流式3D重建|CVPR'26

在自动驾驶、具身智能、AR/VR应用中做3D重建,大家都想解决一个终极问题: 模型能不能像人一样,一边往前看,一边持续构建三维世界?

来自主题: AI技术研报
7597 点击    2026-03-24 16:28
CVPR 2026 | 让AI视频不再「串戏」:免训练精准控制多段动作,SwitchCraft一招破解逻辑崩坏

CVPR 2026 | 让AI视频不再「串戏」:免训练精准控制多段动作,SwitchCraft一招破解逻辑崩坏

CVPR 2026 | 让AI视频不再「串戏」:免训练精准控制多段动作,SwitchCraft一招破解逻辑崩坏

近年来,随着 Sora、Seedance 等文本到视频(T2V)扩散模型的飞速发展,AI 视频生成在视觉保真度与动态表现上已取得突破性进展。特别是近期备受瞩目的 Seedance 2.0,展现出了极其强大的多镜头叙事与复杂分镜控制能力。

来自主题: AI技术研报
9985 点击    2026-03-24 16:28
一夜之间,AI终获「永久记忆」!最难考试99%刷爆SOTA,全网直呼疯狂

一夜之间,AI终获「永久记忆」!最难考试99%刷爆SOTA,全网直呼疯狂

一夜之间,AI终获「永久记忆」!最难考试99%刷爆SOTA,全网直呼疯狂

AI终于有了「永久记忆」!今天,超级记忆系统ASMR重磅登场,在业界公认最难AI记忆考试中,刷爆SOTA拿下99%成绩。全网直呼太疯狂。

来自主题: AI技术研报
7322 点击    2026-03-24 10:46
技多不压身,那龙虾的 Skill 是越多越好吗?

技多不压身,那龙虾的 Skill 是越多越好吗?

技多不压身,那龙虾的 Skill 是越多越好吗?

安装完 OpenClaw 的那个晚上,我做的第一件事是这样的: 打开 ClawHub,看到几万个 Skill 整整齐齐排列在那里,于是我一个接一个地给我的小龙虾装...

来自主题: AI技术研报
9866 点击    2026-03-24 10:44
东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

随着多模态大语言模型(MLLM)支持更长上下文,高分辨率图像和长视频会产生远多于文本的视觉 Token,在自注意力二次复杂度下迅速成为效率瓶颈。

来自主题: AI技术研报
8928 点击    2026-03-24 10:13
龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一

龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一

龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一

UCSD团队推出AIBuildAI智能体,无需编程,仅用自然语言描述任务,即可自动设计、编码、训练、调参并优化AI模型,分工协作,端到端完成AI开发。在OpenAI MLE-Bench测试中,AIBuildAI以63.1%的获奖率位居第一,性能媲美人类专家,推动AI开发迈向全自动化新时代。

来自主题: AI技术研报
6792 点击    2026-03-24 10:00
Web Access:一个Skill,拉满Agent联网和浏览器能力

Web Access:一个Skill,拉满Agent联网和浏览器能力

Web Access:一个Skill,拉满Agent联网和浏览器能力

这个 Skill,能让你的 Agent 联网能力提升到最离谱的一集。

来自主题: AI技术研报
6726 点击    2026-03-23 14:14
AI自己写代码做科研还跑赢了前沿算法?清华团队开源Alchemy框架

AI自己写代码做科研还跑赢了前沿算法?清华团队开源Alchemy框架

AI自己写代码做科研还跑赢了前沿算法?清华团队开源Alchemy框架

AI 驱动的自动化科研正从概念走向真实系统。近期受到广泛关注的 FARS,以及 Karpathy 开源的 autoresearch,都在不同程度上展示了 AI Scientist 自动进行 AI 领域研究的可行性。

来自主题: AI技术研报
6570 点击    2026-03-23 13:43
CVPR 2026 | 中科院、港中文等提出HiFi-Inpaint:无损还原物体细节,重塑Inpainting生成范式!

CVPR 2026 | 中科院、港中文等提出HiFi-Inpaint:无损还原物体细节,重塑Inpainting生成范式!

CVPR 2026 | 中科院、港中文等提出HiFi-Inpaint:无损还原物体细节,重塑Inpainting生成范式!

在 AIGC 领域,基于参考图像的图像修复(Reference-based Inpainting)一直是一项备受关注的核心任务,它旨在利用参考图像引导修复过程,生成视觉一致的内容。这一技术在广告营销和电商领域有着巨大的应用潜力,例如让 AI 自动生成 “真人手持或穿戴商品” 的展示图。

来自主题: AI技术研报
5566 点击    2026-03-23 09:53
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

一张蓝锥嘴雀的图片,你能认出它是“鸟”,但能认出它是“鸟纲-雀形目-唐纳雀科-锥嘴雀属-蓝锥嘴雀”吗?

来自主题: AI技术研报
6233 点击    2026-03-23 09:52
扩散语言模型总是均匀发力,华为诺亚教它「抓重点」

扩散语言模型总是均匀发力,华为诺亚教它「抓重点」

扩散语言模型总是均匀发力,华为诺亚教它「抓重点」

这两年,扩散语言模型(Diffusion LLM)一直是个很有讨论度的方向。

来自主题: AI技术研报
5821 点击    2026-03-23 09:51
万字讲透OpenClaw🦞从"能用"到"真好用"的分水岭: Workspace 深度解析

万字讲透OpenClaw🦞从"能用"到"真好用"的分水岭: Workspace 深度解析

万字讲透OpenClaw🦞从"能用"到"真好用"的分水岭: Workspace 深度解析

一边的人,每次跟 Agent 说话都像重新 onboarding:得再讲一遍背景、偏好和上下文。另一边的人,Agent 已经知道自己是谁、该怎么说话、用户讨厌什么,也记得上次积累下来的东西。这条分界线,叫 workspace。

来自主题: AI技术研报
8506 点击    2026-03-22 10:01