AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
LeCun的世界模型单GPU就能跑了

LeCun的世界模型单GPU就能跑了

LeCun的世界模型单GPU就能跑了

LeCun世界模型最新进展,开源了一套极简训练方案,单GPU就能跑。

来自主题: AI技术研报
6239 点击    2026-03-24 17:25
ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

ICLR 2026 | ESC — 解构一步生成,厘清细节,探寻本质

近期,基于捷径化概率流路径(shortcut probability flow trajectory)并从头训练的一步扩散生成模型,展现出强大的实证有效性。然而,这类方法的提出通常建立在较为复杂的理论推导之上,并且往往与具体实现细节高度耦合。这带来一个直接的问题:究竟哪些设计是方法成立的本质要素,哪些又只是可以灵活替换的实现组件。

来自主题: AI技术研报
6870 点击    2026-03-24 17:19
Sand.ai重磅更新MagiAttention,正在定义分布式Attention性能新标杆

Sand.ai重磅更新MagiAttention,正在定义分布式Attention性能新标杆

Sand.ai重磅更新MagiAttention,正在定义分布式Attention性能新标杆

2025 年 4 月,Sand.ai 开源了 MagiAttention v1.0.0,定义了下一代分布式 Attention 的全新设计和系统框架。历经一年的深耕,今天 Sand.ai 正式发布:MagiAttention v1.1.0,以更成熟的原生算子组件,重新定义 Hopper 与 Blackwell 两代架构分布式 Attention 的性能上限。

来自主题: AI技术研报
6002 点击    2026-03-24 16:31
MiniMax 定理:压缩即智能

MiniMax 定理:压缩即智能

MiniMax 定理:压缩即智能

我们在很多地方都看到了一个词,叫「压缩即智能」

来自主题: AI技术研报
6674 点击    2026-03-24 16:30
科研数据不再碎片化!一张可计算图,连起整个科研世界

科研数据不再碎片化!一张可计算图,连起整个科研世界

科研数据不再碎片化!一张可计算图,连起整个科研世界

UIUC研究团队打造ResearchArcade,将ArXiv论文、OpenReview评审、图表代码等碎片数据连接成动态知识图谱。模型可直接学习引用关系、修改轨迹与审稿互动,让AI更好辅助科研写作、修订与预测,为下一代科研智能体奠定统一数据基础。

来自主题: AI技术研报
7496 点击    2026-03-24 16:30
破解在线长时序重建难题!纯视觉、单卡实时的公里级流式3D重建|CVPR'26

破解在线长时序重建难题!纯视觉、单卡实时的公里级流式3D重建|CVPR'26

破解在线长时序重建难题!纯视觉、单卡实时的公里级流式3D重建|CVPR'26

在自动驾驶、具身智能、AR/VR应用中做3D重建,大家都想解决一个终极问题: 模型能不能像人一样,一边往前看,一边持续构建三维世界?

来自主题: AI技术研报
7547 点击    2026-03-24 16:28
CVPR 2026 | 让AI视频不再「串戏」:免训练精准控制多段动作,SwitchCraft一招破解逻辑崩坏

CVPR 2026 | 让AI视频不再「串戏」:免训练精准控制多段动作,SwitchCraft一招破解逻辑崩坏

CVPR 2026 | 让AI视频不再「串戏」:免训练精准控制多段动作,SwitchCraft一招破解逻辑崩坏

近年来,随着 Sora、Seedance 等文本到视频(T2V)扩散模型的飞速发展,AI 视频生成在视觉保真度与动态表现上已取得突破性进展。特别是近期备受瞩目的 Seedance 2.0,展现出了极其强大的多镜头叙事与复杂分镜控制能力。

来自主题: AI技术研报
9942 点击    2026-03-24 16:28
一夜之间,AI终获「永久记忆」!最难考试99%刷爆SOTA,全网直呼疯狂

一夜之间,AI终获「永久记忆」!最难考试99%刷爆SOTA,全网直呼疯狂

一夜之间,AI终获「永久记忆」!最难考试99%刷爆SOTA,全网直呼疯狂

AI终于有了「永久记忆」!今天,超级记忆系统ASMR重磅登场,在业界公认最难AI记忆考试中,刷爆SOTA拿下99%成绩。全网直呼太疯狂。

来自主题: AI技术研报
7287 点击    2026-03-24 10:46
技多不压身,那龙虾的 Skill 是越多越好吗?

技多不压身,那龙虾的 Skill 是越多越好吗?

技多不压身,那龙虾的 Skill 是越多越好吗?

安装完 OpenClaw 的那个晚上,我做的第一件事是这样的: 打开 ClawHub,看到几万个 Skill 整整齐齐排列在那里,于是我一个接一个地给我的小龙虾装...

来自主题: AI技术研报
9837 点击    2026-03-24 10:44
东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

随着多模态大语言模型(MLLM)支持更长上下文,高分辨率图像和长视频会产生远多于文本的视觉 Token,在自注意力二次复杂度下迅速成为效率瓶颈。

来自主题: AI技术研报
8913 点击    2026-03-24 10:13
龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一

龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一

龙虾也能养龙虾!UCSD发布AIBuildAI智能体,MLE-Bench榜单第一

UCSD团队推出AIBuildAI智能体,无需编程,仅用自然语言描述任务,即可自动设计、编码、训练、调参并优化AI模型,分工协作,端到端完成AI开发。在OpenAI MLE-Bench测试中,AIBuildAI以63.1%的获奖率位居第一,性能媲美人类专家,推动AI开发迈向全自动化新时代。

来自主题: AI技术研报
6759 点击    2026-03-24 10:00
Web Access:一个Skill,拉满Agent联网和浏览器能力

Web Access:一个Skill,拉满Agent联网和浏览器能力

Web Access:一个Skill,拉满Agent联网和浏览器能力

这个 Skill,能让你的 Agent 联网能力提升到最离谱的一集。

来自主题: AI技术研报
6692 点击    2026-03-23 14:14
AI自己写代码做科研还跑赢了前沿算法?清华团队开源Alchemy框架

AI自己写代码做科研还跑赢了前沿算法?清华团队开源Alchemy框架

AI自己写代码做科研还跑赢了前沿算法?清华团队开源Alchemy框架

AI 驱动的自动化科研正从概念走向真实系统。近期受到广泛关注的 FARS,以及 Karpathy 开源的 autoresearch,都在不同程度上展示了 AI Scientist 自动进行 AI 领域研究的可行性。

来自主题: AI技术研报
6549 点击    2026-03-23 13:43
CVPR 2026 | 中科院、港中文等提出HiFi-Inpaint:无损还原物体细节,重塑Inpainting生成范式!

CVPR 2026 | 中科院、港中文等提出HiFi-Inpaint:无损还原物体细节,重塑Inpainting生成范式!

CVPR 2026 | 中科院、港中文等提出HiFi-Inpaint:无损还原物体细节,重塑Inpainting生成范式!

在 AIGC 领域,基于参考图像的图像修复(Reference-based Inpainting)一直是一项备受关注的核心任务,它旨在利用参考图像引导修复过程,生成视觉一致的内容。这一技术在广告营销和电商领域有着巨大的应用潜力,例如让 AI 自动生成 “真人手持或穿戴商品” 的展示图。

来自主题: AI技术研报
5543 点击    2026-03-23 09:53
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

一张蓝锥嘴雀的图片,你能认出它是“鸟”,但能认出它是“鸟纲-雀形目-唐纳雀科-锥嘴雀属-蓝锥嘴雀”吗?

来自主题: AI技术研报
6210 点击    2026-03-23 09:52
扩散语言模型总是均匀发力,华为诺亚教它「抓重点」

扩散语言模型总是均匀发力,华为诺亚教它「抓重点」

扩散语言模型总是均匀发力,华为诺亚教它「抓重点」

这两年,扩散语言模型(Diffusion LLM)一直是个很有讨论度的方向。

来自主题: AI技术研报
5798 点击    2026-03-23 09:51
万字讲透OpenClaw🦞从"能用"到"真好用"的分水岭: Workspace 深度解析

万字讲透OpenClaw🦞从"能用"到"真好用"的分水岭: Workspace 深度解析

万字讲透OpenClaw🦞从"能用"到"真好用"的分水岭: Workspace 深度解析

一边的人,每次跟 Agent 说话都像重新 onboarding:得再讲一遍背景、偏好和上下文。另一边的人,Agent 已经知道自己是谁、该怎么说话、用户讨厌什么,也记得上次积累下来的东西。这条分界线,叫 workspace。

来自主题: AI技术研报
8453 点击    2026-03-22 10:01
CVPR 2026 | 从「单帧」到「分镜」:STAGE重新定义AI电影叙事

CVPR 2026 | 从「单帧」到「分镜」:STAGE重新定义AI电影叙事

CVPR 2026 | 从「单帧」到「分镜」:STAGE重新定义AI电影叙事

目前,该论文已录用至 CVPR 2026,相关数据集和模型训练训练和推理代码将逐步开源:究其原因,一个好故事并非一堆漂亮镜头的简单拼接,而是一个有结构、有逻辑的叙事整体。

来自主题: AI技术研报
8039 点击    2026-03-22 09:39
从经历到知识:UIUC、清华PlugMem如何重构Agent记忆

从经历到知识:UIUC、清华PlugMem如何重构Agent记忆

从经历到知识:UIUC、清华PlugMem如何重构Agent记忆

现在的AI agent往往把长交互历史直接存起来,但很难高效复用。最朴素的方法直接从「原始记忆」里检索,但常常把模型淹没在冗长、低价值的上下文里。PlugMem把经验转化为结构化、可复用的知识,并提出一个任务无关(task-agnostic)的统一记忆模块,在多种Agent基准上提升性能,同时消耗更少。

来自主题: AI技术研报
7534 点击    2026-03-22 09:37
比现有框架快22倍,浙大开源EasySteer:高性能LLM Steering统一框架

比现有框架快22倍,浙大开源EasySteer:高性能LLM Steering统一框架

比现有框架快22倍,浙大开源EasySteer:高性能LLM Steering统一框架

在此背景下,浙江大学研究团队提出了 EasySteer——一个基于 vLLM 构建的高性能、可扩展 LLM Steering 统一框架。该框架通过与 vLLM 推理引擎的深度集成,相比现有 Steering 框架实现了 10.8-22.3 倍的推理加速,同时提供更细粒度的干预控制,并为八大应用场景提供了预计算 Steering 向量与完整复现示例,方便研究者快速上手和对照复现。

来自主题: AI技术研报
7464 点击    2026-03-22 09:35
普林斯顿开源OpenClaw-RL:使用不中断还能自进化,对话就有「反向传播信号」太猛了!

普林斯顿开源OpenClaw-RL:使用不中断还能自进化,对话就有「反向传播信号」太猛了!

普林斯顿开源OpenClaw-RL:使用不中断还能自进化,对话就有「反向传播信号」太猛了!

OpenClaw-RL的核心价值在于:它能让您的OpenClaw🦞仅仅通过与你日常对话产生的自然反馈(如你的纠正、补充说明或环境报错),就能在后台实时自动更新权重,变得越来越符合您的个性化偏好,并在实际任务中不再犯同样的错误。

来自主题: AI技术研报
7414 点击    2026-03-21 10:01
狠人揭秘ClaudeCode、Cursor、OpenAI智能体工程技术:模型几乎无关紧要,而是构建正确的工程环境!Harness就是一切!

狠人揭秘ClaudeCode、Cursor、OpenAI智能体工程技术:模型几乎无关紧要,而是构建正确的工程环境!Harness就是一切!

狠人揭秘ClaudeCode、Cursor、OpenAI智能体工程技术:模型几乎无关紧要,而是构建正确的工程环境!Harness就是一切!

2026年开年以来,Harness工程一词热度渐高,OpenAI在2月发布的一篇详细的内部实验报告标题中使用了此词,ThoughtWorks 首席科学家 Martin Fowler 在 X上也表示Harness工程是AI赋能软件开发的关键部分。

来自主题: AI技术研报
8015 点击    2026-03-21 09:30
ICLR 2026 | Shop-R1: 给AI补上「内心戏」,在RL博弈中复刻人类网购脑

ICLR 2026 | Shop-R1: 给AI补上「内心戏」,在RL博弈中复刻人类网购脑

ICLR 2026 | Shop-R1: 给AI补上「内心戏」,在RL博弈中复刻人类网购脑

传统的 AI 购物助手更像是一个任务完成机器:接到指令,搜索,下单。他们或许能跑通流程,却完全无法理解用户为何在最后一刻因为一条关于 “夹耳朵” 的差评而放弃支付。简而言之,传统的电商 Agent 只是任务导向的(task-oriented),而不是模拟导向的(simulation-oriented)。为此,来自亚马逊(Amazon)的研究团队提出了名为 Shop-R1 的训练框架 。

来自主题: AI技术研报
7089 点击    2026-03-21 09:28
万字综述遥感AI智能体!六大应用场景全面爆发,地理空间智能从「眼睛」变「大脑」

万字综述遥感AI智能体!六大应用场景全面爆发,地理空间智能从「眼睛」变「大脑」

万字综述遥感AI智能体!六大应用场景全面爆发,地理空间智能从「眼睛」变「大脑」

如今,一场由 AI 智能体驱动的变革正在发生。近日,来自香港科技大学、西北工业大学、清华大学等多家高校及研究机构的学者联合发布了遥感 AI 智能体领域系统综述。全文逾万字,首次为「遥感智能体」给出了严格定义,系统梳理了其架构、应用、数据集与未来方向。

来自主题: AI技术研报
7942 点击    2026-03-21 09:28