AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
普林斯顿开源OpenClaw-RL:使用不中断还能自进化,对话就有「反向传播信号」太猛了!

普林斯顿开源OpenClaw-RL:使用不中断还能自进化,对话就有「反向传播信号」太猛了!

普林斯顿开源OpenClaw-RL:使用不中断还能自进化,对话就有「反向传播信号」太猛了!

OpenClaw-RL的核心价值在于:它能让您的OpenClaw🦞仅仅通过与你日常对话产生的自然反馈(如你的纠正、补充说明或环境报错),就能在后台实时自动更新权重,变得越来越符合您的个性化偏好,并在实际任务中不再犯同样的错误。

来自主题: AI技术研报
7304 点击    2026-03-21 10:01
狠人揭秘ClaudeCode、Cursor、OpenAI智能体工程技术:模型几乎无关紧要,而是构建正确的工程环境!Harness就是一切!

狠人揭秘ClaudeCode、Cursor、OpenAI智能体工程技术:模型几乎无关紧要,而是构建正确的工程环境!Harness就是一切!

狠人揭秘ClaudeCode、Cursor、OpenAI智能体工程技术:模型几乎无关紧要,而是构建正确的工程环境!Harness就是一切!

2026年开年以来,Harness工程一词热度渐高,OpenAI在2月发布的一篇详细的内部实验报告标题中使用了此词,ThoughtWorks 首席科学家 Martin Fowler 在 X上也表示Harness工程是AI赋能软件开发的关键部分。

来自主题: AI技术研报
7904 点击    2026-03-21 09:30
ICLR 2026 | Shop-R1: 给AI补上「内心戏」,在RL博弈中复刻人类网购脑

ICLR 2026 | Shop-R1: 给AI补上「内心戏」,在RL博弈中复刻人类网购脑

ICLR 2026 | Shop-R1: 给AI补上「内心戏」,在RL博弈中复刻人类网购脑

传统的 AI 购物助手更像是一个任务完成机器:接到指令,搜索,下单。他们或许能跑通流程,却完全无法理解用户为何在最后一刻因为一条关于 “夹耳朵” 的差评而放弃支付。简而言之,传统的电商 Agent 只是任务导向的(task-oriented),而不是模拟导向的(simulation-oriented)。为此,来自亚马逊(Amazon)的研究团队提出了名为 Shop-R1 的训练框架 。

来自主题: AI技术研报
6976 点击    2026-03-21 09:28
万字综述遥感AI智能体!六大应用场景全面爆发,地理空间智能从「眼睛」变「大脑」

万字综述遥感AI智能体!六大应用场景全面爆发,地理空间智能从「眼睛」变「大脑」

万字综述遥感AI智能体!六大应用场景全面爆发,地理空间智能从「眼睛」变「大脑」

如今,一场由 AI 智能体驱动的变革正在发生。近日,来自香港科技大学、西北工业大学、清华大学等多家高校及研究机构的学者联合发布了遥感 AI 智能体领域系统综述。全文逾万字,首次为「遥感智能体」给出了严格定义,系统梳理了其架构、应用、数据集与未来方向。

来自主题: AI技术研报
7830 点击    2026-03-21 09:28
搞不懂Skills?看看Claude Code内部工程师们是怎么玩的

搞不懂Skills?看看Claude Code内部工程师们是怎么玩的

搞不懂Skills?看看Claude Code内部工程师们是怎么玩的

养了这么久龙虾,是时候开始构建自己的 Skills 了。这时候,一篇来自 Anthropic 团队的 Skills 秘籍在外网广为流传,为想要构建 Skills 的开发者和智能体用户提供了绝佳的参考资料。

来自主题: AI技术研报
7797 点击    2026-03-20 14:37
CVPR 2026 | EmoStyle:情感也能“风格化”?深大VCC带你见证魔法!

CVPR 2026 | EmoStyle:情感也能“风格化”?深大VCC带你见证魔法!

CVPR 2026 | EmoStyle:情感也能“风格化”?深大VCC带你见证魔法!

EmoStyle 由深圳大学可视计算研究中心黄惠教授课题组独立完成,第一作者为杨景媛助理教授,第二作者为研二硕士生柏梓桓。深圳大学可视计算研究中心(VCC)以计算机图形学、计算机视觉、人机交互、机器学习、具身智能、可视化和可视分析为学科基础,致力前沿探索与跨学科创新。

来自主题: AI技术研报
6969 点击    2026-03-20 10:18
生成视频总出物理bug?用VLM迁移+token级对齐,让燃烧在正确位置发生,碰撞遵循动量守恒丨CVPR 2026近满分接收

生成视频总出物理bug?用VLM迁移+token级对齐,让燃烧在正确位置发生,碰撞遵循动量守恒丨CVPR 2026近满分接收

生成视频总出物理bug?用VLM迁移+token级对齐,让燃烧在正确位置发生,碰撞遵循动量守恒丨CVPR 2026近满分接收

当人们谈到“世界模型”(World Models)时,很多人会首先想到近年来迅速发展的生成式视频模型。

来自主题: AI技术研报
8083 点击    2026-03-20 09:39
告别噪声初始化:NTU MARS Lab提出A2A新范式,实现机器人高性能单步动作生成

告别噪声初始化:NTU MARS Lab提出A2A新范式,实现机器人高性能单步动作生成

告别噪声初始化:NTU MARS Lab提出A2A新范式,实现机器人高性能单步动作生成

在机器人领域,扩散策略(Diffusion Policy)已经成为了标准模仿学习策略和 VLA 动作生成范式,但其「从随机噪声中迭代解噪」的机制带来了不容忽视的推理延迟。如果机器人不再从随机高斯噪声开始「盲猜」,是否可以基于「刚刚做了什么」来预测「下一步做什么」呢?

来自主题: AI技术研报
5665 点击    2026-03-20 09:39
华人学生立大功!新王Mamba-3直击Transformer死穴,推理效率碾压7倍

华人学生立大功!新王Mamba-3直击Transformer死穴,推理效率碾压7倍

华人学生立大功!新王Mamba-3直击Transformer死穴,推理效率碾压7倍

Transformer不保?今天,CMU普林斯顿原班人马杀回,新一代开源架构Mamba-3震撼降临。15亿参数战力爆表,性能比Transformer飙升4%。

来自主题: AI技术研报
8391 点击    2026-03-19 17:36
突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

突破一亿Token极限:EverMind提出MSA架构,实现大模型高效端到端长时记忆

人的智能能力主要由推理能力和长期记忆能力构成。近年来,大模型的推理能力一直处于快速发展过程,但大模型的长期记忆能力一直受限于上下文长度,无法取得突破。在历史上,曾经有多种路线进行尝试,但都无法突破扩展性(Scalability)、精度(Precision)和效率(Efficiency)的不可能三角。

来自主题: AI技术研报
9191 点击    2026-03-19 17:02
超越MLA!新架构MLRA百万token,解码最高2.8倍速 | ICLR'26

超越MLA!新架构MLRA百万token,解码最高2.8倍速 | ICLR'26

超越MLA!新架构MLRA百万token,解码最高2.8倍速 | ICLR'26

MLRA通过拆分KV缓存为四个并行分支,显著降低显存占用并实现4路张量并行。推理速度比MLA最高快2.8倍,支持百万级上下文,且模型质量更优。无需牺牲性能,即可高效扩展长文本处理能力。

来自主题: AI技术研报
9959 点击    2026-03-19 15:25
CVPR 2026 | 给扩散模型装上「物理引擎」: 北大彭宇新团队提出NS-Diff,使扩散模型学会流体与刚体力学

CVPR 2026 | 给扩散模型装上「物理引擎」: 北大彭宇新团队提出NS-Diff,使扩散模型学会流体与刚体力学

CVPR 2026 | 给扩散模型装上「物理引擎」: 北大彭宇新团队提出NS-Diff,使扩散模型学会流体与刚体力学

本文是北京大学彭宇新教授团队在文本生成视频领域的最新研究成果,相关论文已被 CVPR 2026 接收。

来自主题: AI技术研报
7477 点击    2026-03-19 15:22
接入 MiniMax M2.7 后,我的 OpenClaw「超进化」了

接入 MiniMax M2.7 后,我的 OpenClaw「超进化」了

接入 MiniMax M2.7 后,我的 OpenClaw「超进化」了

上周,除了 OpenClaw,AI 圈还有个词越来越火🔥。

来自主题: AI技术研报
8857 点击    2026-03-19 15:20
刚刚,MiniMax直接让龙虾学会自我进化,也认识「马嘉祺」了

刚刚,MiniMax直接让龙虾学会自我进化,也认识「马嘉祺」了

刚刚,MiniMax直接让龙虾学会自我进化,也认识「马嘉祺」了

谁能料到,OpenClaw 的热度从年初延续到了今天。除了专业工程师,很多普通人也在 FOMO(错失恐惧)情绪驱动下,开始了对「养龙虾」的追捧。

来自主题: AI技术研报
6672 点击    2026-03-19 10:49
工程知识引擎:Harness Engineering体系下的工程知识底座

工程知识引擎:Harness Engineering体系下的工程知识底座

工程知识引擎:Harness Engineering体系下的工程知识底座

在AI编程智能体快速演进的今天,一个核心痛点愈发凸显:AI能写代码,却难以理解代码。更深层的问题是:即便模型能力再强,若缺乏结构化的工程约束与上下文支撑,智能体也难以稳定、可预期地完成真实工程任务。

来自主题: AI技术研报
8820 点击    2026-03-19 10:48
当AI第一次读完整本基因之书,十亿参数单细胞大模型能干什么?

当AI第一次读完整本基因之书,十亿参数单细胞大模型能干什么?

当AI第一次读完整本基因之书,十亿参数单细胞大模型能干什么?

十亿参数单细胞基础模型scLong不再只看少数高表达基因,而是把一个细胞里接近 2.8 万个基因 都纳入建模,并结合 Gene Ontology(GO) 的生物学知识,去理解更完整的基因上下文。

来自主题: AI技术研报
6188 点击    2026-03-19 10:23
更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

过去一年,具身智能领域迎来了爆发式增长。从后空翻到托马斯回旋,从整理衣物到冲泡咖啡……各类令人惊艳的机器人演示视频层出不穷。

来自主题: AI技术研报
9970 点击    2026-03-19 09:46
TPAMI 2026 | 仅用两个变量破解混杂因素:CIC实现动力学因果推断与混杂变量重构

TPAMI 2026 | 仅用两个变量破解混杂因素:CIC实现动力学因果推断与混杂变量重构

TPAMI 2026 | 仅用两个变量破解混杂因素:CIC实现动力学因果推断与混杂变量重构

从观测时间序列数据中准确识别因果关系,是生命科学、地球科学、经济学以及人工智能等诸多领域的核心科学问题。尤其在复杂生物系统中,基因、蛋白质和代谢物之间高度耦合,并常常受到大量不可观测因素的干扰——这些「隐形混杂」无法被直接测量,却会严重误导因果推断结果,产生虚假的因果关联。

来自主题: AI技术研报
9582 点击    2026-03-19 09:44
5B参数+4060Ti,10秒出图,全流程开源可复现!补齐统一多模态生成编辑的开源版图,让高质量图像生成真正变得更轻量、更普及

5B参数+4060Ti,10秒出图,全流程开源可复现!补齐统一多模态生成编辑的开源版图,让高质量图像生成真正变得更轻量、更普及

5B参数+4060Ti,10秒出图,全流程开源可复现!补齐统一多模态生成编辑的开源版图,让高质量图像生成真正变得更轻量、更普及

统一多模态生成编辑模型,正在走向“重器化”

来自主题: AI技术研报
9810 点击    2026-03-18 16:15
CVPR2026满分论文:Proxy-GS为结构化3D高斯溅射引入统一遮挡先验

CVPR2026满分论文:Proxy-GS为结构化3D高斯溅射引入统一遮挡先验

CVPR2026满分论文:Proxy-GS为结构化3D高斯溅射引入统一遮挡先验

上海交通大学钟志航团队联合上海人工智能实验室、西北工业大学、四川大学等高校在 CVPR 2026 上提出Proxy-GS(Proxy-GS: Unified Occlusion Priors for Training and Inference in Structured 3D Gaussian Splatting),面向基于 MLP 的结构化 3D 高斯溅射(3DGS),

来自主题: AI技术研报
8927 点击    2026-03-18 16:10
LaPha:你的Agent轨迹其实嵌入在一个Poincaré球?

LaPha:你的Agent轨迹其实嵌入在一个Poincaré球?

LaPha:你的Agent轨迹其实嵌入在一个Poincaré球?

在经典强化学习问题中,动作空间通常是离散且有限的。例如在围棋中,一步棋就是一次行动;在机器人控制或视觉 - 语言 - 行动(VLA)模型中,动作往往来自一个有限的控制指令集合。

来自主题: AI技术研报
5794 点击    2026-03-18 14:54
打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

今天的大型视觉语言模型(VLM)做离线视频分析很强,但一到实时场景就尴尬: 视频在往前走,模型还在“补作业”。

来自主题: AI技术研报
6742 点击    2026-03-18 14:12
在「想象」中练就真机能力:RISE,让VLA强化学习告别真机试错

在「想象」中练就真机能力:RISE,让VLA强化学习告别真机试错

在「想象」中练就真机能力:RISE,让VLA强化学习告别真机试错

在具身智能的发展路径中,视觉 - 语言 - 动作(VLA)模型正逐步成为通用操作任务的核心框架。但当任务进入长程规划、柔性物体操作、精细双臂协同、动态交互等复杂场景时,VLA 仍然面临两个根本性挑战:

来自主题: AI技术研报
5362 点击    2026-03-18 14:05
如何让AI走向更高质量的共情?自然选择两项开源研究提供新路径

如何让AI走向更高质量的共情?自然选择两项开源研究提供新路径

如何让AI走向更高质量的共情?自然选择两项开源研究提供新路径

现如今,大模型越来越擅长在单轮对话中生成温柔体贴、情绪价值拉满的文字,然而,我们或许会怀疑:在一句句「高情商回复」的背后,模型是否真正理解了什么是共情。

来自主题: AI技术研报
7555 点击    2026-03-18 13:53