AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
啥?Fable 5一出,Skill和Prompt都白学了?

啥?Fable 5一出,Skill和Prompt都白学了?

啥?Fable 5一出,Skill和Prompt都白学了?

Workflow、Skill、SOP,可能真的要过时了。

来自主题: AI技术研报
8680 点击    2026-06-15 10:22
登Nature子刊!清华团队提出全球气候模态统一预测模型UniCM

登Nature子刊!清华团队提出全球气候模态统一预测模型UniCM

登Nature子刊!清华团队提出全球气候模态统一预测模型UniCM

全球气候异常事件正在深刻影响农业生产、水资源调度、能源管理和防灾减灾。

来自主题: AI技术研报
7047 点击    2026-06-15 09:48
BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时,Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文,并支撑跨时间的推理能力。

来自主题: AI技术研报
8006 点击    2026-06-15 09:20
华为SpaceMind登顶空间智能权威榜:纯RGB视觉语言模型拿下70.6分,刷新李飞飞榜单记录

华为SpaceMind登顶空间智能权威榜:纯RGB视觉语言模型拿下70.6分,刷新李飞飞榜单记录

华为SpaceMind登顶空间智能权威榜:纯RGB视觉语言模型拿下70.6分,刷新李飞飞榜单记录

大模型已经能流畅对话、看图识物,但一个更底层的问题始终没被真正解决——它们是否「理解」了我们所处的三维世界?

来自主题: AI技术研报
5374 点击    2026-06-15 09:19
图片越糊越危险?西湖大学发现多模态大模型「攻击舒适区」

图片越糊越危险?西湖大学发现多模态大模型「攻击舒适区」

图片越糊越危险?西湖大学发现多模态大模型「攻击舒适区」

多模态大模型越来越会读图中文字,但最新研究显示,「读得出来」并不等于「防得住」。西湖大学 AGI Lab 的研究团队发现,当有害文本被渲染成低清、模糊或带噪图片后,模型在一个特定清晰度区间内反而更容易被越狱。

来自主题: AI技术研报
6555 点击    2026-06-15 09:19
CVPR 2026 | GaussianDWM:用3D高斯表示统一自动驾驶场景理解与多模态生成

CVPR 2026 | GaussianDWM:用3D高斯表示统一自动驾驶场景理解与多模态生成

CVPR 2026 | GaussianDWM:用3D高斯表示统一自动驾驶场景理解与多模态生成

自动驾驶世界模型的研究目标已经从单纯预测未来视觉帧,扩展到构建可用于场景理解、空间定位和后续决策的世界表示。如果模型只能生成外观上合理的未来图像,却无法回答场景中有哪些目标、目标位于何处,以及不同视角下的空间结构如何变化,那么它仍然缺少对三维驾驶环境的显式建模能力。

来自主题: AI技术研报
8926 点击    2026-06-15 09:18
PEFT方法评测不能只看下游分:通用能力损失也该被量化

PEFT方法评测不能只看下游分:通用能力损失也该被量化

PEFT方法评测不能只看下游分:通用能力损失也该被量化

近期,来自香港中文大学、西湖大学、德国马普所等机构的研究者提出了 PEFT-Arena —— 一个从稳定性‑可塑性权衡(stability–plasticity trade-off)视角重新审视 PEFT 方法的评测基准与分析框架。该工作已在 ICLR 2026 相关 workshop 上进行了展示,并开源了完整代码。

来自主题: AI技术研报
9549 点击    2026-06-14 10:38
谷歌官宣3万字路线图:1亿人类水平的AI就是ASI!

谷歌官宣3万字路线图:1亿人类水平的AI就是ASI!

谷歌官宣3万字路线图:1亿人类水平的AI就是ASI!

谷歌DeepMind宣布:AGI,已经过时了!就在最近,谷歌DeepMind出了一份干货满满的57页报告,标题只有四个词:《从AGI到ASI》。论文地址:https://arxiv.org/abs/2606.12683

来自主题: AI技术研报
8519 点击    2026-06-14 10:36
争论几十年的水之谜,被AI一举破解!港城大&中石大成果登Nature Physics

争论几十年的水之谜,被AI一举破解!港城大&中石大成果登Nature Physics

争论几十年的水之谜,被AI一举破解!港城大&中石大成果登Nature Physics

香港城市大学曾晓成教授与中国石油大学(华东)钟杰教授团队给出了终结级的分子水平证据,成果发表于《Nature Physics》。他们首创了一套无监督深度学习框架,不给AI任何预设条件,直接把海量水系统中7400多万个水分子结构扔给模型,让AI自己去悟。结果不仅直接证明常压水里确实存在两种「暗」组份,还把A/B水分子相互变身的「立交桥」路线图给完整画了出来。

来自主题: AI技术研报
9220 点击    2026-06-13 10:42
“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

“智能体最后的考试”,Fable 5竟然不敌GPT 5.5

刚刚,UC伯克利放出了一场号称“智能体最后的考试”的全新基准测试。它把当今最强的AI Agent们拉到考场上,让它们干真正的活——在Siemens NX里建3D模型、在Unreal Engine里搭游戏场景、在Adobe After Effects里做特效合成。

来自主题: AI技术研报
8601 点击    2026-06-13 10:41
Harness 之后,硅谷 AI 圈又来新词了:Loop Engineering

Harness 之后,硅谷 AI 圈又来新词了:Loop Engineering

Harness 之后,硅谷 AI 圈又来新词了:Loop Engineering

硅谷 AI 圈又来了个新词:Loop Engineering。 大佬们纷纷表态,别再手动验证和写提示词了,该让 Agent 自己循环完成工作了。 OpenClaw 开发者 Peter Steinberger 带火了这个讨论,Claude Code 负责人 Boris Cherny 也说他已经不怎么在 Claude Code 里输入提示词了,而是去写 loops。

来自主题: AI技术研报
8636 点击    2026-06-13 10:22
CVPR 2026 | 视觉脑机迈向双向交互!神经流模型 NeuroFlow 打通视觉与神经的双向通道

CVPR 2026 | 视觉脑机迈向双向交互!神经流模型 NeuroFlow 打通视觉与神经的双向通道

CVPR 2026 | 视觉脑机迈向双向交互!神经流模型 NeuroFlow 打通视觉与神经的双向通道

来自上海人工智能实验室、香港大学、香港中文大学等机构的研究团队,提出首个基于统一神经流模型的视觉-神经双向建模框架NeuroFlow,相关成果入选 CVPR 2026。它首次将视觉编码(写脑)与解码(读脑)整合到同一可逆流结构中,打通视觉感知与神经活动之间的双向通路,为理解人类视觉认知机制、构建下一代通用视觉假体与双向脑机接口提供了全新范式。

来自主题: AI技术研报
7355 点击    2026-06-13 10:12
NEWTON:从「等物理涌现」到「请牛顿进工具箱」,Agent 驱动的视频生成新范式

NEWTON:从「等物理涌现」到「请牛顿进工具箱」,Agent 驱动的视频生成新范式

NEWTON:从「等物理涌现」到「请牛顿进工具箱」,Agent 驱动的视频生成新范式

近年来,视频生成模型发展迅猛。从 Sora、Veo、Kling 到一系列开源视频生成模型,文生视频已经逼近真实影像的观感 —— 画面清晰、镜头流畅、风格可控,一句话就能生成一段观感不错的视频。

来自主题: AI技术研报
9244 点击    2026-06-12 10:13
Agent 带来Episodic Workload后,传统开源数据库已经远不够用了

Agent 带来Episodic Workload后,传统开源数据库已经远不够用了

Agent 带来Episodic Workload后,传统开源数据库已经远不够用了

如果把一个商业化产品、一个科技公司的底层系统比作一棵树,那任意挑出一个项目,层层抽丝剥茧之后,你一定会发现,最早的年轮,一定与开源有关。

来自主题: AI技术研报
6745 点击    2026-06-12 10:13
Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

Anthropic宣告「递归自我提升」时代到来,LLM如何实现自我进化?全景综述带你一探究竟

近日,Anthropic 发布了一篇引发广泛关注的文章《When AI builds itself》。文中披露了极其惊人的内部数据:截至 2026 年 5 月,Anthropic 超过 80% 的合并代码已由 Claude 编写,工程师的日常代码产出飙升了 8 倍;更令人瞩目的是,AI 智能体已经可以自主提出假设、执行长达数百小时的强化安全实验。

来自主题: AI技术研报
10000 点击    2026-06-12 10:13
通向AGI的关键拼图!首篇多模态大模型「音频推理」综述出炉,万字拆解四大前沿路径

通向AGI的关键拼图!首篇多模态大模型「音频推理」综述出炉,万字拆解四大前沿路径

通向AGI的关键拼图!首篇多模态大模型「音频推理」综述出炉,万字拆解四大前沿路径

想象这样一个惬意的周末: 空调带来阵阵凉意,你靠在沙发上看书,突然耳边传来“哒哒哒”的小碎步声,接着,玄关门边传来了一阵清脆、略带急切的“呜呜”声,还伴随着爪尖轻轻扒拉木门的声响。

来自主题: AI技术研报
5752 点击    2026-06-12 10:02
斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

斩获15个顶级零日漏洞:0G Lab联合新国立,北大和北邮团队构建的共识协议debug智能体框架

分布式系统的 “圣杯”—— 共识协议(Consensus Protocols),长久以来都是顶级基础设施工程师的 “Bug 地狱”。由于其状态极其复杂、多节点交织,传统测试和单体 LLM 对硬核的 Deep Bug(深层逻辑漏洞)几乎束手无策。

来自主题: AI技术研报
7687 点击    2026-06-11 14:59
ACL 2026 Oral|语义推理如鲠在喉:大模型被「短语」难住了

ACL 2026 Oral|语义推理如鲠在喉:大模型被「短语」难住了

ACL 2026 Oral|语义推理如鲠在喉:大模型被「短语」难住了

AI 的能力边界正在不断被刷新。从数学推理到代码生成,再到数字化白领,语言模型和语言智能体在诸多基准测试中已展现出超越人类专家的表现。一个看似顺理成章的判断早已成为共识:语言模型已经具备了扎实的语言理解和语义推理能力。然而,ACL 2026 Oral 的一项研究工作从一个更基础的层面重新审视了这个问题:语言模型真的理解(短语)语义吗?

来自主题: AI技术研报
8457 点击    2026-06-11 14:32
一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

一篇综述看懂 agent context compression:怎么压、压什么、谁来压

LLM Agent 做长任务时,真正让人头疼的往往不是模型不会推理,而是上下文开始失控:前几步还很清楚,后面就忘约束、丢状态、重复试错,最后把任务跑成事故现场。

来自主题: AI技术研报
6539 点击    2026-06-11 14:32
MBench: 清华x腾讯联合定义视频世界模型的长期记忆能力

MBench: 清华x腾讯联合定义视频世界模型的长期记忆能力

MBench: 清华x腾讯联合定义视频世界模型的长期记忆能力

随着视频生成技术的发展,模型正在从短视频片段合成,向流式长视频生成演进。然而,仅仅做到视觉上的逼真是不够的。一个功能完备的视频世界模型,必须能够在长时序交互中保持稳定的内部状态,并遵循真实世界的物理定律与逻辑规则。

来自主题: AI技术研报
6769 点击    2026-06-11 14:30