AI技术研报-这里有最前沿的人工智能技术解读

如何使用 Codex，进行长程任务

这两天在赶工，鞭策 Codex 赶紧把 AGI Bar 的小程序弄出来，已经连续蹬了 80+ 小时了，预估再蹬 20 个小时就能蹬完

来自主题: AI技术研报

7744 点击 2026-06-23 16:46

SCI 论文配图 Prompt 怎么写？这篇直接抄

做科研的人应该都懂，论文配图真的很耗时间。

来自主题: AI技术研报

5692 点击 2026-06-23 15:03

530 万人读的这篇：你一直在用 AI 最慢的方式——附一段你今天就能粘的「自循环」提示词

这篇文章有 530 万浏览。我想先弄明白:为什么是它?

来自主题: AI技术研报

7227 点击 2026-06-23 15:03

你的AI正在「见人下菜」，亚马逊团队ACL高分论文，首次系统测评「记忆」如何影响LLM情商

近年来，个性化语言模型迅速普及。从 ChatGPT、Claude 到各类垂直 agent，用户 “长期记忆” 功能也逐渐成为标配，它们被广泛部署在推荐系统、客户服务、情感陪伴等场景中。

来自主题: AI技术研报

9443 点击 2026-06-23 15:03

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

机器人模型已经能根据“把杯子放进篮子”这类指令完成任务，但用哪只手？

来自主题: AI技术研报

6765 点击 2026-06-23 15:02

1W+优质提示词！这个网站塞满了神级AI出图Prompt，复制就能直接用

今天给大家分享一个我最近经常刷的灵感外挂。

来自主题: AI技术研报

9768 点击 2026-06-23 09:52

从 OpenClaw 到 FastClaw：如何设计优秀的多 Agent 架构

做了一年 Agent 基础设施，踩了无数坑，我终于想明白了一件事：好的 Agent 架构不是把所有功能塞进一个进程，而是让每一层都能独立演化。

来自主题: AI技术研报

10055 点击 2026-06-23 09:50

AI中转站正在「裸奔」：清华团队提出首个可信原生中转基础设施TrustedARI

当 AI 智能体真正开始干活，它的每一次请求，都要经过一个你看不见的「中间人」。

来自主题: AI技术研报

9169 点击 2026-06-23 09:35

过程比结果重要：一个不给标准答案的调参框架，让Agent自己把数据库性能榨出来

数据库自动调参，一直是大模型Agent的“看似完美、实则翻车”名场面。

来自主题: AI技术研报

9139 点击 2026-06-23 09:35

Sakana AI发布模型Fugu Ultra，号称比肩Claude Fable

就在所有人还在为Claude Fable 5的突然消失而懵圈时，Sakana AI却高调宣布：我们的Fugu比肩Fable，还不怕出口管制。

来自主题: AI技术研报

6893 点击 2026-06-23 09:33

何恺明团队发布像素空间文生图模型MiniT2I

文本生成图像的领域早已经是一片红海，看上去已经卷无可卷了。

来自主题: AI技术研报

8778 点击 2026-06-22 16:53

同样算力质量更高，西湖大学把扩散缓存做成了“离线搜索题”

扩散模型生成得越来越好，但也越来越慢。

来自主题: AI技术研报

9502 点击 2026-06-22 15:16

入选ECCV 2026！清华开源空间模型打败Gemini：真正的空间智能是在世界变化中持续学习

在机器人、自动驾驶、AR等真实场景中，空间理解从来都不是“看一眼图像”就能解决的问题。

来自主题: AI技术研报

6098 点击 2026-06-22 15:16

不靠专家出题，8万条人类终端录像，炼成首个真实CLI工作流基准TerminalWorld

AI Agent 正在重塑软件开发。写代码、修 bug，它的能力肉眼可见地往上涨。但软件开发，从来不止 "写代码" 这一件事。装环境、配依赖、部署服务、编排容器、管理云资源、处理安全策略，这些 "让软件活起来" 的脏活累活，才是真实开发的大头。而它们，几乎都发生在同一个地方：终端。

来自主题: AI技术研报

7229 点击 2026-06-22 15:15

清华NANO滤波器：非线性贝叶斯状态估计迈入优化迭代计算的新范式

NANO滤波器是一种新的非线性贝叶斯状态估计方法，它不依赖线性化模型，而是将预测和更新步骤转化为优化问题。这种方法在高斯分布空间中使用自然梯度，更精确地逼近最优后验，同时利用Stein引理避免显式求导，提升鲁棒性。

来自主题: AI技术研报

7175 点击 2026-06-22 15:15

AI跑团/角色扮演为什么越玩越无聊？因为缺了一个导演系统！

深度长文分析！对AI原生游戏的探索！超长文章超多古法手搓！！

来自主题: AI技术研报

6008 点击 2026-06-22 09:39

OpenAI发布最新里程碑：对齐的本质是「人格」

就在最近，OpenAI扔出一篇重磅论文。他们发现，只教AI好好看病，它写代码居然也不作弊了。方法简单到离谱：拿5%的训练数据，教模型在回答健康问题时诚实、谨慎、知错能改。

来自主题: AI技术研报

7774 点击 2026-06-21 11:31

你以为是 AI 在干活，其实那个循环一直是你——一个 OpenAI 员工聊 loop engineering

OpenAI 的 tevfik 写了篇关于 loop engineering 的文章,开头那句我读完顿了一下。他说,他和 coding agent 协作,到现在大多还是同一个流程:我解释一个任务,等结果,审一遍,再发下一条指令。代码是 agent 写的,但我在后台还干着另一份活——我记着发生了什么、决定下一步做什么、判断这事到底完成没。

来自主题: AI技术研报

7492 点击 2026-06-21 10:59

斯坦福报告：中国自主培养，顶尖AI人才崛起

斯坦福胡佛研究所追踪了 DeepSeek 七篇论文背后 356 名研究者的完整职业轨迹。美国培养出的最优秀 AI 人才正在大规模回流中国，而中国本土管道已经能独立产出前沿模型的核心贡献者。

来自主题: AI技术研报

9528 点击 2026-06-21 10:44

从“一句成片”到“长轨推演”：探究多模态智能体在长视频编辑中的应用

近年来，大语言模型（LLMs）在长篇视觉叙事中展现出卓越潜力，生产方式正迅速从单一模型生成转向面向生产的智能体系统。但长视频剪辑仍然是一个极难控制的长期任务。模型有时会在缺乏素材依据的情况下强行生成，甚至在面对明显断档的转场或人物不一致时依然“盲目拼接”。

来自主题: AI技术研报

9796 点击 2026-06-21 10:41

AI接管数字世界！华为Claw-Anything：面向跨设备、跨时间、跨服务的Claw评测与数据引擎

我们相信，常驻型 (always-on) AI 助理的下一次飞跃，不在于把某一个模型单点调得更聪明，而在于扩展智能体的上下文 (Scaling Agent Context)—— 不断拓宽助理能够持续 "感知 — 推理 — 执行" 的范围，作为生活连接器连接用户的信息孤岛，直到它能接管用户的整个数字世界。

来自主题: AI技术研报

8037 点击 2026-06-21 10:34

沿着何恺明团队「漂移模型」再走一步：奖励只需排名，单步文生图偏好优化提速3.51倍

来自西湖大学和香港中文大学（深圳）的团队沿着这一思路提出 Drifting Preference Optimization（DrPO），把漂移场用于单步文生图模型的偏好后训练。在 DrPO 中，奖励只负责对候选图像排序，不参与反向传播。具体而言，针对同一个文本提示词，当前模型生成一组候选图像。高分样本在特征空间中产生吸引，低分样本产生排斥，并结合参考模型约束给出模型的更新方向。

来自主题: AI技术研报

7597 点击 2026-06-21 10:33

CameraSquad：精准运镜，多视角一致——视频世界模型的空间智能新范式

如今，CameraSquad 的出现，让这种多视角一致的视频生成与 3D 世界状态构建成为现实。近日，中国科学院大学高林研究员团队联合卡迪夫大学、香港科技大学和快手可灵团队，提出了一种面向多轨迹并行生成的相机可控视频生成方法 CameraSquad [1]，相关论文已被 ACM SIGGRAPH 2026 录用。

来自主题: AI技术研报

7656 点击 2026-06-21 10:32

ICML 2026｜从「鉴伪」到「修复」，AI图像取证进入闭环时代

对于 AI 生成图像中可能存在的不自然伪影，我们是否不仅能够将其定位和解释，还能进一步对其进行修复，使图像恢复为更加真实、自然的视觉外观？围绕这一问题，来自北京大学等机构的研究者提出了 GenShield：一个统一的自回归框架，将 AI 生成图像检测与图像伪影修复结合到同一个闭环中，实现从 “诊断” 到 “修复” 的一体化建模。

来自主题: AI技术研报

7675 点击 2026-06-21 10:31

深入理解 Claude Code：从 CLAUDE.md 到 Hooks、Skills、Subagents..

在常规的对话外，Claude Code（也可以是 Codex）其实还提供了一些别样的控制（或者说：上下文注入）方法，比如：CLAUDE.md、Rules、Skills、Subagents、Hooks、Output Styles、以及 System Prompt Append

来自主题: AI技术研报

9957 点击 2026-06-21 00:03

LLM终于学会推公式了！博世x清华推出FunctionEvolve：LLM-SRBench提升3.6倍，AI-Feynman满分

来自博世中央研究院与清华大学的研究人员提出 FunctionEvolve 框架，在两大基准测试上大幅刷新了这项任务的结果。在 LLM-SRBench 的 129 个合成科学方程任务上，FunctionEvolve 最终给出的公式在 55.8% 的任务上与真实公式等价（SA@1 = 72/129），是此前最好结果的 3.6 倍；

来自主题: AI技术研报

7491 点击 2026-06-20 10:24