AI技术研报-这里有最前沿的人工智能技术解读

CVPR2026 | 鬼手想点谁就点谁？LaSM让GUI智能体把注意力「收回来」

如果把手机屏幕想象成一个舞台，GUI 智能体就是台下那个 “被授权动手” 的人：它能看懂屏幕上的按钮、输入框和弹窗，能按你的指令去点、去滑、去输入。

来自主题: AI技术研报

10619 点击 2026-04-07 14:28

用雨伞「钓」无人机？首个针对自主目标跟踪闭环系统的物理攻击

研究者用特制雨伞干扰无人机视觉系统，让其误判目标在远去，从而失控俯冲。FlyTrap攻击无需信号干扰，仅靠物理图案就能欺骗多款商用无人机，实现静默捕获或击毁。实验显示，物理闭环攻击成功率超60%，且对新人物、新场景均有强泛化能力。这项研究揭示了AI感知系统的重大安全隐患，警示我们：视觉安全正成为智能设备的阿喀琉斯之踵。

来自主题: AI技术研报

10448 点击 2026-04-07 14:28

给Claude Code一行指令，把《大明王朝1566》变成了一款沉浸式权谋游戏

真赞叹啊，一行指令，而且，速度还贼快！

来自主题: AI技术研报

9690 点击 2026-04-07 14:27

北大团队改造DeepSeek注意力，速度快四倍还不丢精度

就在大家都急头白脸地等待DeepSeek-V4的时候，冷不丁一篇新论文引起了网友们的注意—— 提出新稀疏注意力机制HISA（分层索引稀疏注意力），突破64K上下文的索引瓶颈，相比DeepSeek正在用的DSA（DeepSeek Sparse Attention）提速2-4倍。

来自主题: AI技术研报

7647 点击 2026-04-07 10:30

让大模型多模态检索全面超越SOTA！ReCALL框架化解生成式与判别式的范式冲突｜CVPR'26

生成式模型当检索器大材小用效果还不好？

来自主题: AI技术研报

9582 点击 2026-04-07 10:29

斯坦福最新研究：睡一觉，AI 就知道你还能活多久

通过一晚上的睡眠，AI 模型就能监控最多 130 种疾病。

来自主题: AI技术研报

7510 点击 2026-04-07 10:02

访谈｜Codex 团队如何用自己的产品构建产品——整个 Spec 只有 10 个要点

OpenAI Codex 团队的产品规格文档只有 10 个要点。不是说每个功能的文档只有 10 个要点，而是整个产品的 spec 就这么多。设计师写的代码量超过了六个月前工程师写的。50 到 100 人的团队，直到最近才有了第二个产品经理。

来自主题: AI技术研报

6576 点击 2026-04-07 10:02

跨越智能体落地的可信鸿沟：玄甲（AgentWard）全链路防御操作系统正式发布

大模型技术正在经历一场从 “对话助手” 向 “自主智能体（Agent）” 的深刻演进。智能体不再局限于被动地理解与生成，而是具备了多步规划、工具调用、长期记忆与管理物理 / 数字世界的能力，正逐步深度嵌入企业侧的核心业务流程。这意味着，AI 的边界已从虚拟屏幕的对话框，正式延伸到了真实的生产系统中。

来自主题: AI技术研报

8720 点击 2026-04-07 10:00

Karpathy强推，大厂抢着「复古」命令行，Star数全都上千了

最近，飞书、钉钉、企业微信接连推出 CLI，智能体生态战役再次打响。

来自主题: AI技术研报

8377 点击 2026-04-07 09:27

USC团队发布HumDex：攻克人形机器人数据瓶颈，低成本实现全身灵巧操控

人形机器人全身灵巧操作是通向通用具身智能的核心目标之一。在这一愿景下，机器人不仅需要双臂与高自由度多指灵巧手的精细协调，还需要与全身位姿（如行走、弯腰）进行动态配合。

来自主题: AI技术研报

5699 点击 2026-04-07 09:26

首个用户生活「长程模拟器」来了！LifeSim 重新定义大模型个性化评测

来自复旦大学、上海创智学院的研究人员提出 LifeSim，一个面向个性化助手评测的长程用户生活模拟框架。LifeSim 同时建模用户内部认知过程与外部物理环境，生成连贯的生活轨迹、事件序列与多轮交互行为；在此基础上，研究团队进一步构建了 LifeSim-Eval，用于系统评测模型在长期个性化交互中的能力边界。

来自主题: AI技术研报

8124 点击 2026-04-06 10:20

彻底改写！BVP权威报告：AI制药每年高达1000亿美元市场，5大产业链将被颠覆！

近日，Bessemer Venture Partners发布AI+生命科学路线图，分析今年AI医药的发展趋势。该报告的核心观点是：AI正在彻底改变制药和生命科学行业，每年能创造超1000亿美元新价值，但目前只有5%的企业真正用起来。

来自主题: AI技术研报

8520 点击 2026-04-05 10:02

跨物体融合新突破！从拼贴到创造：AI学会「生」出新物体

AI不再只是把两个物体「放一起」，而是真正造出一个新实体。VMDiff模型通过分阶段策略：先拼接保留信息，再插值融合成整体，并自动调节平衡，让生成结果既像两者，又自然统一。过去，很多图像生成模型都能同时画出两个物体；但要让它们真正「长成一个新物体」，其实远没有那么简单。

来自主题: AI技术研报

8720 点击 2026-04-04 10:58

快手广告系统全面迈入生成式推荐时代！GR4AD：从Token到Revenue的全链路重构

快手的这篇论文，正是对这一问题交出的一份沉甸甸的工业级答卷。他们提出了 GR4AD（Generative Recommendation for ADvertising），一个横跨表征、学习、服务三大层面协同设计的生成式广告推荐系统，并已全量部署于快手广告平台，服务超过 4 亿用户。

来自主题: AI技术研报

9093 点击 2026-04-04 10:58

英伟达给机器人装上龙虾大脑！具身智能的Harness来了

Harness（驾驭）的风，终究还是从大模型，吹到了机器人！

来自主题: AI技术研报

9947 点击 2026-04-03 10:18

一键白标 Claude Code：自定义命令 + 启动画面 + 配置隔离，Skill可自取

这两天，我被一张图反复种草。

来自主题: AI技术研报

8967 点击 2026-04-03 09:27

斯坦福MIT联合发布Meta-Harness，Agent端到端自己优化自己，Dspy一作Omar参与研究

去年讨论Agent落地时，重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot，怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升，控制数据流向、工具调度和异常处理的底层脚手架代码，往往比单纯拼接文本对系统性能的影响更大。

来自主题: AI技术研报

8568 点击 2026-04-03 09:26

Claude Code 源码震撼泄露，一起学习下最前沿的 Harness 工程

3 月 31 日下午，技术圈炸了锅： Claude Code，这款被公认为当前最强的 AI 编程助手，因为一次内部失误，核心代码逻辑暴露在了全球开发者面前。

来自主题: AI技术研报

10416 点击 2026-04-03 09:25

重构跨域RL框架！理论驱动「双重对齐」让跨域迁移「质变」

在现实世界中通过强化学习训练智能体，往往需要大量在线试错与环境探索，这不仅成本高昂，还可能带来显著安全风险：机器人可能因试错而损坏，自动驾驶的在线探索可能危及行车安全，而持续采集交互数据本身也代价巨大。

来自主题: AI技术研报

8598 点击 2026-04-03 09:25

中国最强编程模型来了！阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈

什么这code那code，先别code了，因为—— 中国最强编程模型来了！

来自主题: AI技术研报

6429 点击 2026-04-02 17:01

别再用黑盒预测了！即插即用模块通过前置分解让iTransformer/PatchTST既准又可解释

在时间序列预测领域，深度模型如iTransformer、PatchTST虽然性能强劲，却长期困于“黑盒”困境——预测准，但说不出为什么。

来自主题: AI技术研报

7678 点击 2026-04-02 16:23

哈佛医学院做了5679次组学分析：大模型能力没差别，关键在验证

生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验：做出来的结果，能不能撑得住真实的治疗决策？哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线：与其追求更强的骨干大模型，不如在分析流程的每一步嵌入验证机制。

来自主题: AI技术研报

8733 点击 2026-04-02 16:22

ICLR 2026 | 世界模型卡在多机器人协作？一个「顺序分解」思路打通

近年来，Decision-Coupled World Model 与 Model-based RL 在机器人领域取得了显著成功。通过学习环境动力学模型，智能体能够在内部模拟未来，从而进行规划与决策。但当系统从单机器人扩展到多机器人时，问题开始变得棘手。

来自主题: AI技术研报

10877 点击 2026-04-02 16:22

翻遍Claude Code泄露的50万行代码，我终于发现了它好用的秘密

Claude Code 不是一个套了终端界面的 AI 聊天工具。

来自主题: AI技术研报

7044 点击 2026-04-02 10:08

Cursor们为什么都开始自研模型？

Tanay Jaipuria 本周写了一篇很有意思的文章，核心论点只有一句话：每家 AI 应用公司最终都会垂直整合，变成全栈公司。

来自主题: AI技术研报

6734 点击 2026-04-02 10:07

让Agent把成功经验固化成skills，跨模型复用成功率100%

AI会用工具了，问题才真正开始…

来自主题: AI技术研报

8678 点击 2026-04-02 09:39

苏黎世联邦理工实测：一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

在构建多Agent系统（Multi-Agent Systems）时，让几个Agent互相“对话”并不难，但要让它们在局部状态不一致的情况下，敲定一个全局唯一的决策，也就是达成“一致”（Agree）或“共识（Consensus）”，却是一个极具挑战的工程难题，您可能会问为什么，这有何难？

来自主题: AI技术研报

8562 点击 2026-04-02 09:39

Claude Code 源码泄漏了，但我不打算写源码分析分析文章

Claude Code 源码泄漏了，满屏都是“深度分析”文章。也有朋友让我写一篇分析文章，但代码才泄漏十几个小时，50 多万行代码，想深度分析清楚还是有难度的。不过授人以鱼不如授人以渔，我更想聊聊：拿到一份开源代码，怎么把它真正学到手。

来自主题: AI技术研报

10449 点击 2026-04-02 09:38

88岁算法祖师爷惊呆！Claude联手GPT攻破30年难题，14页论文0修改

「哈密顿分解」难题，终于破解！88岁「算法祖师爷」高德纳再更论文，Claude 4.6+GPT-5.4联合破解了奇偶数情形。甚至，GPT-5.4直出一篇14页论文，引爆全网。

来自主题: AI技术研报

7492 点击 2026-04-01 17:05

龙虾成本狂降58%！清华人大面壁等最新开源“智能调度员”

把Agent接入工作流，本该是件提效的乐事。

来自主题: AI技术研报

7131 点击 2026-04-01 17:03

AI技术研报-这里有最前沿的人工智能技术解读

CVPR2026 | 鬼手想点谁就点谁？LaSM让GUI智能体把注意力「收回来」

用雨伞「钓」无人机？首个针对自主目标跟踪闭环系统的物理攻击

给Claude Code一行指令，把《大明王朝1566》变成了一款沉浸式权谋游戏

北大团队改造DeepSeek注意力，速度快四倍还不丢精度

让大模型多模态检索全面超越SOTA！ReCALL框架化解生成式与判别式的范式冲突｜CVPR'26

斯坦福最新研究：睡一觉，AI 就知道你还能活多久

访谈｜Codex 团队如何用自己的产品构建产品——整个 Spec 只有 10 个要点

跨越智能体落地的可信鸿沟：玄甲（AgentWard）全链路防御操作系统正式发布

Karpathy强推，大厂抢着「复古」命令行，Star数全都上千了

USC团队发布HumDex：攻克人形机器人数据瓶颈，低成本实现全身灵巧操控

首个用户生活「长程模拟器」来了！LifeSim 重新定义大模型个性化评测

彻底改写！BVP权威报告：AI制药每年高达1000亿美元市场，5大产业链将被颠覆！

跨物体融合新突破！从拼贴到创造：AI学会「生」出新物体

快手广告系统全面迈入生成式推荐时代！GR4AD：从Token到Revenue的全链路重构

英伟达给机器人装上龙虾大脑！具身智能的Harness来了

一键白标 Claude Code：自定义命令 + 启动画面 + 配置隔离，Skill可自取

斯坦福MIT联合发布Meta-Harness，Agent端到端自己优化自己，Dspy一作Omar参与研究

Claude Code 源码震撼泄露，一起学习下最前沿的 Harness 工程

重构跨域RL框架！理论驱动「双重对齐」让跨域迁移「质变」

中国最强编程模型来了！ 阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈

别再用黑盒预测了！即插即用模块通过前置分解让iTransformer/PatchTST既准又可解释

哈佛医学院做了5679次组学分析：大模型能力没差别，关键在验证

ICLR 2026 | 世界模型卡在多机器人协作？一个「顺序分解」思路打通

翻遍Claude Code泄露的50万行代码，我终于发现了它好用的秘密

Cursor们为什么都开始自研模型？

让Agent把成功经验固化成skills，跨模型复用成功率100%

苏黎世联邦理工实测：一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

Claude Code 源码泄漏了，但我不打算写源码分析分析文章

88岁算法祖师爷惊呆！Claude联手GPT攻破30年难题，14页论文0修改

龙虾成本狂降58%！清华人大面壁等最新开源“智能调度员”

中国最强编程模型来了！阿里Qwen3.6-Plus性能直逼Claude，国产大模型杀入决赛圈