AI技术研报-这里有最前沿的人工智能技术解读

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
首个用户生活「长程模拟器」来了!LifeSim 重新定义大模型个性化评测

首个用户生活「长程模拟器」来了!LifeSim 重新定义大模型个性化评测

首个用户生活「长程模拟器」来了!LifeSim 重新定义大模型个性化评测

来自复旦大学、上海创智学院的研究人员提出 LifeSim,一个面向个性化助手评测的长程用户生活模拟框架。LifeSim 同时建模用户内部认知过程与外部物理环境,生成连贯的生活轨迹、事件序列与多轮交互行为;在此基础上,研究团队进一步构建了 LifeSim-Eval,用于系统评测模型在长期个性化交互中的能力边界。

来自主题: AI技术研报
7424 点击    2026-04-06 10:20
彻底改写!BVP权威报告:AI制药每年高达1000亿美元市场,5大产业链将被颠覆!

彻底改写!BVP权威报告:AI制药每年高达1000亿美元市场,5大产业链将被颠覆!

彻底改写!BVP权威报告:AI制药每年高达1000亿美元市场,5大产业链将被颠覆!

近日,Bessemer Venture Partners发布AI+生命科学路线图,分析今年AI医药的发展趋势。 该报告的核心观点是:AI正在彻底改变制药和生命科学行业,每年能创造超1000亿美元新价值,但目前只有5%的企业真正用起来。

来自主题: AI技术研报
7813 点击    2026-04-05 10:02
跨物体融合新突破!从拼贴到创造:AI学会「生」出新物体

跨物体融合新突破!从拼贴到创造:AI学会「生」出新物体

跨物体融合新突破!从拼贴到创造:AI学会「生」出新物体

AI不再只是把两个物体「放一起」,而是真正造出一个新实体。VMDiff模型通过分阶段策略:先拼接保留信息,再插值融合成整体,并自动调节平衡,让生成结果既像两者,又自然统一。 过去,很多图像生成模型都能同时画出两个物体;但要让它们真正「长成一个新物体」,其实远没有那么简单。

来自主题: AI技术研报
8033 点击    2026-04-04 10:58
快手广告系统全面迈入生成式推荐时代!GR4AD:从Token到Revenue的全链路重构

快手广告系统全面迈入生成式推荐时代!GR4AD:从Token到Revenue的全链路重构

快手广告系统全面迈入生成式推荐时代!GR4AD:从Token到Revenue的全链路重构

快手的这篇论文,正是对这一问题交出的一份沉甸甸的工业级答卷。他们提出了 GR4AD(Generative Recommendation for ADvertising),一个横跨表征、学习、服务三大层面协同设计的生成式广告推荐系统,并已全量部署于快手广告平台,服务超过 4 亿用户。

来自主题: AI技术研报
8116 点击    2026-04-04 10:58
斯坦福MIT联合发布Meta-Harness,Agent端到端自己优化自己,Dspy一作Omar参与研究

斯坦福MIT联合发布Meta-Harness,Agent端到端自己优化自己,Dspy一作Omar参与研究

斯坦福MIT联合发布Meta-Harness,Agent端到端自己优化自己,Dspy一作Omar参与研究

去年讨论Agent落地时,重点往往是Context Engineering。大家都在琢磨怎么放 Few-shot,怎么优化 RAG 检索的文本片段。但随着 Agent 任务复杂度的上升,控制数据流向、工具调度和异常处理的底层脚手架代码,往往比单纯拼接文本对系统性能的影响更大。

来自主题: AI技术研报
7551 点击    2026-04-03 09:26
Claude Code 源码震撼泄露,一起学习下最前沿的 Harness 工程

Claude Code 源码震撼泄露,一起学习下最前沿的 Harness 工程

Claude Code 源码震撼泄露,一起学习下最前沿的 Harness 工程

3 月 31 日下午,技术圈炸了锅: Claude Code,这款被公认为当前最强的 AI 编程助手,因为一次内部失误,核心代码逻辑暴露在了全球开发者面前。

来自主题: AI技术研报
9627 点击    2026-04-03 09:25
重构跨域RL框架!理论驱动「双重对齐」让跨域迁移「质变」

重构跨域RL框架!理论驱动「双重对齐」让跨域迁移「质变」

重构跨域RL框架!理论驱动「双重对齐」让跨域迁移「质变」

在现实世界中通过强化学习训练智能体,往往需要大量在线试错与环境探索,这不仅成本高昂,还可能带来显著安全风险:机器人可能因试错而损坏,自动驾驶的在线探索可能危及行车安全,而持续采集交互数据本身也代价巨大。

来自主题: AI技术研报
7906 点击    2026-04-03 09:25
哈佛医学院做了5679次组学分析:大模型能力没差别,关键在验证

哈佛医学院做了5679次组学分析:大模型能力没差别,关键在验证

哈佛医学院做了5679次组学分析:大模型能力没差别,关键在验证

生物医学AI智能体正从「能不能做组学分析」快速进入下一阶段的检验:做出来的结果,能不能撑得住真实的治疗决策?哈佛医学院Zitnik团队的MEDEA 给出了一条明确的技术路线:与其追求更强的骨干大模型,不如在分析流程的每一步嵌入验证机制。

来自主题: AI技术研报
8048 点击    2026-04-02 16:22
ICLR 2026 | 世界模型卡在多机器人协作?一个「顺序分解」思路打通

ICLR 2026 | 世界模型卡在多机器人协作?一个「顺序分解」思路打通

ICLR 2026 | 世界模型卡在多机器人协作?一个「顺序分解」思路打通

近年来,Decision-Coupled World Model 与 Model-based RL 在机器人领域取得了显著成功。通过学习环境动力学模型,智能体能够在内部模拟未来,从而进行规划与决策。但当系统从单机器人扩展到多机器人时,问题开始变得棘手。

来自主题: AI技术研报
10080 点击    2026-04-02 16:22
Cursor们为什么都开始自研模型?

Cursor们为什么都开始自研模型?

Cursor们为什么都开始自研模型?

Tanay Jaipuria 本周写了一篇很有意思的文章,核心论点只有一句话:每家 AI 应用公司最终都会垂直整合,变成全栈公司。

来自主题: AI技术研报
6050 点击    2026-04-02 10:07
苏黎世联邦理工实测:一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

苏黎世联邦理工实测:一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

苏黎世联邦理工实测:一句Prompt就能摧毁16个Agent组成的「共识网络」多Agent避坑指南来了

在构建多Agent系统(Multi-Agent Systems)时,让几个Agent互相“对话”并不难,但要让它们在局部状态不一致的情况下,敲定一个全局唯一的决策,也就是达成“一致”(Agree)或“共识(Consensus)”,却是一个极具挑战的工程难题,您可能会问为什么,这有何难?

来自主题: AI技术研报
7884 点击    2026-04-02 09:39
Claude Code 源码泄漏了,但我不打算写源码分析分析文章

Claude Code 源码泄漏了,但我不打算写源码分析分析文章

Claude Code 源码泄漏了,但我不打算写源码分析分析文章

Claude Code 源码泄漏了,满屏都是“深度分析”文章。也有朋友让我写一篇分析文章,但代码才泄漏十几个小时,50 多万行代码,想深度分析清楚还是有难度的。不过授人以鱼不如授人以渔,我更想聊聊:拿到一份开源代码,怎么把它真正学到手。

来自主题: AI技术研报
9962 点击    2026-04-02 09:38
88岁算法祖师爷惊呆!Claude联手GPT攻破30年难题,14页论文0修改

88岁算法祖师爷惊呆!Claude联手GPT攻破30年难题,14页论文0修改

88岁算法祖师爷惊呆!Claude联手GPT攻破30年难题,14页论文0修改

「哈密顿分解」难题,终于破解!88岁「算法祖师爷」高德纳再更论文,Claude 4.6+GPT-5.4联合破解了奇偶数情形。甚至,GPT-5.4直出一篇14页论文,引爆全网。

来自主题: AI技术研报
6922 点击    2026-04-01 17:05
比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

在大语言模型推理领域,虽然「推测解码」(Speculative Decoding,SD)已成为加速生成的标准配置,但它依然存在一个致命弱点: drafting(草拟)和 verification(验证)之间必须串行进行。

来自主题: AI技术研报
7488 点击    2026-04-01 16:20
ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache,刷新多模态生成模型推理加速新基准

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache,刷新多模态生成模型推理加速新基准

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache,刷新多模态生成模型推理加速新基准

FLUX 、Qwen-Image 等多模态生成模型的推理速度一直是工业级多模态模型落地的痛点。传统的特征缓存(Feature Caching)方案在追求高倍率加速时,常因瞬时速度的剧烈波动导致轨迹漂移。

来自主题: AI技术研报
7700 点击    2026-04-01 16:13
Claude Code 源码泄漏,全部细节与始末

Claude Code 源码泄漏,全部细节与始末

Claude Code 源码泄漏,全部细节与始末

2026 年 3 月 31 日,安全研究员 Chaofan Shou 发现 Anthropic 的 Claude Code 全部源码通过 npm 包里的一个 source map 文件暴露在了公网上

来自主题: AI技术研报
10101 点击    2026-04-01 10:50
NVIDIA GTC上登顶的DeepResearch Bench,到底在评什么?

NVIDIA GTC上登顶的DeepResearch Bench,到底在评什么?

NVIDIA GTC上登顶的DeepResearch Bench,到底在评什么?

3 月 16 日,在刚刚结束的 NVIDIA GTC 2026 大会上,黄仁勋在长达三小时的 Keynote 演讲中发布了 NVIDIA Agent Toolkit 和 AI-Q 开放智能体蓝图,将 AI Agent 定位为下一个重大前沿。

来自主题: AI技术研报
8412 点击    2026-04-01 09:39
你的「龙虾」还好用吗?人大林衍凯教授:OpenClaw就像早期Linux,真正的竞争才刚开始

你的「龙虾」还好用吗?人大林衍凯教授:OpenClaw就像早期Linux,真正的竞争才刚开始

你的「龙虾」还好用吗?人大林衍凯教授:OpenClaw就像早期Linux,真正的竞争才刚开始

过去数月,AI 领域很难绕开一个名字 ——OpenClaw。这个项目在极短时间内获得了爆发式关注:数十万星标、惊人的 Token 消耗,以及几乎所有大厂的快速跟进。从表面上看,它像是又一个现象级 AI 产品;但如果进一步审视,一个更值得思考的问题随之浮现 ——OpenClaw 的出现,究竟意味着什么?它真的是一次技术突破,还是某种更深层变化的信号?

来自主题: AI技术研报
5406 点击    2026-03-31 14:40
1毫秒级,最快的人体动作捕捉服!开源715万帧数据集| CVPR'26

1毫秒级,最快的人体动作捕捉服!开源715万帧数据集| CVPR'26

1毫秒级,最快的人体动作捕捉服!开源715万帧数据集| CVPR'26

全球首个1毫秒级人体动作捕捉系统FlashCap,通过闪烁LED与事件相机结合,实现1000Hz超高帧率捕捉。无需昂贵设备或强光环境,低成本穿戴服即可精准捕捉极速动作。团队同步开源715万帧的FlashMotion数据集与多模态模型ResPose,显著提升运动分析精度,推动体育、VR与机器人领域迈向高动态智能新阶段。

来自主题: AI技术研报
6296 点击    2026-03-31 14:40