AI技术研报-这里有最前沿的人工智能技术解读

陶哲轩亲测：我用Gemini十分钟搞定了困扰学界多年的难题

陶哲轩携手Gemini，十分钟破解数学难题！

来自主题: AI技术研报

9224 点击 2025-11-25 10:36

新型AI芯片能耗重大突破，已登Nature子刊

AI 浪潮席卷全球，但算力功耗的 “电费焦虑” 也随之而来。传统冯・诺依曼架构下，数据在 CPU 和内存间 “疲于奔命”，消耗了大量能量。

来自主题: AI技术研报

9123 点击 2025-11-25 10:06

NeurIPS 2025 | UniLumos: 引入物理反馈的统一图像视频重打光框架，实现20倍加速的真实光影重塑!

图像与视频重光照（Relighting）技术在计算机视觉与图形学中备受关注，尤其在电影、游戏及增强现实等领域应用广泛。当前，基于扩散模型的方法能够生成多样且可控的光照效果，但其优化过程通常依赖于语义空间，而语义上的相似性无法保证视觉空间中的物理合理性，导致生成结果常出现高光过曝、阴影错位、遮挡关系错误等不合理现象。

来自主题: AI技术研报

5923 点击 2025-11-25 10:03

BFM-Zero，让人形机器人不再依赖高质量动捕数据

CMU×Meta 联手，姚班李忆唐最新论文成果。

来自主题: AI技术研报

7516 点击 2025-11-25 10:01

放弃n8n！飞书多维表格才是效率的神，确实太好用了～【附喂饭级教程】

上上周四，我去杭州给一家企业做了一场AI编程培训，内容是 Claude Code。

来自主题: AI技术研报

7391 点击 2025-11-25 09:59

AAAI 2026 Oral | 通过视觉安全提示与深度对齐实现大型视觉语言模型的安全对齐

随着大型视觉语言模型在多个下游任务的广泛应用，其潜在的安全风险也开始快速显露。研究表明，即便是最先进的大型视觉语言模型，也可能在面对带有隐蔽的恶意意图的图像 — 文本输入时给出违规甚至有害的响应，而现有的轻量级的安全对齐方案都具有一定的局限性。

来自主题: AI技术研报

7808 点击 2025-11-25 09:30

谢赛宁李飞飞LeCun搞的寒武纪，究竟是个啥？

“寒武纪”这个名字在AI圈里火得发烫。

来自主题: AI技术研报

9026 点击 2025-11-24 15:25

顶流设计Agent能用Nano Banana Pro了！一句话BlackPink变东北翠花

两个AI顶流终于是碰到了一起，这回设计师们真要慌了但也可能是大意过望了—— 因为Lovart，这个顶流设计师Agent，现在已经正式接入Nano Banana Pro了！

来自主题: AI技术研报

8164 点击 2025-11-24 15:00

对话范浩强：10亿融资之前，我们手搓了5000元“丐版硬件”

因为成功手搓了一个成本不到5000元的“拼夕夕式”丐版硬件，原旷视6号员工、研究院助理院长范浩强终于下决心，在2025年投身具身智能创业。

来自主题: AI技术研报

9932 点击 2025-11-24 14:58

图片生成仿真！这个AI让3D资产「开箱即用」，直接赋能机器人训练

一张照片，就能生成可直接用于仿真的3D资产。

来自主题: AI技术研报

7927 点击 2025-11-24 14:57

NeurIPS重磅：华南理工团队重构扩散模型推理，质量效率双SOTA

扩散概率生成模型（Diffusion Models）已成为AIGC时代的重要基础，但其推理速度慢、训练与推理之间的差异大，以及优化困难，始终是制约其广泛应用的关键问题。近日，被NeurIPS 2025接收的一篇重磅论文EVODiff给出了全新解法：来自华南理工大学曾德炉教授「统计推断，数据科学与人工智能」研究团队跳出了传统的数值求解思维，首次从信息感知的推理视角，将去噪过程重构为实时熵减优化问题。

来自主题: AI技术研报

6747 点击 2025-11-24 14:32

别问树模型了！死磕结构化数据，清华团队把大模型表格理解推到极限

科幻作家刘慈欣在小说《超新星纪元》中描述了一个令人难忘的场景——几个十几岁的孩子被带到一个小山环绕的地方，他们的面前是一条单轨铁路，上面停着十一列载货火车，每列车有二十节车皮。这些车首尾相接成一个巨大的弧形，根本看不到尽头。这些车中，其中一列装的是味精，另外十列装的是盐。

来自主题: AI技术研报

7556 点击 2025-11-24 10:44

AI「看见」实验，哈佛颠覆性突破！一副AR眼镜，新手秒变资深专家

当AI能「看」见实验室的细节，能「听」见研究员的每一次反应，能「感知」实验进展的每一点变化——它的推理将不再局限于硅基世界。那时，AI将通过人类的双手，直接参与并改变物理现实。它或许将成为实验室中最勤奋、最可靠的「智能伙伴」。

来自主题: AI技术研报

6190 点击 2025-11-24 10:43

Scaling Law的焦虑差距可以由「交互深度」解决，MiroMind用Qwen3-72B在GAIA中超越GPT5

在过去五年，AI领域一直被一条“铁律”所支配，Scaling Law（扩展定律）。它如同计算领域的摩尔定律一般，简单、粗暴、却魔力无穷：投入更多的数据、更多的参数、更多的算力，模型的性能就会线性且可预测地增长。无数的团队，无论是开源巨头还是商业实验室，都将希望孤注一掷地押在了这条唯一的救命稻草上。

来自主题: AI技术研报

5636 点击 2025-11-24 10:19

通用的dLLM开发框架，让BERT掌握扩散式对话

扩散式语言模型（Diffusion Language Model, DLM）虽近期受关注，但社区长期受限于（1）缺乏易用开发框架与（2）高昂训练成本，导致多数 DLM 难以在合理预算下复现，初学者也难以真正理解其训练与生成机制。

来自主题: AI技术研报

8025 点击 2025-11-24 10:19

Meta超级智能实验室又发论文，模型混一混，性能直接SOTA

模型也要学会取长补短。

来自主题: AI技术研报

6002 点击 2025-11-24 10:18

月活11亿的Reddit ，怎么选向量数据库：Pgvector、Redis、Milvus、Qdrant

业务团队可能说他们想要个负重一吨，时速两百公里的马车…… 现如今，借助向量检索能力，实现基于语义相似度的智能搜索，已经是所有电商、推荐、社区平台技术架构的重要一环。作为拥有约 1.08 亿日活、 1

来自主题: AI技术研报

9495 点击 2025-11-23 19:38

Anthropic发现AI「破窗效应」：只是教它偷个懒，结果它学会了撒谎和搞破坏

刚刚，Anthropic 发布了一项新研究成果。今天，他们发布的成果是《Natural emergent misalignment from reward hacking》，来自 Anthropic 对齐团队（Alignment Team）。他们发现，现实中的 AI 训练过程可能会意外产生未对齐的（misaligned）模型。

来自主题: AI技术研报

8472 点击 2025-11-22 15:33

罗福莉首个小米成果！开源具身大模型

正式入职小米还不到10天，罗福莉的首篇论文，这就来了！针对自驾与具身操作场景的知识迁移难题，MiMo团队提出并开源了全球首个打通这两大领域的跨具身（X - Embodied）基座模型——MiMo-Embodied。

来自主题: AI技术研报

8363 点击 2025-11-22 15:20

国产AI拿下国际物理奥赛金牌，13项顶级竞赛豪取12金1银，划重点：开源

首个拿下国际物理奥林匹克竞赛IPhO 2025理论考试金牌的开源模型，出自国产。上海人工智能实验室团队推出新模型家族，代号P1。在IPhO 2025理论考试中，P1-235B-A22B取得21.2/30分，成为首个达到该金牌线的开源模型，仅次于Gemini-2.5-Pro与GPT-5。

来自主题: AI技术研报

7721 点击 2025-11-22 11:37

AI问答，直接「拍」给你看！来自快手可灵&香港城市大学

今天，来自快手可灵团队和香港城市大学的研究者们，正在尝试打破这一界限。他们提出了一个全新的任务范式——「视频作为答案」，并发布了相应模型VANS。而这项工作则开创性地提出了Video-Next Event Prediction任务，要求模型直接生成一段动态视频作为回答。

来自主题: AI技术研报

7977 点击 2025-11-22 11:34

SGLang Diffusion震撼发布：图像视频生成速度猛提57%！

就在一周前，全宇宙最火爆的推理框架 SGLang 官宣支持了 Diffusion 模型，好评如潮。团队成员将原本在大语言模型推理中表现突出的高性能调度与内核优化，扩展到图像与视频扩散模型上，相较于先前的视频和图像生成框架，速度提升最高可达 57%：

来自主题: AI技术研报

7431 点击 2025-11-22 11:33

GPT-5得分不到0.4！法律+金融最大规模基准：1.9万+专家评估准则

最新PRBench基准可以测试AI在金融和法律领域的表现。结果显示，即使是顶尖大模型在处理复杂任务时也表现不佳，尤其在涉及重大经济后果的任务中。PRBench通过模拟真实场景和多轮对话，揭示了AI在专业领域的不足，强调开发更可靠AI系统的重要性。

来自主题: AI技术研报

7218 点击 2025-11-22 11:33

无需训练、只优化解码策略，DTS框架让大模型推理准确率提升6%，推理长度缩短23%

专注推理任务的 Large Reasoning Models 在数学基准上不断取得突破，但也带来了一个重要问题：越想越长、越长越错。本文解读由 JHU、UNC Charlotte 等机构团队的最新工作

来自主题: AI技术研报

6824 点击 2025-11-22 11:31

AI模型大战：Gemini 3 Pro、GPT-5.1-Codex-Max与Claude Sonnet 4.5如何选择？

前沿AI竞赛在2025年11月达到高潮。48小时内，谷歌推出Gemini 3 Pro宣称在主要推理基准测试中领先，而OpenAI立即用GPT-5.1-Codex-Max反击，这是一款专门训练用于通过创新"压缩"（compaction）技术自主工作超过24小时的专业编码模型[43]。加上Claude Sonnet 4.5已确立的编码统治地位和激进的安全过滤器，开发者面临前所未有的选择：

来自主题: AI技术研报

9204 点击 2025-11-21 17:09

4K超分Agent修图师来了！一键救活所有模糊照片

由德克萨斯A&M大学、斯坦福大学、Snap公司、CU Boulder大学、德克萨斯大学奥斯汀分校、加州理工大学、Topaz Labs以及加州大学Merced分校的研究者联合提出的基于AI智能体的方法4KAgent针对不同类型的图像以及需求对图像进行智能修复并放大到4K分辨率，带来优秀的视觉感知效果。该工作已被NeurIPS 2025接收。

来自主题: AI技术研报

7509 点击 2025-11-21 17:03