AI技术研报-这里有最前沿的人工智能技术解读

醒醒吧，别再怪大模型有偏见了，是我们先给错了「人设」

当AI开始学会「摸鱼」，整个行业都该警醒了。

来自主题: AI技术研报

7078 点击 2025-12-01 14:30

你对ChatGPT越粗鲁，它赚得越多！最新研究揭秘：一条不礼貌提示语会多输出14个token，企业用户每天或多花数十万美元

一般人和 ChatGPT 聊天时，往往不会在意要不要讲究礼貌。但来自爱荷华大学的一项最新研究显示：即便回答内容几乎相同，对 ChatGPT 粗鲁无礼也会让你花费更高的输出成本。

来自主题: AI技术研报

6814 点击 2025-12-01 14:29

联通破解扩散模型速度质量零和博弈，推理速度提升5倍丨CVPR 2025 Highlight

从“在线训练”到“离线建图”，扩散模型速度再突破！

来自主题: AI技术研报

8012 点击 2025-12-01 14:27

NeurIPS 2025 | DePass：通过单次前向传播分解实现统一的特征归因

随着大型语言模型在各类任务中展现出卓越的生成与推理能力，如何将模型输出精确地追溯到其内部计算过程，已成为 AI 可解释性研究的重要方向。然而，现有方法往往计算代价高昂、难以揭示中间层的信息流动；同时，不同层面的归因（如 token、模型组件或表示子空间）通常依赖各自独立的特定方法，缺乏统一且高效的分析框架。

来自主题: AI技术研报

5535 点击 2025-12-01 13:49

你每月烧掉的 Token 费用，至少 20% 都是冤枉钱

Hi，早上好。我是洛小山，和你聊聊 AI 应用的降本增效。

来自主题: AI技术研报

7181 点击 2025-12-01 11:36

AI独立解决三十年数学问题的变体，陶哲轩分享自动化研究经验

刚刚，Erdos 问题 #124 的一个弱化版本被证明。

来自主题: AI技术研报

9717 点击 2025-12-01 11:33

裸眼3D核心难题被攻破，AI加持即能实现无眩晕沉浸体验

我们能否像《头号玩家》那样伸手就能触摸到虚拟世界？像《阿凡达》那样植物和动物仿佛就在眼前飞舞？这不再只是科幻。11 月 26 日，在一篇最新 Nature 论文中，来自复旦大学团队和上海人工智能实验室的研究人员打造出一款名为 EyeReal 的裸眼 3D 显示器。

来自主题: AI技术研报

8040 点击 2025-12-01 10:44

Gemini3+飞书多维表格，批量扒抖音爆款&自动二创，太爽了！【喂饭级教程】

你好，我是袋鼠帝我最近几乎天天都在用飞书多维表格，使用频率贼高，这玩意儿用起来是真滴爽。

来自主题: AI技术研报

8726 点击 2025-12-01 10:42

全流程 AI 辅助，我做了一款脑洞大开的微信小游戏！

观猹社区里聚集着一群富有创意、动手能力又特别强的创造者。他们来自不同的行业和背景，却在这里形成了某种微妙的共识：认真做产品、诚实写评价、乐于分享想法。

来自主题: AI技术研报

7697 点击 2025-12-01 10:39

NeurIPS 2025 | 英伟达发布Nemotron-Flash：以GPU延迟为核心重塑小模型架构

导读过去两年，小语言模型（SLM）在业界备受关注：参数更少、结构更轻，理应在真实部署中 “更快”。但只要真正把它们跑在 GPU 上，结论往往令人意外 —— 小模型其实没有想象中那么快。

来自主题: AI技术研报

7642 点击 2025-12-01 10:09

NeurIPS 2025 | Language Ranker：从推荐系统的视角反思并优化大模型解码过程

在大语言模型（LLM）的研究浪潮中，绝大多数工作都聚焦于优化模型的输出分布 —— 扩大模型规模、强化分布学习、优化奖励信号…… 然而，如何将这些输出分布真正转化为高质量的生成结果 —— 即解码（decoding）阶段，却没有得到足够的重视。

来自主题: AI技术研报

6156 点击 2025-12-01 10:06

十倍成本优化，Milvus 2.5到2.6升级官方手把手教程

在架构层面，Milvus 2.6 大幅简化系统架构，整合多个核心组件 —— 例如将原有的 Coordinator 组件（含 RootCoord、QueryCoord、DataCoord）统一整合为 MixCoord，并将 IndexNode 与 DataNode 合并为单一组件。这些调整不仅降低了系统复杂度，更显著提升了系统的可维护性与横向扩展性。

来自主题: AI技术研报

7466 点击 2025-12-01 09:40

AIGC检测为何频频“看走眼”？腾讯优图揭秘：问题可能出在数据源头

近日，腾讯优图实验室联合华东理工大学、北京大学等研究团队在A生成图像检测（AI-Generated Image Detection）泛化问题上展开研究，提出Dual Data Alignment（双重数据对齐，DDA）方法，从数据层面系统性抑制“偏差特征”，显著提升检测器在跨模型、跨数据域场景下的泛化能力。

来自主题: AI技术研报

6366 点击 2025-11-30 15:10

空间智能再进化！Spatial-SSRL帮助LVLM更好读懂空间

本文第一作者为刘禹宏，上海交通大学人工智能专业本科四年级学生，相关研究工作于上海人工智能实验室科研实习期间完成。通讯作者为王佳琦、臧宇航，在该研究工作完成期间，均担任上海人工智能实验室研究员。

来自主题: AI技术研报

5706 点击 2025-11-30 15:05

2026 年，企业全面拥抱语音 AI 智能体

a16z 指出：“模型开发的进展正在简化整个基础设施栈，使得语音智能体具备更低延迟和更高性能。这一提升主要出现在过去六个月内，得益于新一代对话模型的出现。”基于这些趋势，Deepgram 与 Opus Research 合作开展的《2025 语音 AI 状况调查报告》，基于 400 位商业领袖的洞察，涵盖十多个行业，分析了语音 AI 的应用现状与关键特性。

来自主题: AI技术研报

9065 点击 2025-11-30 11:52

CB Insights 2025 未来科技新星：45 家高潜力AI初创公司名单与技术趋势解读｜Jinqiu Select

CB Insights 发布的《2025 Future Tech Hotshots：Scouting Reports》报告，结合生成式 AI 分析与专有 Mosaic 评分体系，从全球海量初创企业中遴选出 45 家最具潜力的科技公司。

来自主题: AI技术研报

8567 点击 2025-11-30 11:43

不炫技的 AI，涨得更快，17 款 AI App接住了人间烟火｜2025年10月AI百强榜

但当我们把视线从焦点模型上，挪到手机里AI应用真实数据上，就会发现一幅不同的画面。可以看到在非凡产研 10 月 AI App 增速榜上，跑得最快的那 17 个，并不是万事皆可聊的通用助手，而是一群看上去有点普通、甚至有点土气的小应用，其中Gauth、Starry、Knowunity、AI Baby Generator已经连续两个月上榜了。

来自主题: AI技术研报

7444 点击 2025-11-30 11:39

世界模型：机器能否理解现实？

人工智能研究的最新目标，尤其是在追求“通用人工智能”（AGI）的实验室中，是一个被称为“世界模型”（world model）的概念：这是一种AI内部携带的环境表征，就像一个计算型的雪球玻璃球。AI系统可以借助这个简化的内部模型，在真正执行任务之前，先对预测和决策进行评估。

来自主题: AI技术研报

7814 点击 2025-11-30 11:18

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

7847 点击 2025-11-30 09:30

国产最强多模态宝座又易主？671B参数练就“火眼金睛”，基于DeepSeek打造

智东西11月28日报道，刚刚，快手开源其新一代旗舰多模态大模型Keye-VL-671B-A37B。该模型基于DeepSeek-V3-Terminus打造，拥有6710亿个参数，在保持基础模型通用能力的前提下，对视觉感知、跨模态对齐与复杂推理链路进行了升级，实现了较强的多模态理解和复杂推理能力。

来自主题: AI技术研报

8544 点击 2025-11-29 20:12

17万条推理轨迹扒出AI推理的真相：有劲儿，但用错了地方｜哈佛新论文解读

而今天，来自 UIUC、华盛顿大学等机构的一群研究人员，通过一篇重磅论文《推理的认知基础及其在大型语言模型中的体现》，为这个“认知鸿沟”画出了一张精确的微观解剖图。

来自主题: AI技术研报

7760 点击 2025-11-29 20:10

NeurIPS 2025 Oral | 1个Token零成本，REG让Diffusion训练收敛快20倍！

REG 是一种简单而有效的方法，仅通过引入一个 class token 便能大幅加速生成模型的训练收敛。其将基础视觉模型（如 DINOv2）的 class token 与 latent 在空间维度拼接后共同加噪训练，从而显著提升 Diffusion 的收敛速度与性能上限。在 ImageNet 256×256 上，

来自主题: AI技术研报

6617 点击 2025-11-29 13:46

混元OCR模型核心技术揭秘：统一框架、真端到端

腾讯混元大模型团队正式发布并开源HunyuanOCR模型！这是一款商业级、开源且轻量（1B参数）的OCR专用视觉语言模型，模型采用原生ViT和轻量LLM结合的架构。目前，该模型在抱抱脸（Hugging Face）趋势榜排名前四，GitHub标星超过700，并在Day 0被vllm官方团队接入。

来自主题: AI技术研报

7433 点击 2025-11-29 13:43

RAG不会过时，但你需要这10个上下文处理技巧|Context Engineering系列一

RAG效果不及预期，试试这10个上下文处理优化技巧。对大部分开发者来说，搭一个RAG或者agent不难，怎么把它优化成生产可用的状态最难。在这个过程中，检索效率、准确性、成本、响应速度，都是重点关注问题。

来自主题: AI技术研报

7722 点击 2025-11-29 10:03

北大新作EvoVLA：大幅降低机器人幻觉，长序列成功率暴涨10%

具身智能的「ChatGPT时刻」还没到，机器人的「幻觉」却先来了？在需要几十步操作的长序列任务中，现有的VLA模型经常「假装在干活」，误以为任务完成。针对这一痛点，北京大学团队提出自进化VLA框架EvoVLA。该模型利用Gemini生成「硬负样本」进行对比学习，配合几何探索与长程记忆，在复杂任务基准Discoverse-L上将成功率提升了10.2%，并将幻觉率从38.5%大幅降至14.8%。

来自主题: AI技术研报

7687 点击 2025-11-29 09:58

为什么记忆成为下一代 AI 的「核心变量」 | GAIR Live 20

人工智能在过去的十年中，以惊人的速度革新了信息处理和内容生成的方式。然而，无论是大语言模型（LLM）本体，还是基于检索增强生成（RAG）的系统，在实际应用中都暴露出了一个深层的局限性：缺乏跨越时间的、可演化的、个性化的“记忆”。它们擅长瞬时推理，却难以实现持续积累经验、反思历史、乃至真正像人一样成长的目标。

来自主题: AI技术研报

7675 点击 2025-11-29 09:56

谁将为这场史上最昂贵的AI军备竞赛买单？｜大公司

过去数周，英伟达股价经历了一轮高位回调与震荡。目前市值相较于一个月前的高点已下降15.4%。虽然一周前最新季度财报发布后，公司超预期的业绩表现一定程度上稳定了市场信心，但隔天股价的下跌反映着情绪底色依然是消极的。

来自主题: AI技术研报

7427 点击 2025-11-28 13:54

生成式AI赋能需求工程：一场正在发生的变革

在软件开发领域，需求工程（Requirements Engineering, RE）一直是项目成功的关键环节。然而，传统 RE 方法面临着效率低下、需求变更频繁等挑战。根据 Standish Group 的报告，仅有 31% 的软件项目能在预算和时间内完成，而需求相关问题导致的项目失败率高达 37%。

来自主题: AI技术研报

9207 点击 2025-11-28 10:39

RAG效果要提升，先搞定高质量Context Pruning

Context Pruning如何结合rerank，优化RAG上下文？

来自主题: AI技术研报

8645 点击 2025-11-28 10:05

大模型首次拥有“脖子”！纽大团队实现360度类人视觉搜索

终于有人要给大模型安“脖子”了！

来自主题: AI技术研报

7165 点击 2025-11-28 10:03