AI资讯新闻榜单内容搜索-蒸馏

稳定训练、数据高效，清华大学提出「流策略」强化学习新方法SAC Flow

本文介绍了一种用高数据效率强化学习算法 SAC 训练流策略的新方案，可以端到端优化真实的流策略，而无需采用替代目标或者策略蒸馏。SAC FLow 的核心思想是把流策略视作一个 residual RNN，再用 GRU 门控和 Transformer Decoder 两套速度参数化。

来自主题: AI技术研报

8893 点击 2025-10-19 11:48

又一推理新范式：将LLM自身视作「改进操作符」，突破长思维链极限

Meta 超级智能实验室、伦敦大学学院、Mila、Anthropic 等机构的研究者进行了探索。从抽象层面来看，他们将 LLM 视为其「思维」的改进操作符，实现一系列可能的策略。研究者探究了一种推理方法家族 —— 并行 - 蒸馏 - 精炼（Parallel-Distill-Refine, PDR），

来自主题: AI技术研报

10161 点击 2025-10-10 10:33

告别RAG延迟！LLM首个即插即用“记忆解码器”问世！

一句话概括，还在嫌弃RAG太慢？这帮研究员直接把检索数据库"蒸馏"成了一个小模型，实现了不检索的检索增强，堪称懒人福音。

来自主题: AI技术研报

9412 点击 2025-08-18 11:48

被曝蒸馏DeepSeek还造假！欧版OpenAI塌房了

网友在推特上爆料，一位Mistral离职女员工群发邮件，直指公司多项黑幕。其中最劲爆的就是：Mistral最新模型疑似直接蒸馏自DeepSeek，却对外包装成RL成功案例，并刻意歪曲基准测试结果。

来自主题: AI资讯

10858 点击 2025-08-15 00:07

一夜颠覆Sora神话，H200单卡5秒出片！全华人团队开源AI引爆视频圈

AI视频生成进入了秒生极速时代！UCSD等机构发布的FastWan系模型，在一张H200上，实现了5秒即生视频。稀疏蒸馏，让去噪时间大减，刷新SOTA。

来自主题: AI资讯

8241 点击 2025-08-07 17:55

Flux.1 Krea Dev超大杯实测：开源模型能否撼动Midjourney V7 ？

7月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev，最近终于有时间进行测评了。Flux.1 Krea Dev 是基于FLUX.1 dev 模型进行蒸馏的，参数规模12B，专注于提升图像的美学和真实感，避免了常见的 AI 生成痕迹（过度饱和或不自然高光等等），更倾向于追求自然细节、照片级真实感和多样性。

来自主题: AI资讯

9923 点击 2025-08-07 10:54