AI资讯新闻榜单内容搜索-蒸馏

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 蒸馏

Flux.1 Krea Dev超大杯实测：开源模型能否撼动Midjourney V7 ？

Flux.1 Krea Dev超大杯实测：开源模型能否撼动Midjourney V7 ？

Flux.1 Krea Dev超大杯实测：开源模型能否撼动Midjourney V7 ？

7月底 Black Forest Labs 和 Krea 合作开发的高级文本到图像生成模型 Flux.1 Krea Dev，最近终于有时间进行测评了。Flux.1 Krea Dev 是基于FLUX.1 dev 模型进行蒸馏的，参数规模12B，专注于提升图像的美学和真实感，避免了常见的 AI 生成痕迹（过度饱和或不自然高光等等），更倾向于追求自然细节、照片级真实感和多样性。

来自主题: AI资讯

9711 点击 2025-08-07 10:54

抗干扰能力提升近40% ！无需对抗训练，北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% ！无需对抗训练，北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

抗干扰能力提升近40% ！无需对抗训练，北航上海AI Lab新蒸馏方法提升模型鲁棒性 | ICML 2025

在人工智能模型规模持续扩大的今天，数据集蒸馏（Dataset Distillation,DD）方法能够通过使用更少的数据，达到接近完整数据的训练效果，提升模型训练效率，降低训练成本。

来自主题: AI技术研报

8153 点击 2025-07-29 10:12

不用千亿参数也能合成高质量数据！这个开源框架让小模型“组团逆袭”，7B性能直追72B

不用千亿参数也能合成高质量数据！这个开源框架让小模型“组团逆袭”，7B性能直追72B

不用千亿参数也能合成高质量数据！这个开源框架让小模型“组团逆袭”，7B性能直追72B

无需蒸馏任何大规模语言模型，小模型也能自给自足、联合提升？

来自主题: AI技术研报

8424 点击 2025-06-22 16:13

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

DeepSeek-R1 发布，性能对标 OpenAI o1 正式版，实测编程性能直逼claude 4

今天，我们正式发布 DeepSeek-R1，并同步开源模型权重。DeepSeek-R1 遵循 MIT License，允许用户通过蒸馏技术借助 R1 训练其他模型。DeepSeek-R1 上线API，对用户开放思维链输出，通过设置 `model='deepseek-reasoner'` 即可调用。

来自主题: AI资讯

10396 点击 2025-05-28 21:49

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

5%参数比肩DeepSeek满血R1！北大“小”模型靠分合蒸馏，打破推理成本下限

只用5%的参数，数学和代码能力竟然超越满血DeepSeek？

来自主题: AI资讯

9870 点击 2025-05-27 12:45

何恺明等降维打击！彻底颠覆AI生图，无需预训练一步到位

何恺明等降维打击！彻底颠覆AI生图，无需预训练一步到位

何恺明等降维打击！彻底颠覆AI生图，无需预训练一步到位

何恺明团队又一力作！这次他们带来的是「生成模型界的降维打击」——MeanFlow：无需预训练、无需蒸馏、不搞课程学习，仅一步函数评估（1-NFE），就能碾压以往的扩散与流模型！

来自主题: AI技术研报

7436 点击 2025-05-21 14:50

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

Qwen3家族训练秘籍公开：思考/非思考融进一个模型，大模型蒸馏带动小模型

Qwen3技术报告新鲜出炉，8款模型背后的关键技术被揭晓！

来自主题: AI技术研报

8377 点击 2025-05-14 15:26

大模型推理上限再突破：「自适应难易度蒸馏」超越R1蒸馏，长CoT语料质量飞升

大模型推理上限再突破：「自适应难易度蒸馏」超越R1蒸馏，长CoT语料质量飞升

大模型推理上限再突破：「自适应难易度蒸馏」超越R1蒸馏，长CoT语料质量飞升

近年来，「思维链（Chain of Thought，CoT）」成为大模型推理的显学，但要让小模型也拥有长链推理能力却非易事。

来自主题: AI技术研报

9173 点击 2025-05-04 17:08

边缘AI赛道，疯狂收购

边缘AI赛道，疯狂收购

边缘AI赛道，疯狂收购

自从DeepSeek带火了蒸馏模型以后，更多人开始关注AI大模型在边缘端的部署。而在过去，TinyML一直也在MCU领域很火热。现在，边缘AI走得更快了，市场也正在走向爆发。

来自主题: AI资讯

9451 点击 2025-04-30 08:25

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

通过蒙特卡洛树搜索筛选高难度样本，ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力，无需知识蒸馏，为高效训练提供了新思路。

来自主题: AI技术研报

9600 点击 2025-04-28 16:59

上一页当前第6页,共11页下一页