AI资讯新闻榜单内容搜索-蒸馏

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 蒸馏

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

7B超越GPT！1/20数据，无需知识蒸馏，马里兰等推出全新视觉推理方法

通过蒙特卡洛树搜索筛选高难度样本，ThinkLite-VL仅用少量数据就能显著提升视觉语言模型的推理能力，无需知识蒸馏，为高效训练提供了新思路。

来自主题: AI技术研报

7396 点击 2025-04-24 14:38

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

Jeff Dean演讲回顾LLM发展史，Transformer、蒸馏、MoE、思维链等技术都来自谷歌

4 月 14 日，谷歌首席科学家 Jeff Dean 在苏黎世联邦理工学院举办的信息学研讨会上发表了一场演讲，主题为「AI 的重要趋势：我们是如何走到今天的，我们现在能做什么，以及我们如何塑造 AI 的未来？」

来自主题: AI技术研报

7061 点击 2025-04-18 14:40

GPT-4.1全网实测来袭，惨遭谷歌Gemini碾压！大佬猜测：从GPT-4.5蒸馏的

GPT-4.1全网实测来袭，惨遭谷歌Gemini碾压！大佬猜测：从GPT-4.5蒸馏的

GPT-4.1全网实测来袭，惨遭谷歌Gemini碾压！大佬猜测：从GPT-4.5蒸馏的

两个月后就号称要淘汰GPT-4.5的GPT-4.1，实力究竟如何？在众多实测中，它的表现的确可圈可点，但却依然打不过Gemini 2.5 Pro和Claude 3.7 Sonnet。那么问题来了，OpenAI为何要发布一个远远落后于谷歌的模型？

来自主题: AI资讯

8027 点击 2025-04-16 10:26

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

一秒十图！英伟达MIT联手刷新SOTA，一步扩散解锁实时高质量可控图像生成

SANA-Sprint是一个高效的蒸馏扩散模型，专为超快速文本到图像生成而设计。通过结合连续时间一致性蒸馏（sCM）和潜空间对抗蒸馏（LADD）的混合蒸馏策略，SANA-Sprint在一步内实现了7.59 FID和0.74 GenEval的最先进性能。SANA-Sprint仅需0.1秒即可在H100上生成高质量的1024x1024图像，在速度和质量的权衡方面树立了新的标杆。

来自主题: AI技术研报

8223 点击 2025-03-31 16:16

95后博导张林峰专访：6年前提出自蒸馏算法，高效AI助推大模型时代丨独家

95后博导张林峰专访：6年前提出自蒸馏算法，高效AI助推大模型时代丨独家

95后博导张林峰专访：6年前提出自蒸馏算法，高效AI助推大模型时代丨独家

张林峰于2019年提出了自蒸馏算法，是知识蒸馏领域的代表性工作之一。DeepSeek出现后，知识蒸馏领域再次获得了极大的关注。

来自主题: AI资讯

7125 点击 2025-03-28 10:58

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA

精度效率双冠王！时序预测新范式TimeDistill：跨架构知识蒸馏，全面超越SOTA

TimeDistill通过知识蒸馏，将复杂模型（如Transformer和CNN）的预测能力迁移到轻量级的MLP模型中，专注于提取多尺度和多周期模式，显著提升MLP的预测精度，同时保持高效计算能力，为时序预测提供了一种高效且精准的解决方案。

来自主题: AI技术研报

7160 点击 2025-03-10 09:35

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

7B的DeepSeek蒸馏Qwen数学超o1！在测试时间强化学习，MIT积分题大赛考93分

见识过32B的QwQ追平671的DeepSeek R1后——刚刚，7B的DeepSeek蒸馏Qwen模型超越o1又是怎么一回事？新方法LADDER，通过递归问题分解实现AI模型的自我改进，同时不需要人工标注数据。

来自主题: AI技术研报

4782 点击 2025-03-08 10:38

天翼云CPU实例部署DeepSeek-R1模型最佳实践

天翼云CPU实例部署DeepSeek-R1模型最佳实践

天翼云CPU实例部署DeepSeek-R1模型最佳实践

本文介绍了英特尔®至强®处理器在AI推理领域的优势，如何使用一键部署的镜像进行纯CPU环境下基于AMX加速后的DeepSeek-R1 7B蒸馏模型推理，以及纯CPU环境下部署DeepSeek-R1 671B满血版模型实践。

来自主题: AI技术研报

7065 点击 2025-03-04 10:23

蒸馏任何深度，仅用少量无标签数据就能实现单目深度估计新SOTA

蒸馏任何深度，仅用少量无标签数据就能实现单目深度估计新SOTA

蒸馏任何深度，仅用少量无标签数据就能实现单目深度估计新SOTA

单目深度估计新成果来了！西湖大学AGI实验室等提出了一种创新性的蒸馏算法，成功整合了多个开源单目深度估计模型的优势。在仅使用2万张无标签数据的情况下，该方法显著提升了估计精度，并刷新了单目深度估计的最新SOTA性能。

来自主题: AI技术研报

7958 点击 2025-02-28 15:40

1/30训练步骤复刻DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型RL训练方法

1/30训练步骤复刻DeepSeek-R1-Zero，沈向洋姜大昕张祥雨等开源推理模型RL训练方法

DeepSeek啥都开源了，就是没有开源训练代码和数据。现在，开源RL训练方法只需要用1/30的训练步骤就能赶上相同尺寸的DeepSeek-R1-Zero蒸馏Qwen。

来自主题: AI技术研报

7920 点击 2025-02-22 21:30

上一页当前第2页,共6页下一页