AI资讯新闻榜单内容搜索-蒸馏

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 蒸馏
告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

告别纯奖励试错!二次尝试+反思蒸馏,复杂任务提升81%

强化学习已经成为大模型后训练阶段的核心方法之一,但一个长期存在的难题始终没有真正解决:现实环境中的反馈往往稀疏且延迟,模型很难从简单的奖励信号中推断出应该如何调整行为。

来自主题: AI技术研报
8433 点击    2026-03-03 14:17
特朗普封杀Anthropic引爆硅谷,死对头奥特曼都来声援了

特朗普封杀Anthropic引爆硅谷,死对头奥特曼都来声援了

特朗普封杀Anthropic引爆硅谷,死对头奥特曼都来声援了

此事件震动了整个硅谷。虽然此前因为抨击其他 AI 公司「蒸馏」其模型,Anthropic 成为了众矢之的,但目前 Anthropic 在科技界获得了巨大的声援。包括竞争对手 OpenAI、谷歌都公开表态支持 Anthropic 坚守底线的决定。

来自主题: AI资讯
8257 点击    2026-02-28 15:30
DeepSeek V4逼近,美国慌了!被曝绕过英伟达优先国内,绝密参数已泄露

DeepSeek V4逼近,美国慌了!被曝绕过英伟达优先国内,绝密参数已泄露

DeepSeek V4逼近,美国慌了!被曝绕过英伟达优先国内,绝密参数已泄露

最近,炸裂消息一个接一个。首先,DeepSeek V4将在一周内上线。第二,它跳过英伟达,把访问权限首先给了某国内芯片厂商。另外,Anthropic因为蒸馏事件,也被群嘲了。

来自主题: AI资讯
9433 点击    2026-02-26 20:20
Anthropic指控中国大模型“使诈”,马斯克凶猛炮轰,海外网友贴脸开骂

Anthropic指控中国大模型“使诈”,马斯克凶猛炮轰,海外网友贴脸开骂

Anthropic指控中国大模型“使诈”,马斯克凶猛炮轰,海外网友贴脸开骂

今天,美国大模型独角兽Anthropic连续发布多则推文、博客,指控DeepSeek、月之暗面和MiniMax三家中国AI实验室,正对Claude进行“工业级规模的蒸馏攻击”。

来自主题: AI资讯
8613 点击    2026-02-24 18:59
刚刚,Anthropic深夜大点名,这三家中国公司进行蒸馏攻击?!

刚刚,Anthropic深夜大点名,这三家中国公司进行蒸馏攻击?!

刚刚,Anthropic深夜大点名,这三家中国公司进行蒸馏攻击?!

刚刚, Anthropic 发推称,DeepSeek、Moonshot AI和MiniMax三家国内的 AI 公司对Claude进行大规模的蒸馏攻击。OK, A 社你真的很讨厌中国公司了。简单说就是:这三家公司用大量假账号,疯狂地向 Claude 提问,然后拿 Claude 的回答去训练自己的模型。

来自主题: AI资讯
8962 点击    2026-02-24 09:17
2026开年关键词:Self-Distillation,大模型真正走向「持续学习」

2026开年关键词:Self-Distillation,大模型真正走向「持续学习」

2026开年关键词:Self-Distillation,大模型真正走向「持续学习」

2026 年刚拉开序幕,大模型(LLM)领域的研究者们似乎达成了一种默契。 当你翻开最近 arXiv 上最受关注的几篇论文,会发现一个高频出现的词汇:Self-Distillation。

来自主题: AI技术研报
6492 点击    2026-02-10 14:17
月之暗面三位联创深夜回应一切!3小时答全球网友23问,杨植麟剧透Kimi K3提升巨大

月之暗面三位联创深夜回应一切!3小时答全球网友23问,杨植麟剧透Kimi K3提升巨大

月之暗面三位联创深夜回应一切!3小时答全球网友23问,杨植麟剧透Kimi K3提升巨大

今天凌晨,月之暗面核心团队在社交媒体平台Reddit上举行了一场有问必答(AMA)活动。三位联合创始人杨植麟(CEO)、周昕宇(算法团队负责人)和吴育昕与全球网友从0点聊到3点,把许多关键问题都给聊透了,比如Kimi K2.5是否蒸馏自Claude、Kimi K3将带来的提升与改变,以及如何在快速迭代与长期基础研究之间取得平衡。

来自主题: AI资讯
9475 点击    2026-01-29 09:32
腾讯AngelSlim升级,首个集LLM、VLM及语音多模态为一体的投机采样训练框架,推理速度飙升1.8倍

腾讯AngelSlim升级,首个集LLM、VLM及语音多模态为一体的投机采样训练框架,推理速度飙升1.8倍

腾讯AngelSlim升级,首个集LLM、VLM及语音多模态为一体的投机采样训练框架,推理速度飙升1.8倍

随着大模型步入规模化应用深水区,日益高昂的推理成本与延迟已成为掣肘产业落地的核心瓶颈。在 “降本增效” 的行业共识下,从量化、剪枝到模型蒸馏,各类压缩技术竞相涌现,但往往难以兼顾性能损耗与通用性。

来自主题: AI技术研报
10248 点击    2026-01-19 08:54
解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

解锁任意步数文生图,港大&Adobe全新Self-E框架学会自我评估

香港大学(The University of Hong Kong)与 Adobe Research 联合发布 Self-E(Self-Evaluating Model):一种无需预训练教师蒸馏、从零开始训练的任意步数文生图框架。其目标非常直接:让同一个模型在极少步数也能生成语义清晰、结构稳定的图像,同时在 50 步等常规设置下保持顶级质量,并且随着步数增加呈现单调提升。

来自主题: AI技术研报
8621 点击    2026-01-18 14:57