AI资讯新闻榜单内容搜索-模型训练

相机参数秒变图片！新模型打通理解生成壁垒，支持任意视角图像创作

能看懂相机参数，并且生成相应视角图片的多模态模型来了。

来自主题: AI技术研报

5146 点击 2025-10-28 13:57

大模型在具身推理上「翻车」了？4496 道题全面揭示短板

具身智能是近年来非常火概念。一个智能体（比如人）能够在环境中完成感知、理解与决策的闭环，并通过环境反馈不断进入新一轮循环，直至任务完成。这一过程往往依赖多种技能，涵盖了底层视觉对齐，空间感知，到上层决策的不同能力，这些能力便是广义上的具身智能。

来自主题: AI技术研报

7026 点击 2025-10-28 13:44

刚刚，Thinking Machines Lab博客提出在策略蒸馏，Qwen被cue 38次

刚刚，不发论文、爱发博客的 Thinking Machines Lab （以下简称 TML）再次更新，发布了一篇题为《在策略蒸馏》的博客。在策略蒸馏（on-policy distillation）是一种将强化学习 (RL) 的纠错相关性与 SFT 的奖励密度相结合的训练方法。在将其用于数学推理和内部聊天助手时，TML 发现在策略蒸馏可以极低的成本超越其他方法。

来自主题: AI技术研报

9254 点击 2025-10-28 10:50

喝点VC｜YC对谈Anthropic预训练负责人：预训练团队也要考虑推理问题，如何平衡预训练和后训练仍在早期探索阶段

预训练的核心是推动损失函数下降，这是我们一直追求的唯一目标。

来自主题: AI资讯

9617 点击 2025-10-28 09:49

推理效率狂飙60倍：DiDi-Instruct让扩散大模型16步超越千步GPT

近日，来自普渡大学、德克萨斯大学、新加坡国立大学、摩根士丹利机器学习研究、小红书 hi-lab 的研究者联合提出了一种对离散扩散大语言模型的后训练方法 —— Discrete Diffusion Divergence Instruct (DiDi-Instruct)。经过 DiDi-Instruct 后训练的扩散大语言模型可以以 60 倍的加速超越传统的 GPT 模型和扩散大语言模型。

来自主题: AI技术研报

10294 点击 2025-10-28 09:40

数据集蒸馏，连发两篇顶会！10%样本实现全量性能，鲁棒不失真

数据集蒸馏是一种用少量合成数据替代全量数据训练模型的技术，能让模型高效又节能。WMDD和GUARD两项研究分别解决了如何保留原始数据特性并提升模型对抗扰动能力的问题，使模型在少量数据上训练时既准确又可靠。

来自主题: AI技术研报

10331 点击 2025-10-27 17:16

拜拜了GUI！中科院团队“LLM友好”计算机使用接口来了

大模型Agent帮你自动操作电脑，理想很丰满，现实却骨感。

来自主题: AI技术研报

8434 点击 2025-10-27 16:56

NVIDIA港大MIT联合推出Fast-dLLM v2：端到端吞吐量提升2.5倍

自回归（AR）大语言模型逐 token 顺序解码的范式限制了推理效率；扩散 LLM（dLLM）以并行生成见长，但过去难以稳定跑赢自回归（AR）模型，尤其是在 KV Cache 复用、和可变长度支持上仍存挑战。

来自主题: AI技术研报

8746 点击 2025-10-27 16:46

看似万能的 AI，其实比你想的更脆弱和邪恶

十月，《纽约时报》发表了题为《The A.I. Prompt That Could End the World》（《那个可能终结世界的 AI 提示词》）的文章。作者 Stephen Witt 采访了多位业内人士：有 AI 先驱，图灵奖获奖者 Yoshua Bengio；以越狱测试著称的 Leonard Tang；以及专门研究模型欺骗的 Marius Hobbhahn。

来自主题: AI技术研报

10409 点击 2025-10-27 15:58

DeepSeek最会讨好，LLM太懂人情世故了，超人类50%

在一篇论文中，研究人员测试了 11 种 LLM 如何回应超过 11500 条寻求建议的查询，其中许多查询描述了不当行为或伤害。结果发现 LLM 附和用户行为的频率比人类高出 50%，即便用户的提问涉及操纵、欺骗或其他人际伤害等情境，模型仍倾向于给予肯定回应。

来自主题: AI技术研报

7446 点击 2025-10-27 15:57