AI资讯新闻榜单内容搜索-训练

让机器人在“想象”中学习世界的模型来了！PI联创课题组&清华陈建宇团队联合出品

这两天，Physical Intelligence（PI）联合创始人Chelsea Finn在𝕏上，对斯坦福课题组一项最新世界模型工作kuakua连续点赞。

来自主题: AI技术研报

7597 点击 2025-10-31 09:51

按从左到右的顺序依次生成下一个 token 真的是大模型生成方式的最优解吗？最近，越来越多的研究者对此提出质疑。其中，有些研究者已经转向一个新的方向 —— 掩码扩散语言模型（MDLM）。

来自主题: AI技术研报

9791 点击 2025-10-31 09:50

家人们，不知道你有没有试过，在和 AI 聊天时，冷不丁地问一句： “你刚刚在想什么？”

来自主题: AI技术研报

11163 点击 2025-10-30 17:30

用 iPhone 本地跑大模型已经不是新鲜事了，但能不能在 iPhone 上微调模型呢？

来自主题: AI技术研报

9620 点击 2025-10-30 17:27

近年来，基于扩散模型的图像生成技术发展迅猛，催生了Stable Diffusion、Midjourney等一系列强大的文生图应用。然而，当前主流的训练范式普遍依赖一个核心组件——变分自编码器（VAE），这也带来了长久以来困扰研究者们的几个问题：

来自主题: AI技术研报

6333 点击 2025-10-30 17:03

随着文图生成模型的广泛应用，模型本身有限的安全防护机制使得用户有机会无意或故意生成有害的图片内容，并且该内容有可能会被恶意使用。现有的安全措施主要依赖文本过滤或概念移除的策略，只能从文图生成模型的生成能力中移除少数几个概念。

来自主题: AI技术研报

9705 点击 2025-10-30 17:01

大语言模型（LLM）虽已展现出卓越的代码生成潜力，却依然面临着一道艰巨的挑战：如何在有限的计算资源约束下，同步提升对多种编程语言的理解与生成能力，同时不损害其在主流语言上的性能？

来自主题: AI技术研报

8084 点击 2025-10-30 16:23

杨红霞要走一条和阿里、字节截然不同的模型训练之路。

来自主题: AI资讯

9164 点击 2025-10-30 12:14

读者，您好！今天想跟您聊一个硬核又极具启发性的项目——HGM（Huxley-Gödel Machine）。我刚刚一起花了几个小时，从环境配置的坑，一路“打怪升级”到让它最终跑完，相信您可能已经从别的公众号上看到了这篇文章。

来自主题: AI技术研报

8779 点击 2025-10-30 11:24

当下主流的视觉语言模型（Vision-Language Models, VLM），通常都采用这样一种设计思路：将预训练的视觉编码器与大语言模型通过投影层拼接起来。这种模块化架构成就了当前 VLM 的辉煌，但也带来了一系列新的问题——多阶段训练复杂、组件间语义对齐成本高，不同模块的扩展规律难以协调。

来自主题: AI技术研报

7607 点击 2025-10-30 10:55