AI资讯新闻榜单内容搜索-训练

DeepSeek悄悄开源LPLB：用线性规划解决MoE负载不均

昨天，DeepSeek 在 GitHub 上线了一个新的代码库：LPLB。

来自主题: AI资讯

8966 点击 2025-11-21 10:50

AAAI 2025 Oral | 火山引擎多媒体实验室提出VQ-Insight，AIGC视频画质理解大模型

近日，AAAI 2026 公布了录用结果，该会议是是人工智能领域极具影响力的国际顶级学术会议之一。据悉本次会议共有 23680 篇投稿进入审稿阶段，最终 4167 篇论文被录用，录取率为 17.6%。

来自主题: AI技术研报

11097 点击 2025-11-21 09:42

AI终于学会「读懂人心」，带飞DeepSeek R1，OpenAI o3等模型

“What is meant often goes far beyond what is said, and that is what makes conversation possible.” ——H. P. Grice

来自主题: AI技术研报

8911 点击 2025-11-21 09:16

谷歌SIMA 2：“AI游戏搭子”背后的真实世界野心

游戏，是AI通往真实世界的训练场。

来自主题: AI资讯

9589 点击 2025-11-21 09:15

Z Tech ｜ LMSYS 团队发布大规模 MoE 强化学习框架 Miles，不积跬步无以至千里

继轻量级强化学习（RL）框架 slime 在社区中悄然流行并支持了包括 GLM-4.6 在内的大量 Post-training 流水线与 MoE 训练任务之后，LMSYS 团队正式推出 Miles——一个专为企业级大规模 MoE 训练及生产环境工作负载设计的强化学习框架。

来自主题: AI资讯

9397 点击 2025-11-20 15:26

永别了，Tokenizer！何恺明师徒新作，颠覆AI生图技术

扩散模型「去噪」，是不是反而忘了真正去噪？何恺明携弟子出手，回归本源！

来自主题: AI技术研报

10882 点击 2025-11-20 15:26

AI Agent 工程化，本质是数据库系统设计

最近半年，我阅读了业界关于 AI Agent 的工程实践：Anthropic 的 Context Engineering 论文、Manus 的工程分享、Cline 的 Memory Bank 设计等。同时自己也一直在做跟 AI Agent 相关的项目，如：Jta[1]（开源的翻译 Agent，基于 Agentic Workflow）。

来自主题: AI技术研报

9521 点击 2025-11-20 15:03

大模型：从 .txt 到 .exe

下面这个，来自《人类的认知协议》的最后一个章节，写于一年前

来自主题: AI资讯

10939 点击 2025-11-20 10:04

何恺明团队新作：扩散模型可能被用错了

何恺明又一次返璞归真。

来自主题: AI技术研报

7152 点击 2025-11-20 09:35

NeurIPS 2025 Spotlight | 香港大学提出无需数据标记的ViT密集表征增强方法

在视觉处理任务中，Vision Transformers（ViTs）已发展成为主流架构。然而，近期研究表明，ViT 模型的密集特征中会出现部分与局部语义不一致的伪影（artifact），进而削弱模型在精细定位类任务中的性能表现。因此，如何在不耗费大量计算资源的前提下，保留 ViT 模型预训练核心信息并消除密集特征中的伪影？

来自主题: AI技术研报

8545 点击 2025-11-20 09:33