AI资讯新闻榜单内容搜索-模型训练

韩松等提出FlashMoBA，比MoBA快7.4倍，序列扩到512K也不会溢出

今年 2 月，月之暗面提出了一种名为 MoBA 的注意力机制，即 Mixture of Block Attention，可以直译为「块注意力混合」。

来自主题: AI技术研报

11385 点击 2025-11-18 15:15

让大模型学会「心灵感应」：基于思维沟通的多智能体合作范式来了

如果多个大模型能读懂彼此的想法，会发生什么？

来自主题: AI技术研报

11472 点击 2025-11-18 15:12

谢赛宁盛赞字节Seed新研究！单Transformer搞定任意视图3D重建

单Transformer搞定任意视图3D重建！

来自主题: AI技术研报

8249 点击 2025-11-18 15:12

Agent的RL和LLM的RL是一回事吗？牛津用500+论文写成综述，一次说清Agentic RL

当我们谈论大型语言模型（LLM）的"强化学习"（RL）时，我们在谈论什么？从去年至今，RL可以说是当前AI领域最炙手可热的词汇。

来自主题: AI技术研报

11780 点击 2025-11-18 15:11

告别「一条路走到黑」：通过自我纠错，打造更聪明的Search Agent

为了同时解决知识的实时性和推理的复杂性这两大挑战，搜索智能体（Search Agent）应运而生。它与 RAG 的核心区别在于，Search Agent 能够通过与实时搜索引擎进行多轮交互来分解并执行复杂任务。这种能力在人物画像构建，偏好搜索等任务中至关重要，因为它能模拟人类专家进行深度、实时的资料挖掘。

来自主题: AI技术研报

8028 点击 2025-11-18 14:39

成本仅0.3美元，耗时26分钟！CudaForge：颠覆性低成本CUDA优化框架

CUDA 代码的性能对于当今的模型训练与推理至关重要，然而手动编写优化 CUDA Kernel 需要很高的知识门槛和时间成本。与此同时，近年来 LLM 在 Code 领域获得了诸多成功。

来自主题: AI技术研报

10823 点击 2025-11-18 10:06

首个完整开源的生成式推荐框架MiniOneRec，轻量复现工业级OneRec！

中科大 LDS 实验室何向南、王翔团队与 Alpha Lab 张岸团队联合开源 MiniOneRec，推出生成式推荐首个完整的端到端开源框架，不仅在开源场景验证了生成式推荐 Scaling Law，还可轻量复现「OneRec」，为社区提供一站式的生成式推荐训练与研究平台。

来自主题: AI技术研报

11733 点击 2025-11-18 09:35

解决特斯拉「监督稀疏」难题，DriveVLA-W0用世界模型放大自动驾驶Data Scaling Law

在自动驾驶领域，VLA 大模型正从学术前沿走向产业落地的 “深水区”。近日，特斯拉（Tesla）在 ICCV 的分享中，就将其面临的核心挑战之一公之于众 ——“监督稀疏”。

来自主题: AI技术研报

9351 点击 2025-11-17 15:00

SIGGRAPH Asia 2025 | 让3D场景生成像「写代码」一样灵活可控

随着生成式 AI 的快速发展，从文本生成图像、视频，到构建完整的三维世界，AI “创造空间” 的能力正以前所未有的速度突破边界。然而，现有 3D 场景生成方法仍存在明显局限：模型往往直接输出每个物体的几何参数（位置、大小、方向等），结果容易出现漂浮、重叠、穿模等问题；场景结构缺乏逻辑一致性，难以编辑或复用，更无法像程序那样精确控制空间关系与生成逻辑。

来自主题: AI技术研报

10943 点击 2025-11-17 14:33

Lumina-DiMOO：多模态扩散语言模型重塑图像生成与理解

上海人工智能实验室推出了一款革新的多模态生成理解一体化的扩散语言模型 ——Lumina-DiMOO。基于离散扩散建模（Discrete Diffusion Modeling），Lumina-DiMOO 打破了多模态任务之间的壁垒，在同一离散扩散框架下，完成从文本→图像、图像→图像、图像→文本的全栈能力闭环。

来自主题: AI技术研报

9701 点击 2025-11-17 14:33