AI资讯新闻榜单内容搜索-LLM

万人内测，科研神器Mira爆火！4h肝出论文初稿，全自动接管科研

还在手动在不同工具间来回切换查文献、跑代码、看结果？两个月前发起内侧的科研龙虾SciClaw，经过上万名科研人的「考核」，正式升级为Mira，推出专家小队、科研画布、LLM WIKI 三大核心能力，首次将「Vibe Researching」理念产品化，让研究者像组建实验室团队一样配置 AI，把时间还给真正的科学思考。

来自主题: AI资讯

9315 点击 2026-06-10 11:48

32B超越671B！M-A-P全开源数学定理证明模型OProver，五项评测三项第一

形式化定理证明，一直是LLM公认最严苛的推理试金石，每一步推导都必须通过Lean 4内核的机器验证。

来自主题: AI技术研报

7636 点击 2026-06-09 09:37

ICML 2026｜FusionRoute：从专家路由到自我修正，一种新的多LLM协作范式

近年来，大语言模型能力的提升，已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径：通过多个专家模型的协作来完成生成任务。

来自主题: AI技术研报

10005 点击 2026-06-08 09:47

CVPR 2026｜LLM会写3D视觉代码吗？清华联合智源用GeoCodeBench给出答案

近日，来自清华大学智能产业研究院（AIR）的团队联合北京智源研究院（BAAI）、北京大学、南京大学等机构构建了一个基准：GeoCodeBench。这是一个面向 3D 几何计算机视觉的 PhD 级 coding benchmark，

来自主题: AI技术研报

9206 点击 2026-06-07 10:54

Claude Cowork做不好的领域，被国产黑马Agent彻底跑通了！

Cowork 在 Claude 带火后，大厂都在做，企业也早在用。但通用就是通用，碰上房地产这种数据非标、容错为零的硬骨头，全部露怯。跑通这块的，反而是一匹国产黑马。

来自主题: AI资讯

8229 点击 2026-06-03 15:26

图灵奖得主Sutton新作：AI的下一步，是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟，到 VLA、世界模型等开始进入物理世界，AI 正在不断拓宽其能力边界。

来自主题: AI技术研报

6666 点击 2026-06-02 15:05

Speech LLM 的下一个突破口：你的语音大模型可以是个「带韵律的文本模型」

相信大家都有过这样的体验：同一个系列的模型，使用文本交互的时候，模型就像开启了 “最强大脑”，数学代码等各种复杂推理任务样样精通，可是一旦将其改造成语音对话模型之后，性能就猛烈下降，严重 “降智”，经常会犯很多基本的逻辑错误。

来自主题: AI技术研报

6104 点击 2026-05-28 14:51

VeRL-Omni：面向扩散和全模态生成模型的通用RL后训练框架

VeRL-Omni 是一个面向多模态生成模型的通用 RL 后训练框架，由 VeRL-Omni 团队在 verl 与 vllm-omni 之上构建。覆盖扩散 transformer（Qwen-Image）、混合 AR-DiT（Qwen-Omni）、统一理解 + 生成（BAGEL、HunyuanImage-3.0）等架构。

来自主题: AI技术研报

7739 点击 2026-05-26 10:26

告别多奖励跷跷板：Flow-OPD将多教师OPD带入图像生成

今年以来，在线策略蒸馏 OPD（On-Policy Distillation）已经逐渐成为大厂 LLM 后训练中的重要组件，例如 DeepSeek-V4，GLM5 就使用了多教师 OPD 来整合不同领域专家模型的能力，相比混合奖励强化学习收敛更快、效果更好。

来自主题: AI技术研报

7249 点击 2026-05-26 10:07

还在手写CUDA内核？CODA来了！LLM和新手也能让Transformer跑出光速

5 月 22 日，Tri Dao 在社交媒体上转发了 Han Guo 的一条推文。他还写道：「经过一些数学重写，结果发现 Transformer 的所有内容都是一系列 GEMM + epilogue（矩阵乘法加尾声）。给定一些优化的原语，LLM（以及新手）就可以为所有 Transformer 操作编写光速内核！」

来自主题: AI技术研报

8853 点击 2026-05-25 10:13