AI资讯新闻榜单内容搜索-模型

突破后训练瓶颈？Meta超级智能实验室又一力作：CaT解决RL监督难题

为了回答这一问题，来自牛津大学、Meta 超级智能实验室等机构的研究者提出设想：推理计算是否可以替代缺失的监督？本文认为答案是肯定的，他们提出了一种名为 CaT（Compute as Teacher）的方法，核心思想是把推理时的额外计算当作教师信号，在缺乏人工标注或可验证答案时，也能为大模型提供监督信号。

来自主题: AI技术研报

6053 点击 2025-09-23 10:09

百度开源视觉理解模型Qianfan-VL！全尺寸领域增强+全自研芯片计算

今天，百度智能云千帆正式推出全新视觉理解模型——Qianfan-VL，并全面开源！该系列包含3B、8B和70B三个尺寸版本，是面向企业级多模态应用场景，进行了深度优化的视觉理解大模型。

来自主题: AI资讯

8378 点击 2025-09-23 10:09

Prompt的尽头，居然是MBTI。

论文的标题很学术，叫《心理学增强AI智能体》但是大白话翻译一下就是，想要让大模型更好地完成任务，你们可能不需要那些动辄几百上千字的复杂Prompt，不需要什么思维链、思维图谱，甚至不需要那些精巧的指令。

来自主题: AI技术研报

8301 点击 2025-09-23 10:08

加速近5倍！北大与字节团队提出BranchGRPO，用「树形分叉 + 剪枝」重塑扩散模型对齐

近期，北京大学与字节团队提出了名为 BranchGRPO 的新型树形强化学习方法。不同于顺序展开的 DanceGRPO，BranchGRPO 通过在扩散反演过程中引入分叉（branching）与剪枝（pruning），让多个轨迹共享前缀、在中间步骤分裂，并通过逐层奖励融合实现稠密反馈。

来自主题: AI技术研报

6866 点击 2025-09-23 10:07

刚刚，DeepSeek-V3.1「终极版」重磅发布！最大提升超36%，V4/R2还远吗？

DeepSeek最新模型DeepSeek-V3.1-Terminus来了！此前在输出中随机掺入「极」字的问题得到显著缓解，Humanity's Last Exam成绩也较V3.1提升1/3！Terminus这个名字是否在暗示DeepSeek-V4也快要来了？

来自主题: AI资讯

9982 点击 2025-09-23 01:25

美团王兴，又开源一款大模型！

最近，美团在AI开源赛道上在猛踩加速。今天，在开源其首款大语言模型仅仅24天后，美团又开源了其首款自研推理模型LongCat-Flash-Thinking。与其基础模型LongCat-Flash类似，效率也是LongCat-Flash-Thinking的最大特点。美团在技术报告中透露，LongCat-Flash-Thinking在自研的DORA强化学习基础设施完成训练

来自主题: AI技术研报

8947 点击 2025-09-22 23:05

这一次，天玑9500的端侧AI能力，友商赶不上了

9 月 22 日下午，联发科推出的新一代旗舰 5G 智能体 AI 芯片 —— 天玑 9500，并展示了一系列新形态端侧的 AI 应用，在公众层面首次推动端侧 AI 从尝鲜到好用。现在，让手机端大语言模型（LLM）处理一段超长的文本，最长支持 128K 字元，它只需要两秒就能总结出会议纪要，AI 还能自动修改你的错别字。

来自主题: AI资讯

8313 点击 2025-09-22 19:09