AI资讯新闻榜单内容搜索-模型

剑桥揭开大模型翻车黑箱！别再怪它不懂推理，是行动出错了

为什么大模型，在执行长时任务时容易翻车？这让一些专家，开始质疑大模型的推理能力，认为它们是否只是提供了「思考的幻觉」。近日，剑桥大学等机构的一项研究证明：问题不是出现在推理上，而是出在大模型的执行能力上。

来自主题: AI技术研报

8255 点击 2025-10-14 11:10

拒绝“熵崩塌”和“熵爆炸”！这项研究让大模型学会“精确探索”，推理成绩飙升

大语言模型在RLVR训练中面临的“熵困境”，有解了！

来自主题: AI技术研报

8468 点击 2025-10-14 10:57

真正的AI竞争力，藏在大模型“后训练”这一步

当全球的目光还在聚焦基座模型的参数竞赛时，一场更为深刻的变革正在悄然发生——后训练（Post-Training）。

来自主题: AI技术研报

8555 点击 2025-10-14 10:16

Being-VL的视觉BPE路线：把「看」和「说」真正统一起来

为此，北大、UC San Diego 和 BeingBeyond 联合提出一种新的方法——Being-VL 的视觉 BPE 路线。Being-VL 的出发点是把这一步后置：先在纯自监督、无 language condition 的设定下，把图像离散化并「分词」，再与文本在同一词表、同一序列中由同一 Transformer 统一建模，从源头缩短跨模态链路并保留视觉结构先验。

来自主题: AI技术研报

8179 点击 2025-10-14 09:58

腾讯开源世界第一生图模型，我总结了16个邪修玩法

讲真，AI生图圈的内卷速度简直离谱。8月底的Nano Banana、9月中的即梦4.0已经把画质和效果卷到了一个新高度，但我还在纠结到底该把谁设为主力工具，因为总觉得他们差点什么：不是出错就是不懂场景。

来自主题: AI技术研报

11385 点击 2025-10-14 09:57

前端危！Gemini 3内测结果获网友一致好评，“有史以来最强前端开发模型”

谷歌下一代旗舰模型Gemini 3未发布便已悄然走红！原因很简单：强，实在是太强了。在国外社交媒体平台𝕏上，一大波网友激动地分享了Gemini 3的内测结果——从曝光的这些案例来看，Gemini 3尤为擅长前端、SVG矢量图生成，而且多模态能力变得更强。

来自主题: AI资讯

8826 点击 2025-10-13 18:42

又一批AI社交产品悄悄「死亡」了

又一批AI社交公司与产品悄悄「死亡」了。今年9月，一批AI社交公司发布关停或通知，这之中，既包括大模型明星公司、社交公司等中型企业，如阶跃星辰To C产品「冒泡鸭」、Soul旗下的AI应用「异世界回响」等，也包括一批垂直领域的初创产品，如定位AI情感分析的Lumi、由前苹果设计师Jason Yuan创立的情感陪伴应用Dot等。

来自主题: AI资讯

9841 点击 2025-10-13 16:21