AI资讯新闻榜单内容搜索-推理模型

OpenAI重新开源！第一弹就推理模型，还不限制商用，“冲着DeepSeek来的”

一夜之间，OpenAI更新三大动向，开源、融资、用户暴增。第一，将开源一个具备推理能力的大语言模型，包含参数权重那种。上一次这样开源还是6年前推出GPT-2。

来自主题: AI资讯

10449 点击 2025-04-01 09:15

200美金，人人可手搓QwQ，清华、蚂蚁开源极速RL框架AReaL-boba

由于 DeepSeek R1 和 OpenAI o1 等推理模型（LRM，Large Reasoning Model）带来了新的 post-training scaling law，强化学习（RL，Reinforcement Learning）成为了大语言模型能力提升的新引擎。然而，针对大语言模型的大规模强化学习训练门槛一直很高：

来自主题: AI技术研报

11402 点击 2025-03-31 15:07

AI大模型看手相！图片视频加持深度思考，阿里QVQ-Max“神了神了”

阿里又发了个有意思的大模型——QVQ-Max，第一版视觉推理模型，对任意图像或视频都可以进行深度思考。

来自主题: AI资讯

8355 点击 2025-03-28 17:01

OpenAI破大防，拒绝率从98%骤降2%！陈怡然团队提出全新思维链劫持攻击

「思维链劫持」（H-CoT）的攻击方法，成功攻破了包括OpenAI o1/o3、DeepSeek-R1等在内的多款大型推理模型的安全防线。研究表明，这些模型的安全审查过程透明化反而暴露了弱点，攻击者可以利用其内部推理过程绕过安全防线，使模型拒绝率从98%骤降2%。

来自主题: AI技术研报

7911 点击 2025-03-28 16:09

实测豆包刚刚上线的新版深度思考，他们也向DeepSearch迈出了一步。

今天晚上，就在刚刚，豆包终于上了之前很多人期待的功能，深度思考。我之前用别人的账号体验过这功能，就是推理模型，而今天看到的第一刻，我以为的是，豆包的推理模型终于全量上线了。

来自主题: AI资讯

10015 点击 2025-03-27 21:28

DeepSeek逼出谷歌新推理模型：40分优势超GPT4.5登顶竞技场，支持原生多模态，但依然败给了“竹竿问题”

又双叒，抢在OpenAI直播之前，谷歌Gemini 2.5系列来了。首个版本Pro Experimental一登场就抢下大模型竞技场第一名，并且整整比GPT-4.5高出40分Gemini 2.5同样是推理模型，用Jeff Dean的说法是：

来自主题: AI资讯

8927 点击 2025-03-26 08:40

DeepSeek V3“小版本升级”实测堪比V3.5，非推理模型也有“啊哈时刻”，7米甘蔗过2米门想通了

DeepSeek V3升级了，新版本V3-0324。

来自主题: AI资讯

4543 点击 2025-03-25 10:41

谷歌大型推理模型曝光！击败Claude-3.7-Thinking

哎！最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula，效果据说特别好，打败了o1、o3mini、Claude3.7 Thinking等等模型：网友们通过询问和分析 API，发现这似乎是谷歌正在秘密演练的新推理模型！推测可能是 Google Gemini 2.0 Pro Thinking：

来自主题: AI资讯

8931 点击 2025-03-24 14:41

给R1开八倍速，实测腾讯正式上线的T1推理模型，留给GPT5和o3的时间不多了

我发现对于 o1、R1 等推理模型们大家是又爱又恨，

来自主题: AI资讯

10625 点击 2025-03-24 10:20

腾讯押注非Transformer！推理模型混合Mamba也能搞，深度思考也能秒回

首个基于混合Mamba架构的超大型推理模型来了！就在刚刚，腾讯宣布推出自研深度思考模型混元T1正式版，并同步在腾讯云官网上线。对标o1、DeepSeek R1之外，值得关注的是，混元T1正式版采用的是Hybrid-Mamba-Transformer融合模式——

来自主题: AI资讯

11119 点击 2025-03-22 11:12