AI资讯新闻榜单内容搜索-推理模型

视觉推理模型Top1易主了，智谱GLM-4.6V开源

这一次，AI真的是快要砸掉我的饭碗了。智谱最新升级的新一代视觉推理模型——GLM-4.6V。在深度体验一波之后，我们发现写图文并茂的公众号推文，还只是GLM-4.6V能力的一隅。

来自主题: AI资讯

8874 点击 2025-12-09 00:50

Transformer作者重磅预言：AI无寒冬，推理革命引爆万亿市场！

Transformer的火种已燃烧七年。如今，推理模型（Reasoning Models）正点燃第二轮革命。Transformer共同作者、OpenAI研究员Łukasz Kaiser预判：未来一两年，AI会极速跃升——瓶颈不在算法，而在GPU与能源。

来自主题: AI资讯

8532 点击 2025-11-15 17:00

GPT-5.1凌晨突袭，奥特曼听劝！全网呼唤的人味回来了

没有直播，OpenAI一早放大招，让所有人猝不及防。就在刚刚，GPT-5.1正式发布，GPT-5系列重大升级版登场！一共有三个版本，目前已经上线了前两个： GPT-5.1 Instant ：最常用的模型，语气更亲切、更智能，更善于遵循指令，GPT-5.1 Thinking ：先进的推理模型，更易于理解，处理简单任务速度更快，处理复杂任务更具持久力。

来自主题: AI资讯

8795 点击 2025-11-13 08:02

英伟达帮你省钱，让大模型推理「短而精」，速度快5倍

大模型推理到底要不要「长篇大论」？过去一年，OpenAI o 系列、DeepSeek-R1、Qwen 等一系列推理模型，把「长链思维」玩到极致：答案更准了，但代价是推理链越来越长、Token 消耗爆炸、响应速度骤降。

来自主题: AI技术研报

7250 点击 2025-11-04 16:09

AI越会思考，越容易被骗？「思维链劫持」攻击成功率超过90%

独立研究者 Jianli Zhao 等人近日的一项新研究发现，通过在有害请求前填充一长串无害的解谜推理序列（harmless puzzle reasoning），就能成功对推理模型实现越狱攻击。他们将这种方法命名为思维链劫持（Chain-of-Thought Hijacking）。

来自主题: AI技术研报

9514 点击 2025-11-04 10:27

不用强化学习也能推理，哈佛新采样算法竟能让基础模型比肩GRPO后训练版本

强化学习能力强大，几乎已经成为推理模型训练流程中的标配，也有不少研究者在探索强化学习可以为大模型带来哪些涌现行为。

来自主题: AI技术研报

5958 点击 2025-10-24 10:33

AI模型守法率提升11%，港科大首次用法案构建安全benchmark

香港科技大学KnowComp实验室提出基于《欧盟人工智能法案》和《GDPR》的LLM安全新范式，构建合规测试基准并训练出性能优异的推理模型，为大语言模型安全管理提供了新方向。

来自主题: AI技术研报

9533 点击 2025-10-23 12:20

大模型追逐星辰大海，GPT和Gemini国际天文奥赛夺金

人工智能真是日新月异。早上看到网友的评论：我们已经 0 天没有吸引注意的 AI 领域新突破了。记得三个月前，OpenAI 官宣了他们的推理模型在国际数学奥林匹克（IMO）竞赛中获得了金牌。

来自主题: AI资讯

9354 点击 2025-10-13 16:20

1.5B推理模型新SOTA，RL训练新解法打破「简单题过拟合、难题学不动」的魔咒

QuestA（问题增强）引入了一种方法，用于提升强化学习中的推理能力。通过在训练过程中注入部分解题提示，QuestA 实现两项重大成果

来自主题: AI技术研报

8808 点击 2025-10-06 13:54

美团王兴，又开源一款大模型！

最近，美团在AI开源赛道上在猛踩加速。今天，在开源其首款大语言模型仅仅24天后，美团又开源了其首款自研推理模型LongCat-Flash-Thinking。与其基础模型LongCat-Flash类似，效率也是LongCat-Flash-Thinking的最大特点。美团在技术报告中透露，LongCat-Flash-Thinking在自研的DORA强化学习基础设施完成训练

来自主题: AI技术研报

8890 点击 2025-09-22 23:05