AI资讯新闻榜单内容搜索-o1

谷歌大型推理模型曝光！击败Claude-3.7-Thinking

哎！最近推特上的网友在LMSYS Arena 发现了个泄漏的大模型 Nebula，效果据说特别好，打败了o1、o3mini、Claude3.7 Thinking等等模型：网友们通过询问和分析 API，发现这似乎是谷歌正在秘密演练的新推理模型！推测可能是 Google Gemini 2.0 Pro Thinking：

来自主题: AI资讯

8616 点击 2025-03-24 14:41

给R1开八倍速，实测腾讯正式上线的T1推理模型，留给GPT5和o3的时间不多了

我发现对于 o1、R1 等推理模型们大家是又爱又恨，

来自主题: AI资讯

10289 点击 2025-03-24 10:20

腾讯押注非Transformer！推理模型混合Mamba也能搞，深度思考也能秒回

首个基于混合Mamba架构的超大型推理模型来了！就在刚刚，腾讯宣布推出自研深度思考模型混元T1正式版，并同步在腾讯云官网上线。对标o1、DeepSeek R1之外，值得关注的是，混元T1正式版采用的是Hybrid-Mamba-Transformer融合模式——

来自主题: AI资讯

10807 点击 2025-03-22 11:12

OpenAI史上最贵模型来了！比DeepSeek贵270倍，100万输出token 600美元

比DeepSeek-R1贵270倍，OpenAI史上最贵模型来了！

来自主题: AI资讯

7412 点击 2025-03-20 16:58

刚刚，OpenAI史上最贵API上线！o1-pro比DeepSeek-R1溢价千倍

刚刚，OpenAI正式上线史上最贵API——o1-pro，输入/输出价格贵到离谱，最高可达DeepSeek-R1的千倍。OpenAI研究员戏称，大模型界的劳斯莱斯。

来自主题: AI资讯

9387 点击 2025-03-20 11:02

想纠正LMM犯错？没用！NUS华人团队：最强o1反馈修正率不到50%

LMM在人类反馈下表现如何？新加坡国立大学华人团队提出InterFeedback框架，结果显示，最先进的LMM通过人类反馈纠正结果的比例不到50%！

来自主题: AI技术研报

8007 点击 2025-03-17 09:32

ChatGPT再进化：o1支持调用Python分析数据，网友：已经成为Copilot了

今天一大早，ChatGPT突然更新——基于Python的数据分析功能，在o1和o3-mini当中也可以使用了。OpenAI介绍，现在可以通过两款模型调用Python，完成数据分析、可视化、基于场景的模拟等任务。

来自主题: AI资讯

8944 点击 2025-03-14 12:27

超越DeepSeek-R1关键RL算法GRPO，CMU「元强化微调」新范式登场

大语言模型（LLM）在推理领域的最新成果表明了通过扩展测试时计算来提高推理能力的潜力，比如 OpenAI 的 o1 系列。

来自主题: AI技术研报

8210 点击 2025-03-13 14:41

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

乙巳新春，中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型，DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮，并不令人意外，但这款来自大厂体系外创业团队的开源大模型，经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果，则是非常耐人寻味了。

来自主题: AI监管政策

11611 点击 2025-03-11 23:53

OpenAI自曝“o4”训练中，用思维链监控抓住AI作弊瞬间

o1/o3这样的推理模型太强大，一有机会就会利用漏洞作弊，怎么办？

来自主题: AI资讯

6191 点击 2025-03-11 16:35