AI资讯新闻榜单内容搜索-GPT-5

平替版Fable 5的打开教程来了：性能追平，成本砍半

最新测试显示，模型抱团后实力明显升级：Opus 4.8+GPT-5.5>Fable 5；Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash=Fable 5。能力追上了，开销还减半。根据官方定价，相比Fable 5，Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash这套平价阵容，成本降幅接近80%。

来自主题: AI资讯

9407 点击 2026-06-14 16:04

刚刚，GPT-5.5被星火医疗大模型V3.5反超了！

刚刚，医疗大模型赛道的魔咒，终于被打破了！讯飞医疗正式发布——星火医疗大模型V3.5。生成病历医生采纳率91%、书写时间缩短52%、累计辅助诊断超12亿次。这一连串的数字，直接把医疗AI「最难用的门槛」踩在脚下。

来自主题: AI资讯

9868 点击 2026-06-14 12:52

ChatGPT突然改版！GPT-5.6本月上桌

GPT-5.6本月上桌，agentic编码据称已反超Anthropic Mythos！三家旗舰模型撞进同一个6月，两大AI巨头同时冲刺IPO，奥特曼却在内部抛出了一个更大的变量：如果AI先学会自我改进，上市反而不急。

来自主题: AI资讯

9389 点击 2026-06-11 21:38

神话级Claude 5，登顶了！

发布24小时，神话级Claude 5光速登顶！不仅创下AI史上最大分差纪录，更将GPT-5.5直接斩落马下。

来自主题: AI资讯

8454 点击 2026-06-11 15:26

GPT-5.6首批实测来了！精准狙击Mythos

刚刚，Anthropic放出藏了俩月的大杀器——Claude Fable 5和Mythos 5，无异于扔下一枚炸弹。

来自主题: AI资讯

9728 点击 2026-06-10 16:07

刚刚，Mind Lab开源V1系列模型Preview，749B参数，专为Agent 后训练

过去一个多月，大模型圈依旧热闹。从 GPT-5.5、DeepSeek V4 到 Claude Opus 4.8，后训练正在成为模型能力提升的关键引擎。

来自主题: AI技术研报

6084 点击 2026-06-08 15:29

Anthropic偷跑代码又秒删，GPT-5.6震撼升级决战Mythos！

GPT-5.6发布候选版本kindle-alpha敲定，前端和视觉能力大幅跃升。与此同时，Claude Mythos 5在API中闪现又秒删。双雄争霸，好戏开始！

来自主题: AI资讯

7364 点击 2026-06-08 10:47

37万次真实会话实测Agent榜单：GPT-5.5High第一，Claude最稳，真实干活能力看这五项核心指标

6月4日，Arena.ai发布Agent Arena排行榜，用373,431次真实会话的数据，给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”（Net Improvement），用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好，负值说明不如随机。

来自主题: AI技术研报

9301 点击 2026-06-07 14:38

OpenAI今晚放大招！奥特曼亲自上阵，GPT-5.6本周反杀

刚刚，OpenAI今晚直播预告，奥特曼或现身。明天，OpenAI将于美国东部时间上午举行「Intelligence at Work」直播活动，奥特曼将出席。随后，纳德拉将于美国东部时间下午发表Microsoft Build大会的开幕主题演讲。

来自主题: AI资讯

9502 点击 2026-06-02 16:59

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

2026 年初，各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文，Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报

10190 点击 2026-06-02 11:23