AI资讯新闻榜单内容搜索-GPT-5

实测低调上线的DeepSeek新模型：编程比Claude 4还能打，写作...还是算了吧 | 附彩蛋

自从 GPT-5 发布后，DeepSeek 创始人梁文锋就成了 AI 圈最「忙」的人。

来自主题: AI产品测评

10710 点击 2025-08-21 11:38

奥特曼：我承认GPT-5发布搞砸了

奥特曼终于承认他搞砸了。要说最近AI圈的大型翻车现场，GPT-5的发布绝对能排得上号。

来自主题: AI资讯

6570 点击 2025-08-20 11:59

GPT-5暴写「屎山代码」！14个Prompt，看穿GPT-1到GPT-5七年智商进化史

GPT-5发布半月，却被连连吐槽。如今，一张基准与GPT-4对比基准测试图，证明了Scaling Law没有撞墙。七年间，从GPT-1到GPT-5十四个花式Prompt对决，实力差一目了然。

来自主题: AI资讯

9172 点击 2025-08-20 11:38

OpenAI高管自爆：Scaling不死，GPT-5「双轴训练」撕开智能天花板

奥特曼称GPT-5「比人聪明」，但OpenAI首席运营官Lightcap澄清：这不是AGI。这只是能力过剩的冰山一角——我们仍有十年产品可建，模型越智能，融合越要精妙。GPT-5标志着从纯智商到反思能力的全面跃进。

来自主题: AI资讯

8462 点击 2025-08-20 11:22

刚刚DeepSeek发布3.1版本，实测有进步，在编程等个别场景可硬刚GPT-5

没等到Deepseek R2，DeepSeek悄悄更新了V 3.1。官方群放出的消息就提了一点，上下文长度拓展至128K。128K也是GPT-4o这一代模型的处理Token的长度。因此一开始，鲸哥以为从V3升级到V 3.1，以为是不大的升级，鲸哥体验下来还有惊喜。

来自主题: AI资讯

10035 点击 2025-08-20 03:37

首个医师考试满分AI诞生！超越GPT-5，医学版“谷歌”创造历史，使用量同比增长2000%！

首个满分选手的出现，标志着AI医疗的又一个里程碑。近日，美国初创公司OpenEvidence宣布，其开发的全新AI系统在美国医师执照考试（USMLE）中获得了100%的满分。

来自主题: AI资讯

8938 点击 2025-08-19 10:30

GPT-5首次会推理，OpenAI联创曝AGI秘诀！超临界学习吞噬算力，2045金钱无用？

GPT-5是一个分水岭，终于学会了「推理」。联创Greg Brockman最新访谈畅谈了OpenAI AGI之路，未来AI可以做到边用边学，在超临界模式下推导出N阶后果。

来自主题: AI资讯

7450 点击 2025-08-18 11:26

主观评测五大AI助手识图能力，奇葩卫生间标识识别大PK

作者测试了智谱GLM-4.5V（开启/关闭推理）、豆包、Kimi、元宝和ChatGPT-5在识别十张奇葩卫生间标识上的表现。评测模拟紧急如厕场景，按识别正确性评分。结果智谱普通模式得分最高（86分），ChatGPT-5和智谱推理模式次之（78分），豆包和元宝70分，Kimi垫底（38分），揭示了各AI视觉能力的差异及局限性。

来自主题: AI产品测评

9996 点击 2025-08-18 10:44

越可靠的AI就越人机，牛津大学：高情商模型错误率显著增加

情绪价值这块儿，GPT-5让很多网友大呼失望。免费用户想念GPT-4o，也只能默默调理了。

来自主题: AI资讯

7328 点击 2025-08-16 16:17

GPT-5超越人类医生！推理能力比专家高出24%，理解力强29%

GPT-5比人类医生还会看X光片？！最新研究显示，GPT-5对医学影像的推理和理解准确率分别比人类专家高出24.23%和29.40%。

来自主题: AI资讯

9323 点击 2025-08-16 16:03