AI资讯新闻榜单内容搜索-GPT-4

和GPT-4o最后的夜晚，80万人失去「白月光」

Jane 打开 ChatGPT，熟练地切换到 GPT-4o，屏幕上弹出那行熟悉的提示。「你正在使用 GPT-4o，该模型将于 2 月 13 日下线。欢迎试用我们更新、更强大的模型，享受更佳体验。」

来自主题: AI资讯

9904 点击 2026-02-14 10:34

给GRPO加上运筹外挂让7B模型比肩GPT-4！Li Auto团队发布多目标强化学习新框架 | ICASSP 2026

文本摘要作为自然语言处理（NLP）的核心任务，其质量评估通常需要兼顾一致性（Consistency）、连贯性（Coherence）、流畅性（Fluency）和相关性（Relevance）等多个维度。

来自主题: AI技术研报

9756 点击 2026-02-10 14:11

击败GPT、Gemini，复旦×创智孵化创业团队「模思智能」，语音模型上新了

近日，由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别（ASR）模型 MOSS-Transcribe-Diarize，不但可以语音转文字，还可以将音频片段与对话中不同的说话者关联起来，性能超过了 GPT-4o、Gemini、豆包等一众模型。

来自主题: AI资讯

9767 点击 2026-01-21 12:05

2.3 亿人在用 ChatGPT「看病」，张文宏为什么反对年轻医生用 AI

2023 年，当 GPT-4 在美国执业医师资格考试（USMLE）中取得了惊人的高分时，不只是 OpenAI，硅谷都为此喝彩，AI 在医疗上的前景仿佛一片光明。

来自主题: AI资讯

7842 点击 2026-01-20 16:35

GPT-4 技术功臣疑似泄密被开除，OpenAI 系创业天团上演「无间道」

估值 120 亿美元的明星 AI 公司，创业没几年就把首任 CTO 给开了。就在刚刚，前 OpenAI CTO、Thinking Machines Lab 创始人 Mira Murati 在社交媒体上发了条措辞相当严厉的声明：

来自主题: AI资讯

9235 点击 2026-01-15 11:21

真实音频场景，大模型集体挂科！首个原生语音基准MultiChallenge

文本领域的大模型满分选手，换成语音就集体挂科？大模型引以为傲的多轮对话逻辑，在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge，直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示，强如Gemini 3 Pro在真实场景下的通过率也仅过半数，而GPT-4o Audio的表现更是令人大跌眼镜。

来自主题: AI技术研报

10405 点击 2026-01-06 16:46

有300亿美元也未必“再造GPT-4”？NUS尤洋最新长文：拆穿AI增长瓶颈的真相

2026年将至，ChatGPT发布三周年，但关于“AI瓶颈期”的焦虑正达到顶峰。

来自主题: AI资讯

8040 点击 2025-12-31 14:39

对标GPT-4o和香蕉！浙大开源ContextGen：布局身份协同新SOTA

浙江大学ReLER团队开源ContextGen框架，攻克多实例图像生成中布局与身份协同控制难题。基于Diffusion Transformer架构，通过双重注意力机制，实现布局精准锚定与身份高保真隔离，在基准测试中超越开源SOTA模型，对标GPT-4o等闭源系统，为定制化AI图像生成带来新突破。

来自主题: AI技术研报

10005 点击 2025-12-22 16:08

沃顿商学院已发布4篇「Prompt」报告｜重磅

宾夕法尼亚大学沃顿商学院（The Wharton School）今年发布了一系列名为《Prompting Science Reports》的重磅研究报告。他们选取了2024-2025最常用的模型（如GPT-4o, Claude 3.5 Sonnet, Gemini Pro/Flash等），在极高难度的博士级基准测试（GPQA Diamond）上进行了数万次的严谨测试。

来自主题: AI技术研报

9442 点击 2025-12-10 16:11

Ilya刚预言完，世界首个原生多模态架构NEO就来了：视觉和语言彻底被焊死

全球首个可大规模落地的开源原生多模态架构（Native VLM），名曰NEO。要知道，此前主流的多模态大模型，例如我们熟悉的GPT-4V、Claude 3.5等，它们的底层逻辑本质上其实玩的就是拼接。

来自主题: AI技术研报

9329 点击 2025-12-05 14:46