AI资讯新闻榜单内容搜索-GPT-4

击败GPT、Gemini，复旦×创智孵化创业团队「模思智能」，语音模型上新了

近日，由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别（ASR）模型 MOSS-Transcribe-Diarize，不但可以语音转文字，还可以将音频片段与对话中不同的说话者关联起来，性能超过了 GPT-4o、Gemini、豆包等一众模型。

来自主题: AI资讯

8060 点击 2026-01-21 12:05

2.3 亿人在用 ChatGPT「看病」，张文宏为什么反对年轻医生用 AI

2023 年，当 GPT-4 在美国执业医师资格考试（USMLE）中取得了惊人的高分时，不只是 OpenAI，硅谷都为此喝彩，AI 在医疗上的前景仿佛一片光明。

来自主题: AI资讯

6390 点击 2026-01-20 16:35

GPT-4 技术功臣疑似泄密被开除，OpenAI 系创业天团上演「无间道」

估值 120 亿美元的明星 AI 公司，创业没几年就把首任 CTO 给开了。就在刚刚，前 OpenAI CTO、Thinking Machines Lab 创始人 Mira Murati 在社交媒体上发了条措辞相当严厉的声明：

来自主题: AI资讯

7880 点击 2026-01-15 11:21

真实音频场景，大模型集体挂科！首个原生语音基准MultiChallenge

文本领域的大模型满分选手，换成语音就集体挂科？大模型引以为傲的多轮对话逻辑，在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge，直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示，强如Gemini 3 Pro在真实场景下的通过率也仅过半数，而GPT-4o Audio的表现更是令人大跌眼镜。

来自主题: AI技术研报

9190 点击 2026-01-06 16:46

有300亿美元也未必“再造GPT-4”？NUS尤洋最新长文：拆穿AI增长瓶颈的真相

2026年将至，ChatGPT发布三周年，但关于“AI瓶颈期”的焦虑正达到顶峰。

来自主题: AI资讯

6949 点击 2025-12-31 14:39

对标GPT-4o和香蕉！浙大开源ContextGen：布局身份协同新SOTA

浙江大学ReLER团队开源ContextGen框架，攻克多实例图像生成中布局与身份协同控制难题。基于Diffusion Transformer架构，通过双重注意力机制，实现布局精准锚定与身份高保真隔离，在基准测试中超越开源SOTA模型，对标GPT-4o等闭源系统，为定制化AI图像生成带来新突破。

来自主题: AI技术研报

8858 点击 2025-12-22 16:08

沃顿商学院已发布4篇「Prompt」报告｜重磅

宾夕法尼亚大学沃顿商学院（The Wharton School）今年发布了一系列名为《Prompting Science Reports》的重磅研究报告。他们选取了2024-2025最常用的模型（如GPT-4o, Claude 3.5 Sonnet, Gemini Pro/Flash等），在极高难度的博士级基准测试（GPQA Diamond）上进行了数万次的严谨测试。

来自主题: AI技术研报

8163 点击 2025-12-10 16:11

Ilya刚预言完，世界首个原生多模态架构NEO就来了：视觉和语言彻底被焊死

全球首个可大规模落地的开源原生多模态架构（Native VLM），名曰NEO。要知道，此前主流的多模态大模型，例如我们熟悉的GPT-4V、Claude 3.5等，它们的底层逻辑本质上其实玩的就是拼接。

来自主题: AI技术研报

8270 点击 2025-12-05 14:46

OpenAI大溃败！GPT-5「换皮」GPT-4o，两年半预训练0突破

OpenAI，亟需一场翻身仗！今天，全网最大的爆料：GPT-5基石实为GPT-4o。自4o发布之后，内部预训练屡屡受挫，几乎沦为「弃子」。

来自主题: AI资讯

7249 点击 2025-12-01 10:03

DeepSeek强势回归，开源IMO金牌级数学模型

就在刚刚，DeepSeek 又悄咪咪在 Hugging Face 上传了一个新模型：DeepSeek-Math-V2。顾名思义，这是一个数学方面的模型。它的上一个版本 ——DeepSeek-Math-7b 还是一年多以前发的。当时，这个模型只用 7B 参数量，就达到了 GPT-4 和 Gemini-Ultra 性能相当的水平。相关论文还首次引入了 GRPO，显著提升了数学推理能力。

来自主题: AI资讯

8677 点击 2025-11-27 22:47