AI资讯新闻榜单内容搜索-o3

o3绞尽脑汁仅答对40%的题目，开源模型基本乱猜？MMSI-Bench：多图空间智能试金石

AI能看图，也能讲故事，但能理解“物体在哪”“怎么动”吗？空间智能，正是大模型走向具身智能的关键拼图。

来自主题: AI技术研报

7650 点击 2025-06-11 15:58

最强推理模型一夜易主！深夜，o3-pro毫无预警上线，刷爆数学、编程、科学基准，强势碾压o1-pro和o3。更惊艳的是，o3价格直接暴降80%，叫板Gemini 2.5 Pro。

来自主题: AI技术研报

8453 点击 2025-06-11 13:20

OpenAI深夜放大招，正式推出“最新最强版”推理模型o3-pro！而且同一时间，o3模型降价80%不降智。官方测评结果显示，在专家评估中，所有人一致更偏爱o3-pro而非o3的回答。

来自主题: AI资讯

10697 点击 2025-06-11 10:50

视觉语言模型（VLM）正经历从「感知」到「认知」的关键跃迁。当OpenAI的o3系列通过「图像思维」（Thinking with Images）让模型学会缩放、标记视觉区域时，我们看到了多模态交互的全新可能。

来自主题: AI技术研报

8376 点击 2025-06-10 14:45

苹果最新大模型论文，在AI圈炸开了锅。有人总结到：苹果刚刚当了一回马库斯，否定了所有大模型的推理能力。

来自主题: AI技术研报

8309 点击 2025-06-09 10:38

还在让大模型写高考作文？有本事做高考数学卷子。又是一年高考时。这届考生上午刚经历了抽象作文的洗礼，下午又被数学无情创飞。

来自主题: AI资讯

10968 点击 2025-06-08 18:24

近年来，大语言模型（LLMs）以及多模态大模型（MLLMs）在多种场景理解和复杂推理任务中取得突破性进展。

来自主题: AI技术研报

8677 点击 2025-06-07 14:20

谷歌深夜携全新Gemini 2.5 Pro强势归来，仅用一个月碾压旧版Gemini 2.5。数学、编程、推理全面封神，稳坐所有榜单第一。

来自主题: AI资讯

7559 点击 2025-06-06 10:51

GPT-5，将于7月发布？刚刚，这个消息已经传疯了！跟奥特曼、OpenAI来往密集的几位人士，已经在留言区纷纷爆料了。而奥特曼本人确认，o3 pro也快来了。

来自主题: AI资讯

8604 点击 2025-06-04 12:07

OpenAI模型命名混乱没规律，以至于打开ChatGPT后，好多人都不知道到底该用哪个模型来完成任务。

来自主题: AI资讯

8822 点击 2025-06-03 15:02