AI资讯新闻榜单内容搜索-o3

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o3
GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了

GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了

GPT-5、Grok 4、o3 Pro都零分,史上最难AI评测基准换它了

前沿 AI 模型真的能做到博士级推理吗? 前段时间,谷歌、OpenAI 的模型都在数学奥林匹克(IMO)水平测试中达到了金牌水准,这样的表现让人很容易联想到 LLM 是不是已经具备了解决博士级科研难题的推理能力?

来自主题: AI资讯
6903 点击    2025-08-15 20:41
写在GPT-5风波之后:为什么AI的智商和情商不可兼得?

写在GPT-5风波之后:为什么AI的智商和情商不可兼得?

写在GPT-5风波之后:为什么AI的智商和情商不可兼得?

GPT-5和“还我GPT-4o”的风波,闹得沸沸扬扬。 今天,奥特曼还有一次认怂了,不仅调了UI,还把o3这些老模型还了回来。

来自主题: AI资讯
5435 点击    2025-08-15 10:46
6秒造一个「视频博主」,Pika让一切图片开口说话

6秒造一个「视频博主」,Pika让一切图片开口说话

6秒造一个「视频博主」,Pika让一切图片开口说话

制作一个视频需要几步?可以简单概括为:拍摄 + 配音 + 剪辑。 还记得 veo3 发布时引起的轰动吗?「音画同步」功能的革命性直接把其他视频生成模型按在地上摩擦,拍摄 + 配音 + 粗剪一键搞定。

来自主题: AI资讯
5852 点击    2025-08-13 16:59
o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

o3 Gemini 都翻车?首个可验证长链 GUI 数据集 VeriGUI 重磅开源,探索通用 Agent 能力边界

GUI 智能体正以前所未有的速度崛起,有望彻底改变人机交互的方式。然而,这一领域的进展正面临瓶颈:现有数据集大多聚焦于 10 步以内的短程交互,且仅验证最终结果,无法有效评估和训练智能体在真实世界中的长时程规划与执行能力。

来自主题: AI资讯
6084 点击    2025-08-13 16:17
因为GPT-5,这群人决定在Reddit上起义。

因为GPT-5,这群人决定在Reddit上起义。

因为GPT-5,这群人决定在Reddit上起义。

这个周末,对OpenAI的抗诉,好像从未如此热闹过。 起因自然还是因为GPT-5。 OpenAI上了GPT-5当天,做了一个非常神奇的操作,他们只保留了GPT-5,然后把GPT-4.5、GPT-4o、o3什么的,全都砍掉了。

来自主题: AI资讯
6984 点击    2025-08-11 11:51
又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

又是王冠:27M小模型超越o3-mini!拒绝马斯克的00后果然不同

27M小模型超越o3-mini-high和DeepSeek-R1!推理还不靠思维链。 开发者是那位拒绝了马斯克、还要挑战Transformer的00后清华校友,Sapient Intelligence的创始人王冠。

来自主题: AI技术研报
5765 点击    2025-08-10 15:00
OpenAI o3封王,4比0横扫马斯克Grok 4!全球大模型对抗赛完美收官

OpenAI o3封王,4比0横扫马斯克Grok 4!全球大模型对抗赛完美收官

OpenAI o3封王,4比0横扫马斯克Grok 4!全球大模型对抗赛完美收官

决赛前,它是沉默、精准、不可一世的冠军候选;决赛后,它成了连续送子、失误连连的背景板。Grok 4经历了从神坛到谷底的戏剧性一天,它的轰然倒塌,也成就了o3的不败王者神话。

来自主题: AI资讯
6618 点击    2025-08-09 12:12
4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉

4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉

4比0横扫Grok 4,o3强势夺冠,首届大模型对抗赛结果出炉

备受 AI 圈关注的首届谷歌 Kaggle AI Chess 大赛(也即大模型国际象棋对抗赛)迎来了最终赢家。就在昨天,Grok 4 携手 OpenAI o3 进入了决赛。在机器之心的投票中,大家更倾向于 o3 战胜 Grok 4。

来自主题: AI资讯
7667 点击    2025-08-09 10:05
您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

您猜怎么着?Grok 4进决赛,大模型对抗赛Gemini全军覆没,马斯克「装」起来了

明天,Grok 对阵 OpenAI 的 o3。 谁也没想到,谷歌攒的 Kaggle AI Chess 比赛(即大模型国际象棋对抗赛),在半决赛中,Grok 4 击败 Gemini 2.5 Pro,进入总决赛!

来自主题: AI资讯
7115 点击    2025-08-07 18:30
刚刚,马斯克Grok4干翻谷歌Gemini!o3杀入首届大模型对抗赛决战

刚刚,马斯克Grok4干翻谷歌Gemini!o3杀入首届大模型对抗赛决战

刚刚,马斯克Grok4干翻谷歌Gemini!o3杀入首届大模型对抗赛决战

第二轮首届大模型对抗赛结果出炉了!o3轻而易举击败o4-mini,拿下100%胜率。Grok 4和Gemini 2.5 Pro激烈对决,最终在加赛中Grok 4成功晋级。明日,Grok 4和o3将迎来终局之战。

来自主题: AI资讯
6422 点击    2025-08-07 12:31