AI资讯新闻榜单内容搜索-GE

谷歌首款混合推理Gemini 2.5登场，成本暴降600%！思考模式一开，直追o4-mini

谷歌发布首款混合推理模型Gemini 2.5 Flash，引入了革命性「思考预算」，可灵活控制推理深度，性能一举击败Claude 3.7，比肩o4-mini。而且，关闭思考模式成本直降600%。

来自主题: AI资讯

11212 点击 2025-04-18 10:48

悬疑小说的最后一页，隐藏着罪犯的真相。《逆转裁判》的法庭上，真凶在谎言中露出破绽。UCSD研究团队以这款经典游戏为舞台，o1、Gemini 2.5 Pro等模型化身「侦探」，测试AI的推理极限。

来自主题: AI资讯

10584 点击 2025-04-18 10:37

高德地图正式宣布，推出全球首个基于地图的AI导航智能体(NaviAgent)，应用创新技术理念和架构，推动导航这一历史悠久的服务，由传统出行工具，向“会思考、能预判、有温度”的智能出行伙伴蜕变。

来自主题: AI资讯

9896 点击 2025-04-17 22:12

今天，字节发布了一整套 AI 全家桶，深度思考模型、视觉推理、文生图、AI Agent……几乎涵盖了最近 AI 圈关注度最高的产品。字节发布的产品和亮点有哪些：1. 豆包 1.5 · 深度思考模型，2. 文生图 3.0

来自主题: AI资讯

11568 点击 2025-04-17 18:21

在今天凌晨1点的产品发布中，OpenAI还开源了一个终端轻量级代码Agent智能体——Codex CLI。

来自主题: AI资讯

8245 点击 2025-04-17 11:04

当手机中装满智能体，下一代AI手机的雏形正在显现。

来自主题: AI资讯

10017 点击 2025-04-16 15:20

将与 Jomy 共同完成一系列技术科普，让最一线的工程师、用通俗的语言、讲最前沿的技术。这是系列第一篇，主题是最近大火的 MCP 和 Agent。读完本文，你一定会感叹：终于搞懂了！原来！竟然！这么简单！

来自主题: AI技术研报

8482 点击 2025-04-16 15:03

近年来，大模型（Large Language Models, LLMs）在数学、编程等复杂任务上取得突破，OpenAI-o1、DeepSeek-R1 等推理大模型（Reasoning Large Language Models，RLLMs）表现尤为亮眼。但它们为何如此强大呢？

来自主题: AI技术研报

10112 点击 2025-04-16 15:00

就在刚刚，据外媒 The Verge 援引知情人士消息称，OpenAI 正在研发一个类似 X（前 Twitter）的社交网络。项目还处于早期阶段，但据称内部已完成原型开发 2️⃣ 项目重点是 ChatGPT 的图像生成功能和社交信息流 3️⃣ CEO Sam Altman 已私下向圈外人征求反馈

来自主题: AI资讯

9826 点击 2025-04-16 10:49

两个月后就号称要淘汰GPT-4.5的GPT-4.1，实力究竟如何？在众多实测中，它的表现的确可圈可点，但却依然打不过Gemini 2.5 Pro和Claude 3.7 Sonnet。那么问题来了，OpenAI为何要发布一个远远落后于谷歌的模型？

来自主题: AI资讯

10252 点击 2025-04-16 10:26