Gemini 2.5连续屠榜,谷歌突然换帅!19年老将立即卸任
Gemini 2.5连续屠榜,谷歌突然换帅!19年老将立即卸任谷歌AI团队再掀风暴,Gemini负责人Sissie Hsiao立即卸任,由Google Labs负责人Josh Woodward全面接管。这次领导层变动透露出谷歌正重新思考AI战略布局,以对抗风头正劲的OpenAI。AI竞赛进入新阶段,谷歌急需找到突破口,Gemini能否翻盘值得关注。
谷歌AI团队再掀风暴,Gemini负责人Sissie Hsiao立即卸任,由Google Labs负责人Josh Woodward全面接管。这次领导层变动透露出谷歌正重新思考AI战略布局,以对抗风头正劲的OpenAI。AI竞赛进入新阶段,谷歌急需找到突破口,Gemini能否翻盘值得关注。
当大多数AI Agent仍在挣扎于结构化推理能力不足的困境时,本文带来了一个来自认知科学领域的突破性解决方案。
无人在意的角落,又一款中国AI产品在海外默默“杀疯了”。
随着DeepSeek R1、OpenAI GTP-4o、Antropic Claude3.7、xAI Grok3纷至沓来,AI大模型已然变成巨头的游戏,“百模大战”也成为了过去式。到了2025年,让用户先把AI用起来,也已经成为了一众厂商的共识。
刚刚,又一个中国血统智能体,让歪果仁大呼“疯狂”。
Cursor 最强劲敌 Augment Code 昨天晚上发布了他们的最新产品 Augment Agent。
饿了么于近日宣布启动“优店腾跃计划”:平台将在2025年面向商家投入超10亿元,其中也包含加码AI技术应用支持,为商家提供更多AI经营工具,助力商家经营更提效、更简单。
Genspark 是啥?我们在去年 6 月就有过介绍,Genspark 是由前百度小度的 CEO 景鲲和 CTO 朱凯华创业做的 Agent 产品,去年刚开始的定位还是 Agent Search Engine,到了今天升级了不少。并且在今年三月,官宣拿到了一亿美金的 A 轮融资。
PaperBench 是一个由 OpenAI 开发的基准测试,旨在评估 AI Agent 复现尖端 AI 研究的能 力。它专注于测试 AI 是否能理解研究论文、独立开发代码并执行实验以复现研究结果。
刚刚开源的新基准测试PaperBench,6款前沿大模型驱动智能体PK复现AI顶会论文,新版Claude-3.5-Sonnet显著超越o1/r1排名第一。与去年10月OpenAI考验Agent机器学习代码工程能力MLE-Bnch相比,PaperBench更考验综合能力,不再是只执行单一任务。