2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔
6626点击    2025-12-24 15:28

如何回顾2025年的AI进展?


今年王者归来的谷歌,刚刚由Jeff Dean哈萨比斯牵头,完成了年度总结和趋势展望报告——


这是AI Agent、推理和科学发现的一年。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


报告最后梳理出了八大研究方向,系统性地回答了一个更重要的问题:


当大模型进入推理时代,AI 正在变成什么?


从Gemini的推理能力、多模态理解,到Agent、机器人、科学研究和物理世界建模,谷歌正在描绘一个可以协作、可以行动、甚至开始参与科学发现的智能系统。


模型的推理、多模态理解、生成能力及效率得到显著提升。


AI已广泛融入谷歌的主要产品中。


2025年创造性AI工具全面提升。


AI在科学和数学领域实现多项成果,尤其是数学和编程竞赛表现优异。


谷歌始终强调安全、责任与合作开放生态。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


以下是量子位的原文总结,在不改变原意的基础上,进行了适当修改润色:


谷歌年度回顾全文


回顾2025年,这是研究领域取得非凡进展的一年


在人工智能方面,可以清晰地看到其发展轨迹正从一种工具转变为一种实用手段:从人们使用的东西变成了可以投入工作使用的东西。


如果说2024年是为这个时代奠定多模态基础的一年,那么2025年就是人工智能开始真正与人类一同思考、行动和探索世界的一年。


在量子计算领域,谷歌也在迈向实际应用方面取得了进展。


概括来讲,在各个领域,谷歌都正在助力将研究转化为现实,让功能更强大、更实用的产品和工具对人们的生活产生积极影响。


基础模型能力突破


首先今年,谷歌在推理、多模态理解、模型效率和生成能力方面均取得了突破性进展,显著提升了模型性能


这一系列进展始于3月份发布的Gemini 2.5,一直到在11月推出了Gemini 3,并于12月推出了Gemini 3 Flash。


基于最先进的推理技术,Gemini 3 Pro是谷歌迄今为止最强大的模型,旨在帮助用户将想法变为现实。


它在LMArena排行榜上位于榜首,并凭借在人类终极考试以及GPQA Diamond等基准测试中的突破性分数,重新定义了多模态推理。


它还为数学领域的前沿模型树立了新标准,在MathArena Apex上创下了23.4%的最新纪录。


随后,谷歌推出了Gemini 3 Flash,它融合了Gemini 3的专业级推理能力与Flash级别的延迟、效率和成本优势,使其成为同尺寸下性能最佳的模型。


Gemini 3 Flash的质量超越了谷歌之前的Gemini 2.5 Pro规模模型的能力,价格却只有它的一小部分,且延迟显著降低,延续了Gemini时代的趋势——


下一代的Flash模型优于上一代的Pro模型。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


另外,谷歌今年也致力于通过最先进的开源模型,让实用的AI技术变得更易于获取。


谷歌的Gemma系列模型不仅具有轻量级特性,而且开源。在今年,还成功引入了多模态能力,大幅度增加了上下文窗口,拓展了多语言功能,并提升了效率和性能。


AI产品的深度集成与创新


2025年,谷歌继续推动AI从工具转向实用工具,凭借全新、强大的Agent能力改造现有的产品组合。


谷歌重新构想了软件开发,不再局限于辅助编码工具,而是引入能与开发者协作的强大Agent系统,比如Gemini 3高超的编码能力以及Google Antigravity的推出,都标志着AI辅助软件开发迈入了一个新时代。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


这一演变同样也在谷歌的核心产品中清晰可见,从Pixel 10上的AI功能、搜索中AI模式的更新,到类似Gemini应用和NotebookLM这类的AI创新产品,而这些产品均增加了深度研究等高级功能。


AI赋能创造力


2025年也是生成式媒体变革的一年,AI为创意提供了全新且前所未有的能力。


用于视频、图像、音频和虚拟世界的生成式媒体模型及工具变得更加高效,应用也更为广泛,其中突破性的Nano BananaNano Banana Pro在原生图像生成与编辑方面展现出了前所未有的能力。


谷歌还与创意行业人士合作,开发了Flow和Music AI Sandbox等工具,让它们能更好地辅助创意工作流程。


同时,谷歌通过谷歌艺术与文化实验室推出全新的AI驱动体验、对Gemini应用中的图像编辑功能进行了重大升级,以及引入Veo 3.1、Imagen 4和Flow等强大的新型生成式媒体模型,为人们拓展了创意可能性。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


今年谷歌实验室也进行了一些极具吸引力的实验,包括:


  • Pomelli:AI用于品牌营销内容;
  • Stitch:能在几分钟内将提示词和图像输入转化为复杂用户界面设计和前端代码;
  • Jules:异步编码Agent,可作为开发者的协作伙伴;
  • Google Beam:3D视频通信平台,利用AI拓展了远程在场的可能性。


推动科学与数学发展


2025年也是AI科学进步的标志性一年,生命科学、健康、自然科学和数学领域均在AI帮助下取得了诸多进展。


这一年里,谷歌在构建AI资源和工具方面取得了进展,这些资源和工具为研究人员赋能,帮助他们在医疗健康领域理解、识别和开发新的治疗手段。


在基因组学领域,谷歌已将先进技术应用于研究长达十余年,如今谷歌超越了测序阶段,正在利用AI来解读最复杂的数据。


谷歌在今年也纪念了AlphaFold问世的第五周年,这一荣获诺贝尔奖的AI系统解决了困扰学界50年的蛋白质折叠问题。目前它已被190多个国家的300多万名研究人员使用。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


而Gemini的高级思考能力,包括Deep Think,也在数学和编程领域取得了历史性进展。


Deep Think已经能够理解需要深度抽象推理的问题,并在两项国际竞赛中达到了金牌水平


推进计算和物理世界研究


谷歌今年在量子计算、能源和突破性技术等领域也取得了重大发现,并吸引了前所未有的关注。


其中量子计算在现实世界应用方面的进展尤为显著,例如Quantum Echoes项目。


值得一提的是,谷歌员工Michel Devoret与前谷歌员工John Martinis以及UC伯克利的John Clarke共同获得了2025年诺贝尔物理学奖,以表彰他们在20世纪80年代的基础量子研究。


2025年,谷歌继续推进为AI提供动力的核心基础设施,重点关注硬件设计的突破和能源效率的提升,包括推出Ironwood,一款为推理时代打造的新型TPU,它是采用名为AlphaChip的方法设计的,同时谷歌还致力于衡量技术对环境的影响。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


谷歌在机器人技术和视觉理解方面的研究,也将AI Agent带入了物理世界和虚拟世界,比如基础性的Gemini Robotics模型、更先进的Gemini Robotics 1.5,以及Genie 3的推出,其中Genie 3成为了通用世界模型的新前沿。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


应对全球性挑战与机遇


谷歌今年的工作直观展示了AI驱动的科学进步,如何直接应用于解决世界上最关键和普遍存在的挑战。


通过利用最先进的基础模型和Agent推理,谷歌极大地加深了对地球及其系统的理解,同时在气候韧性、公共卫生和教育等领域提供了影响力解决方案。


例如,谷歌正利用最先进的基础模型和代理推理来帮助加深对地球的理解,涵盖天气预报、城市规划、公共卫生等多个领域。例如,谷歌的洪水预报信息目前已覆盖全球150个国家超20亿人口。


而谷歌最先进、最高效的预报模型WeatherNext 2,生成预报的速度能快8倍,且分辨率可达1小时。借助这项技术,谷歌通过实验性的气旋预测,支持气象机构做出有效决策。


2025最大AI赢家的凡尔赛年度总结,哈萨比斯Jeff Dean联手执笔


谷歌也正在与合作伙伴携手,将AI驱动的科学进展更贴近患者,为疾病管理和疗法研发开辟新途径。


此外,AI正被证明是教育领域的一个强大工具,通过LearnLM和Gemini中的引导式学习,它能促成新的理解形式并激发学生更多好奇心。


谷歌今年将Gemini最强大的翻译能力引入谷歌翻译,使其能提供更智能、更自然且更准确的翻译,并试点了新的语音互译功能。


重视责任与安全


谷歌将研究突破与责任和安全相结合。


随着模型能力不断增强,谷歌正持续改进和发展旗下的工具、资源及安全框架,以预测并降低风险。


Gemini 3就切实展现了这种观念:它是谷歌迄今为止最安全的模型,并且经过了最全面的安全评估。


此外,谷歌还在展望更长远的未来,探索通往AGI的负责任之路,将准备工作、主动风险评估以及与更广泛的人工智能社区合作置于优先地位。


提供跨界合作与开放生态


谷歌认为,要负责任地推进人工智能的前沿领域,需要全社会各方面的协作


2025年,谷歌与顶尖的人工智能实验室合作,成立了Agentic AI基金会,并支持开放标准,以确保Agentic AI拥有一个负责任且具备互操作性的未来。


在教育领域,谷歌也与教育机构合作,帮助学生掌握AI技能。并与加州大学伯克利分校、耶鲁大学、芝加哥大学等众多高校研究合作,一起推动前沿研究。


此外,谷歌正与多个实验室合作,协同改变科学研究的开展方式。与电影制作人和其他创意开发者合作,为他们提供最优质的AI工具,探索人工智能时代的新的叙事方式。


2026年,谷歌希望能够继续安全且负责任地推进前沿技术,为人类谋福祉。


参考链接:

[1]https://blog.google/technology/ai/2025-research-breakthroughs/

[2]https://x.com/i/trending/2003527758127989012


文章来自于“量子位”,作者 “鹭羽”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0