谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法
谷歌AI攻克6道世界级难题,比IMO金牌更震撼!陶哲轩指明新玩法Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,独立攻克了6道世界级数学难题,实现了从竞赛水平到PhD科研级的质变。人类数学研究的「手工时代」或许正步入倒计时。
Google DeepMind最新AI智能体Aletheia在FirstProof挑战赛中,独立攻克了6道世界级数学难题,实现了从竞赛水平到PhD科研级的质变。人类数学研究的「手工时代」或许正步入倒计时。
传统AI模型在稀疏奖励环境中,往往会找不到激励难以学会层次化思考。如今,谷歌团队通过引入元控制器操控模型内部残差流,让智能体学会了「跳跃式思考」。该研究揭示了大模型内部可自发形成了类似人脑的层次化决策机制,为AI在需要多步的复杂任务提供了全新的训练范式。
一周一更,谷歌又在深夜扔出「深水炸弹」。就在刚刚,最强生图模型Nano Banana 2横空出世,背靠全新Gemini 3.1 Flash Image。 它不仅生成速度飞快,多语言文字处理更强,还能实时联网,一次直出4K大片。
谷歌突击封杀使用开源智能体 OpenClaw 的开发者账号。这表面是打击违规算力调用,实为谷歌对 OpenAI 阵营的生态围剿。巨头筑起高墙,AI 跨平台开源红利终结,企业面临严峻的断供风险。
谷歌旗下的 Isomorphic Labs 发布新一代 AI 药物设计引擎 IsoDDE,性能全面碾压 AlphaFold 3,能在几秒内发现科学家花 15 年才找到的隐藏结合位点。但与开源的 AlphaFold 不同,IsoDDE 选择完全闭源,代码、论文、方法均不公开。AI 造福科学的开源黄金时代,可能正走向终结。
当地时间 2 月 19 日,Google 曝光 Gemini 3.1 Pro 最新模型。在 ARC-AGI-2 这个公认的推理基准测试中,Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念?它的前辈 Gemini 3 Pro 只有 31.1%,就连专门用来「深度思考」的 Gemini 3 Deep Think 也只有 45.1%。
今天凌晨,Google 发布 Gemini 3.1 Pro。核心提升在推理能力,ARC-AGI-2(抽象推理基准)从 3 Pro 的 31.1% 跳到 77.1%,翻了一倍多,GPQA Diamond(科学知识推理)从 91.9% 提到 94.3%
刚刚,谷歌的一位狠人公开了自己AI产品开发心得!
今天,谷歌DeepMind「AI数学家」Aletheia彻底杀疯了,攻克数学猜想,独立写论文。更令人震惊的是,拿下金牌的Gemini一举横扫18大核心科研难题。
谷歌Chrome拥抱Gemini 3,用38亿用户的绝对底牌向OpenAI宣战:浏览器不仅是入口,更是终结一切App的超级智能体!