谷歌AI十年棋局:从猫识别到太空数据中心,Gemini如何统一生态
谷歌AI十年棋局:从猫识别到太空数据中心,Gemini如何统一生态对于谷歌(Google)而言,刚刚过去的一周可以看作其人工智能战略转型的关键节点。随着 Gemini 3 的正式发布,以及名为 Nano Banana Pro 的新模型在社交媒体与开发者社区中迅速走红,这家科技公司正在重新找回自己在 AI 领域的节奏与底气。
对于谷歌(Google)而言,刚刚过去的一周可以看作其人工智能战略转型的关键节点。随着 Gemini 3 的正式发布,以及名为 Nano Banana Pro 的新模型在社交媒体与开发者社区中迅速走红,这家科技公司正在重新找回自己在 AI 领域的节奏与底气。
在大语言模型(LLM)的研究浪潮中,绝大多数工作都聚焦于优化模型的输出分布 —— 扩大模型规模、强化分布学习、优化奖励信号…… 然而,如何将这些输出分布真正转化为高质量的生成结果 —— 即解码(decoding)阶段,却没有得到足够的重视。
今天,谷歌生成式AI团队发布了Nano-Banana的首个官方教程——《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。核心信息是如何用 Nano-Banana Pro 制作专业级的素材!
近日,一份来自 ChatGPT 安卓测试版的代码泄露显示,OpenAI 正在为 ChatGPT 筹备广告功能。这一消息来自软件工程师 Tibor Blaho。他在分析 ChatGPT 安卓应用时,发现了多处与「广告功能」相关的代码引用,包括「搜索广告」「搜索广告轮播」以及「集市内容」等字符串。尽管这些代码并不意味着功能即将上线,但通常预示着内部正在进行广告形式和投放位置的测试。
首次将GUI Agent模型与完整配套基建同步开放,支持手搓党一键部署!这就是阶跃星辰刚刚开源的GELab-Zero。其中4B版本的GUI Agent模型在手机端、电脑端等多个GUI榜单上全面刷新同尺寸模型性能纪录,取得SOTA成绩。
最近,一位被誉为「比利时小爱因斯坦」的 15 岁少年 Laurent Simons 在安特卫普大学(University of Antwerp)成功通过了博士论文答辩,获得了量子物理学博士学位。
本文第一作者为刘禹宏,上海交通大学人工智能专业本科四年级学生,相关研究工作于上海人工智能实验室科研实习期间完成。通讯作者为王佳琦、臧宇航,在该研究工作完成期间,均担任上海人工智能实验室研究员。
不到1000天,AI已从会聊天,进化到能读文件、跑任务、写论文。它开始介入实际工作流程,人类与AI的分工,也在悄悄重写。
CB Insights 发布的《2025 Future Tech Hotshots:Scouting Reports》报告,结合生成式 AI 分析与专有 Mosaic 评分体系,从全球海量初创企业中遴选出 45 家最具潜力的科技公司。
Veza 的订阅软件帮助企业了解其员工以及自动化软件任务的 AI Agent对特定客户或公司数据的访问权限,以及他们能对这些数据做什么。ServiceNow 一直在加强其 AI Agent相关的产品,这些产品旨在自动化客户服务和响应IT 帮助台请求等任务。