走出「创新者困境」
Google 几乎每次发布 AI 产品都会出点状况。
2023 年 2 月,Bard 在演示时犯了事实错误,尽管每家大模型都有幻觉,但 Google 的运气不好,先被全世界看见了,市值缩水 1000 亿美元。
2023 年 12 月,Gemini 在演示里如同现实贾维斯,和用户实时交谈、分析画面内容,然而视频经过后期处理,效果被部分夸大,但黑红也是红。
今年 2 月,Gemini 1.5 官宣几个小时后,被文生视频的 Sora 抢去风头。
同月,Gemini 生成的历史人物「过度多样化」,被扣上歧视白人的帽子,母公司 Alphabet 股价一度下跌 4.5%。
Google,硅谷的代言人,AI 界的巨擘,为什么总发生一些状况外的事情?
「我们在图像生成方面确实搞砸了。」
近日,半退休的 Google 联合创始人谢尔盖·布林,参加了旧金山黑客马拉松活动,承认了 Gemini 的问题,给出了一个中规中矩的理由:测试不彻底。
不过,科技媒体 Pirate Wires 采访了多位 Google 员工,解释了另外一种可能——Gemini 的「过度多元化」,可能是故意的。
当用户输入图片的提示词后,Gemini 会在较小的语言模型重写提示词,加上更加「政治正确」的前缀。
举个例子,平平无奇的「汽车修理工」,可能会变成「穿着工作服微笑的亚洲汽车修理工」「拿着扳手的非洲裔美国女性汽车修理工」「戴着安全帽的美洲原住民汽车修理工」。
看似是个「矫枉过正」的小问题,但恨铁不成钢的员工们认为,根源在于 Google 这个「庞然大物」的管理混乱。
截至 2023 年底,Google 母公司 Alphabet 拥有约 18.2 万名员工。这个很吓人的数字,是多年来无序扩张、过度招聘的结果。2014 年,谷歌员工数仅在 5 万左右。
对于科技行业来说,人海战术未必是正向的。
以皮查伊为代表的温吞的、规避风险的管理层下,各个团队如同孤岛,不能愉快地合作,连接员工的唯一渠道,是一个强大的人力资源官僚体系,这个体系可能还在政治立场「偏左」,然后辐射到整个公司。
DeepMind 首席执行官 Demis Hassabis.
最典型的例子就是,Google 收购了 DeepMind 之后,DeepMind 和 Google Brain 组织文化不同,长期明争暗斗,去年 4 月为了对抗 OpenAI,才匆忙合并为 Google DeepMind。
疫情短暂的红利期后,Google 意识到了人太多的坏处,2023 年 1 月宣布裁员 1.2 万人,占其全球员工总数的 6%。如此规模的裁员,过去 20 年从未有过。
裁员摧毁了员工们的信任, 皮之不存,毛将焉附,当生存成为第一要义,创新和自我价值就难以实现。每个员工都在想办法加入最不可能裁员的团队,先把饭碗保住。
Google 员工反抗裁员.
十多年之前,Google 并不是这样的。
当时的 Google 是工程师的天堂,崇尚的是自下而上的「草根文化」和本职工作之外的「20% 时间」,员工们发现一个问题,就找志同道合的同事撸起袖子加油干。
如今,欣欣向荣的极客氛围一去不复返,公司规模必然要扩张,也必然要华尔街和投资人打好关系,壮志未酬的人才也做出了自己的选择。
为 ChatGPT 做嫁衣的 Transformer 论文出自 Google,然而截至去年 7 月,8 位作者都已离开 Google,有的自立门户,有的加入 OpenAI 奔赴 AGI 的星辰大海。
谈到离开的原因,他们不约而同地表达出 Goolge 官僚主义的不满——不允许冒险,不允许快速推出新产品。
2021 年时 Google 也有一波离职潮,一批 Lamda(Bard 前身)研发人员集体辞职,原因是他们不被允许在语音助手 Google Assistant 中引入聊天机器人。
被 ChatGPT 抢占先机之后,Google 恍若睡醒,加快了发布的节奏,午夜梦回也想着对标 GPT-4,然后超越 GPT-4,但又产生了一个问题:推出的 AI 产品太混乱了。
Bard 改名为 Gemini,对标 GPT-4 的 Gemini Advanced 聊天机器人基于 Gemini Ultra 模型,Gemini Business 是为 Google Workspace 推出的 AI 服务,Goose 是供员工访问的内部大模型,另外还有开源模型 Gemma 和基础世界模型 Genie......
别说一脸懵逼的用户不知道哪个产品适合自己,连 Google 员工们也记不全这些 G 开头的名字代表什么,匿名做了一堆梗图嘲笑管理层:给 AI 产品命名难道是副总裁们的 OKR 吗?
大大小小的问题,都和管理离不开关系。
Gemini 丑闻之后,皮查伊在给员工的备忘录承认,Gemini 生成的图片「完全不可接受」,接下来公司将采取一系列行动。
很有意思的是,「结构变革」被排在首位,之后才是「更新产品指南」「改进发布流程」「强化评估」等涉及产品的部分。
承认错误只是改变的开始,越来越多人将矛头对准了掌舵的皮查伊,让他下台的声音在 Google 内外都不是秘密。
在媒体的报道里,他的形象出奇一致:低调、温和、谦逊,但少了点杀伐果断,也不够铁血强势。
批评者们毫不留情,称皮查伊是「Google 的史蒂夫·鲍尔默」。鲍尔默是微软前 CEO,在任职期间错过了智能手机等技术革命。
然而在几年前,皮查伊还被认为是一位优秀的「和平时期」CEO。
皮查伊 2004 年加入 Google 担任产品经理,负责 Google 的工具栏,而后推动 Chrome 浏览器的开发,2013 年接管 Android 部门,又陆续负责了 Google+、地图、搜索、商业和广告等业务,被誉为仅次于创始人的「二号人物」。
2015 年,皮查伊担任 Google CEO,负责搜索、YouTube 和 Android 业务,2019 年升任 Alphabet CEO。
在维护搜索等核心业务、让投资者和监管部门满意方面,皮查伊确实做了 CEO 该做的。
2015 年以来,Google 母公司 Alphabet 市值从 4000 亿美元涨到 1.7 万亿美元,每年净利润高达 800 亿美元。
然而,主营业务一枝独秀,不一定意味着好事,也可能是致命的「阿喀琉斯之踵」。
时至今日,Google 母公司 Alphabet 80% 的收入仍然来自广告,其中大部分又是世纪之交就有的搜索页面文字广告。因此,也有人将 Google 戏称为「一家广告公司」。
云业务虽然同样是皮查伊的重点,但 2023 年一季度,Google 云业务才在披露以来首季度盈利,市场份额也不如亚马逊的 AWS 和微软的 Azure,是个万年老三。
过去 10 年,Google 也没有推出什么令人印象深刻的消费产品,社交领域(Talk、Hangouts、Allo等)没支棱起来,游戏领域也只是短暂涉足。谢尔盖·布林在 Google I/O 大会戴着单腿眼镜框的 AR 眼镜惊艳亮相,已经是 2012 年的事情了。
AI 本该是 Google 的骄傲,皮查伊曾经说过:「自 2016 年以来,我们一直是 AI-first 公司,AI 是实现我们使命的最重要方式。」
Google 搞研究的实力没人质疑,ChatGPT 的 Transformer 架构出自 Google,Sora 的时空 Patch 技术也站在 Google 的肩膀上。
但在发表论文、雪藏模型、预测蛋白质、打败围棋世界冠军之外,对于 Google 自己,AI 反应在消费产品上的更多是渐进式创新。
搜索、翻译、YouTube、Gmail、计算摄影,Google 几乎每项业务都有 AI 的存在,渗透进了用户的日常生活。
然而,科技媒体 Business Insider「Google 变得无聊了」的评价,也同样恰如其分。
无聊不代表过时和实力不济,而是不再先锋,Google 所做的事情,别的科技公司也都在做,甚至被抢了先机。
当 ChatGPT 横空出世,Google 抱住一棵摇钱树更是不够的了。Google 给人的印象,不能再是一家 AI 技术似乎很厉害的搜索垄断公司。
当年,Google 的两位创始人,拉里·佩奇和谢尔盖·布林,用更准确和相关的搜索算法重塑了互联网入口。
买下 Google 域名之后穷得叮当响的两人,因为 1998 年投资人一张 10 万美元的支票,慢慢走上了人生巅峰。
不知道他们有没有从微软拿到 100 亿美元、因为 GPT-3.5「低调的研究预览」闻名世界的 OpenAI,看到当年青涩的自己。
谢尔盖·布林曾为员工亲自提供午餐.
比 OpenAI 大 17 岁的 Google,已然脱离了青春期,有了新的功课:走出「创新者困境」。
Google 应当如初出茅庐的创业公司那样更快地拿出成果,演示视频是虚的,用不上的产品就失去了被世界看见的资格。
同时,Google 又要承担巨大的体量之下犯错的后果,一个错误就可能是一次股价和声誉的暴跌。
更重要的是,Google 跟进新的技术,也意味着颠覆自己持续了 20 多年的商业模式,甚至影响到公司所有业务的布局。
用户们不会关心用的是谁家的什么模型,只是想要更快地找到想要的答案。
想象一下未来,当我们直接从聊天机器人中获取信息或者跳转链接时,传统意义上的 Google 搜索更像一个网址导航,对于广告商的价值就降低了。
Perplexity AI团队.
OpenAI 不是 Google 唯一的竞争对手。有人开玩笑说,让对话式搜索引擎 Perplexity AI 首席执行官 Aravind Srinivas 担任新的 Google CEO。
这位 CEO 还真的做出了回复,可以简单概括为:Google 很好,但专注自家,勿扰。
对于未来的搜索生态,Aravind Srinivas 有个很有意思的看法:
你不需要摧毁 Google,你需要摧毁的只是他们的垄断。
维持王者的姿态很难,但被从外打破可能比想象得要容易。比起从零开始的初创公司,Google 的过往,某种程度上也是枷锁。
Google 的主要收入仍然是搜索广告,虽然也通过 Google One 提供 AI 产品的订阅模式,但这部分的收入还微乎其微,又要和 OpenAI、Perplexity 等公司竞争市场份额。
Google 应当比谁都明白,如果让 AI 吃掉搜索的蛋糕,失去核心的摇钱树,会导致什么结果。咨询公司 Gartner 预测,因为 Perplexity 等搜索的 AI 替代品,到 2026 年,传统搜索量可能会下降 25%。
不过,Google 到底还是世界上最懂 AI 的公司之一。
Google 也在带来比搜索更多的东西,原生多模态的 Gemini 1.5、开源模型 Gemma、基础世界模型 Genie......
生成式 AI 的未来,就如同孩子天马行空的想象,谁也不知道我们究竟走到哪里。去年 12 月如同现实贾维斯的 Gemini 虽然被后期夸大,但仍然让人神往。
访问和使用互联网的方式,时隔 20 多年,久违地被再次颠覆,从 OpenAI 们身上,我们又看到了 Google 两位联合创始人当年拿下支票时意气风发的样子。
AI 让大公司们一夜之间变得年轻,这句话的意思其实是,重燃对创新的热情,从坐惯了的评委席下场,以挑战者的姿态出现在擂台。 4 9 岁的微软已经强势回归,25 岁的 Google 也仍然有机会 再赢一次。
文章来自于自微信公众号“爱范儿”(ID:ifanr),作者 “张成晨”
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0