3月6日,Alphabet旗下搜索引擎Google宣布更新其搜索排名系统,以便更好地推荐高质量内容,减少那些低质量网页的曝光。对此公司发言人Jennifer Kutz表示,排名变化将“直接解决人工智能生成的低质量内容问题,这些内容旨在吸引点击,但这并没有增加太多原始价值”。
事实上,定期更新搜索排名系统是Google的常规操作,但此次事件的有趣之处在于,Alphabet一方面投资大模型,并且将大模型生成的结果作为答案直接提供给用户(SGE服务);另一方面又降低AI生成内容的排序。
这充满着矛盾与张力的一幕反映出Alphabet当下面对的困境——这家公司曾经通过搜索引擎改变了人们获取信息的方式,并在此基础上建立了庞大的商业帝国,但当面对可能再次改变人们获取信息方式的生成式AI时,当初栽种它而刨出来的坑,或许最终会成为Alphabet埋葬自己的坟墓(这轮生成式AI的奠基技术之一就是Google发表的Transformer模型)。
搜索广告可能是人类有史以来最赚钱的生意之一,它同时催生出Alphabet与百度这两个互联网时代的庞然大物。虽然在建立初始系统时,数据中心搭建和算法开发的支出不少,但后续处理每个额外搜索请求的成本微乎其微,并且随着搜索量的增加,搜索的成本会进一步降低。通过向企业收取广告费用,用户的每一次点击,技术公司都能从中获取不少利润。
Statcounter Global Stats的数据显示,截至2023年,全球搜索引擎市场的规模已经超过1000亿美元。虽然Alphabet的搜索引擎免费,但通过付费广告,其搜索引擎业务(Google 搜索)能给其他业务源源不断“输血”,其中就包括负责生成式AI研发的Gemini团队。据今年1月发布的Alphabet财报,搜索引擎业务为公司带来了1750.3亿美元的收入,占到总营收5成以上——它并没有像当初改名时期望的那样成为一家多元化公司,搜索引擎依然是其最核心的业务。
这门一本万利的生意曾让Alphabet成为整个硅谷最cool的公司,包括舒适的工作环境、免费且美味的食堂,以及童话般的“20%时间”规定,即员工可以抽出每天工作时间的20%来完成自己感兴趣的项目。即使近些年TikTok等应用的崛起夺走了用户不少注意力,但当人们准备正儿八经做点什么事情时,搜素引擎依然是不二之选。只要用户还需要获取信息,Alphabet就可以继续躺在印钞机上。
但ChatGPT代表的生成式AI提供了获取知识的另一种选项——让AI来回答你的一切问题,人们不再需要浏览多个网页汇总信息,并从中辨别最相关的内容,筛选的步骤AI已经替用户完成了。
AI搜索的赛道上随即出现新玩家。最近颇受风投关注的明星产品Perplexity即将敲定一笔新的融资交易,届时公司估值或将达到近10亿美元。通过将检索技术和大语言模型结合,Perplexity具有对话界面、上下文感知能力和个性化学习功能,可以在用户提出问题后在全网搜索信息、输出答案。
这的确更符合人类的行为心理:在获取信息时,追求直接、高效、强互动性。正因如此,生成式AI辅助搜索也成为众多技术公司竞逐的“高地”——据《华尔街日报》报道,微软预计,整合AI后,搜索市场的份额每增加一个百分点,就能带来额外20亿美元的搜索广告收入。
Alphabet也在尝试将生成式AI应用到搜索上。毕竟,搜索引擎对广告主的吸引力正在下降——过去的两年里,Google搜索引擎业务增速滑落至10%以下。2023年8月,Alphabet宣布推出生成式AI搜索平台SGE(Search Generative Experience),不过相比早在同年3月就将GPT-4部署在搜索引擎Bing上的微软,Alphabet慢了近半年。
这种迟疑情有可原,毕竟生成式AI到底能否颠覆搜索引擎还未可知,而一旦推出生成式AI服务,无疑会冲击传统搜索广告的收入。在2023年第四季度的财报电话会议上,有投资者询问Alphabet如何应对生成式AI对搜索引擎的替代,公司管理层打起了太极,“Alphabet将整合二者,提供搜索生成服务”。
但如何将生成式AI与搜索引擎融合,公司的高层可能也没有想得很明白。据SGE项目负责人、Google搜索部门副总裁兼总经理Elizabeth Reid介绍,“整合生成式AI只是Google为提高搜索质量的广泛尝试中的一部分。生成式AI是一项可以回答更多问题的技术,但我们将继续思考基本原则,即如何展现最高质量的信息。”
可见在搜索业务上,Alphabet有一个宏大的愿景,即构建一个高质量的内容生态系统。在这个构想里,内容创作者会提供高质量、原创的内容,然后这些内容将通过AI技术处理、优化和呈现,提高用户的搜索体验。在这个过程里,Alphabet的AI扮演的是一个过滤和增强工具的角色。
但矛盾的是,当内容创作者也开始使用AI输出内容,这些快速产生的信息反而冲击了Alphabet试图构建的这个内容生态系统。这些信息在表面上满足了搜索引擎算法对高质量、相关性的要求,但实际上可能缺乏深度、个性化或真正的价值。因此,Alphabet只能不断调整和优化算法,以区分并优先呈现真正高质量、原创的内容,同时避免它们被大量AI生成内容淹没。
为了赶上这一轮生成式AI浪潮,Alphabet的运营成本将不断增加——为处理大量的数据分析和模型推理任务,Alphabet只能不断加大对服务器的资本投入。但是,生成式AI注定不会像Google搜索那样赚钱。除去GPU的采购价格不谈,每一次输入与输出的成本,就比简单地处理搜索请求昂贵得多。
有数据显示,传统信息搜索的成本是0.3美分,收入则是4.5美分;基于大语言模型的搜索,成本介于3至30美分,收入却是2.5至3.5美分。因此,尽管大语言模型提供了更先进的查询处理能力,但从商业角度看,将其应用于搜索业务,可能只会拖营收的后腿。
就这样,Alphabet来到了1975年柯达面对的世界——当时柯达发明了数码相机,却几乎无法将其变成一个盈利的产品,柯达在创新技术上的犹豫和市场转化上的迟缓,最终导致它在数码摄影浪潮中失去先机。如何将AI技术融入并增强核心业务,并保持成本效益,是Alphabet目前面临的挑战。
不过, Alphabet联合创始人Sergey Brin看起来颇为乐观,他在最近一次活动中表示,Alphabet在25年间为全球用户提供免费的世界级信息搜索服务,并通过广告支持这一模式,对世界有巨大的好处。他预测,随着时间的推移,这种商业模式会发展,但可能仍会以广告为主,因为AI的进步可能使广告变得更加有效。
“我个人感觉,只要产生了巨大的价值,我们就会找出商业模式。”Brin说。
参考链接:
https://www.theverge.com/2024/3/5/24091099/google-search-high-quality-results-spam-ai-content
文章来自于微信公众号:新皮层NewNewThing(ID:gh_38b8653e0e0b),作者 “张司钰、王杰夫”
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/