景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

8375点击 2024-06-23 11:03

AI搜索不是救世主，但是一种新选择。

这一轮生成式 AI 引发的浪潮可以说愈演愈烈，几乎每隔一段时间就会有新的 AI 公司和 AI 产品出现在我们的面前，也能看到很多已经功成名就的人选择投身 AI 创业热潮。

就在昨天，前小度 CEO 景鲲公布了离职百度后的新动态，宣布和前小度 CTO 朱凯华联合创立了 AI 创新产品公司 MainFunc，旗下首款 AI Agent 搜索产品 Genspark 已经 Beta 上线。

图/ Genspark

此外，MainFunc 还拿到了 6000 万美元（约合人民币 4.35 亿元）的种子轮融资，投后估值直接来到了 2.6 亿美元（约合人民币 18.87 亿元）。

此时距离他辞任百度集团副总裁和小度 CEO，刚刚过去 8 个月。耐人寻味地是，他在离开百度后选择的领域恰恰是百度的核心业务——搜索。

不留在百度的体系内做 AI 搜索，而是选择和前小度 CTO 一起自己做，这在一定程度上说明了百度面对 AI 搜索这个全新领域存在一些问题。但更重要的可能还是，景鲲的选择再次证明了很多人相信的一点：

AI 搜索，大有前途。

但这种「前途」会彻底改变我们获取信息的方式吗？又会打破现有的搜索市场格局吗？

Genspark，又一个有点不同的 AI 搜索

和所有 AI 搜索一样，Genspark 也采用了以对话为主要交互方式的设计，用户提出问题后，Genspark 会生成相关的简短回答，直接给你你可能需要的信息，而不是给你你可能需要点击、浏览、判断的「十个蓝色链接」。

此外，MainFunc 官方相信，Genspark 可以提供更高质量的搜索结果——也是回答。按照官方的说法，Genspark 使用多个专门的人工智能模型，每个模型都旨在处理特定类型的查询。

在底层，Genspark 依靠内部训练的模型以及来自 OpenAI、Anthropic 等的第三方模型来对用户的搜索查询进行分类，并确定如何组织和呈现结果。比如我们搜索「OpenAI 什么时候推出的 AI 搜索？」（实际没有推出）：

景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

图/ Genspark

Genspark 的每个搜索结果页面首先会呈现 AI 生成的结果摘要，后面是指向更详细的 Sparkpage 的链接，基本上可以理解为针对问题生成的一篇完整回答。最后还有一些推荐链接，这部分就相当于传统搜索引擎的结果页面。

而 Sparkpage，也是 Genspark 区别于其他任何 AI 搜索的独特性交互设计。除了生成一个类似维基百科的详细回答，用户还可以在 Sparkpage 右侧的对话窗口，继续与 AI 进行对话，不管是针对回答的疑惑进行展开，还是针对部分内容进行深入。

景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

图/ Genspark

针对大模型的「幻觉」问题，AI 搜索一般都采用 RAG（检索增强生成）技术降低「幻觉」的出现概率。景鲲则在 TechCrunch 的采访中另外表示，Genspark 的 AI 模型偏爱具有高权威性和流行度的网页，对过滤掉更多「外面」的信息有很大帮助。

「我们非常重视数据质量，我们相信数据质量是赢得这场比赛的关键，」景鲲强调。但现实是，在这场 AI 搜索的比赛中，重视数据质量的不仅是他们，参加比赛的对手也是层出不穷。

生成式 AI 掀起的搜索革命

曾几何时，以谷歌和百度为代表的搜索引擎可以说是整个互联网最重要的「入口」，基于搜索引擎，谷歌一直以来的使命就是：「整合全球信息，供大众使用，让人人受益。」

但在很长的时间内，搜索引擎的产品形态和商业模式并没有发生质的变化，甚至体验还有所退步。

在传统的搜索体验中，用户通常是脑中存在一个或模糊或清晰的问题和需求，然后需要将这种需求转化成一个或几个相关的关键词。

接着，搜索引擎根据关键词、索引库找出相关的网页链接，再通过算法排序的方式呈现相关程度最高的网页链接。同时，在搜索结果中还往往穿插着几个「伪装成搜索结果」的广告。

景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

图/百度

与之相对的，得益于大语言模型实现了强大的自然语言理解能力，用户可以用最自然的自然语言进行搜索，AI 搜索也能够更准确地理解用户的提问意图。

此外，虽然 AI 搜索同样需要匹配超大规模的索引库来找到相关的网页，但在呈现上彻底改变了过去信息的组织和设计，没有「信息排序」，直接给出答案，不需要用户点击排在前的最相关链接，再找出自己真正需要的信息。

简而言之，相比传统的搜索体验，AI 搜索是一种交互和效率上质的变化，也被很多人视为搜索的未来。所以即便 AI 搜索严重挑战了现有的搜索广告商业模式，谷歌也还是推出了 AI 搜索。

今年 5 月 15 日，谷歌在 Google I/O 开发者大会上宣布将在谷歌搜索上线基于 Gemini 大模型的 AI Overviews 功能，简单来说，就是根据用户问题在搜索结果页直接生成一个简短的回答，然后才是以网页链接为主的传统搜索结果。

景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

图/谷歌

用过 New Bing 的读者一定不陌生这种形式，事实上这也意外着谷歌搜索终于也迈出了通往「AI 搜索」的一步。

相比之下，作为全球第一大中文搜索引擎，百度同时还是国内最早推出自主训练大模型，虽然旗下也有主打 AI 搜索的「简单搜索」，但百度搜索却取消了 AI 搜索功能（文心一言推出早期有上线过）。

而与此同时，由前 OpenAI 研究科学家 Aravind Srinivas 联合几位合伙人共同创办的 Perplexity，已然成为了当下最具代表性和影响力的 AI 搜索。截至今年 1 月，Perplexity 的月活跃用户就超过了 1000 万，访问量超过 4500 万次，总搜索量超 5 亿次。

加上转型 AI 搜索的传统搜索公司，以及一大批新涌现的 AI 搜索初创公司，AI 搜索似乎已经到了「万马奔腾」，一举取代传统搜索的局面。

但 AI 搜索已经到了取代传统搜索的阶段吗？可能还为时尚早。

我放弃了把 AI 搜索作为默认搜索引擎

坦白讲，从去年开始小雷就尝试过将浏览器的默认搜索引擎换成「AI 搜索」，主要是用连英伟达 CEO 黄仁勋都在用的 Perplexity，今年还尝试过将之前中文搜索体验还不错的秘塔 AI 搜索设置成默认搜索引擎。

但现实是，我其实都用不了多久就会换回谷歌，理由并不复杂，核心是 Perplexity、秘塔 AI 搜索以及其他 AI 搜索都：

不可靠。

景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

比如刚刚问到的回答，图/ Genspark

作为科技编辑，小雷几乎每天都需要使用搜索引擎，也严重依赖通过搜索来获取信息，同时信息的准确性也非常重要。这一点应该很好理解。

但 AI 搜索本质上是能联网的 AI，同时基于 RAG 技术，大模型会结合用户提问和相关检索信息作为 Prompt 输出回答。虽然不少观点认为 RAG 技术是当下缓解大模型幻觉的最佳解决方案，但不仅远谈不上解决，实际缓解的效果也有限。

具体到 AI 搜索体验中，小雷看到有些回答会明显怀疑一些信息的真实性，这个时候又不得不需要通过谷歌等传统搜索引擎进行检索、查证，因为 AI 搜索的来源链接也充满了幻觉。

但我又不可能每个信息都重新进行搜索、查证，否则就与「使用 AI 搜索提高搜索效率的初衷」背道而驰了。

更大的问题是，如果一些信息错得并不离谱，我对一些特定领域也并不了解，很可能不会意识到错误，甚至会直接使用了错误的信息，从而产生错误的理解和观点。

简单来讲，作为能联网的大模型，目前的 AI 搜索很多时候是存在幻觉的黑箱，我很难信任 AI 回答里面的各种信息，所以宁愿退回传统的搜索体验，使用关键词找到相关的网页，再人工寻找和判断我需要的信息。

但这不意味着我会放弃使用 AI 搜索。

首先，大模型的流行注定会改变互联网的内容生态，我们很早就在文章中表达过对生成式 AI 内容充斥互联网的担忧，今年你甚至还可以看到字节跳动、掘金等公司通过 AI 生成了海量中文网页「污染」搜索引擎。

景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

豆包生成的就有 1560 万条，图/谷歌

而不同于传统搜索引擎的机制和交互方式，AI 搜索理论上相对更容易绕开这种「污染」，同时对话式的交互也能避免了大量无价值内容，提高效率。

其次是在「What」之外，我们经常需要向搜索引擎提出的问题还有「Why」和「How」，这方面对信息的准确性要求较低，更强调整合梳理能力，而这恰恰是大模型极其擅长的，这是小雷需要的。

同时从更长远的角度来看，大模型和生成式 AI 技术还处在快速发展的阶段，当下幻觉的问题并不意味着在不远的将来会有更好的解决方案。

写在最后

AI 搜索不是救世主。

AI 搜索的出现无疑给我们提供了一种全新的信息获取方式，也带来了不少新的思考和挑战。但在使用 AI 搜索过程中，我们能明显发现了其在准确性和可靠性上的不足带来的困扰。但这并不意味着 AI 搜索毫无价值。

相反，AI 搜索在整合信息、提升搜索效率以及避免无价值内容方面展示了巨大的潜力。随着技术的进步，生成式 AI 的能力将会更加完善，或许就能解决当前存在的问题。

所以比起一种取代传统搜索的「救世主」，我更愿意把 AI 搜索看作一种新的选择。我们在使用中需要不断探索和适应，找到最适合自己的使用方式。在这个过程中，传统搜索引擎和 AI 搜索并不是互相排斥的，而是可以相辅相成，共同改进我们的搜索体验。

或许在不久的将来，AI 搜索能够解决目前的不足，比传统的搜索方式更能「整合全球信息，供大众使用，让人人受益」，成为人类获取信息的主要方式。

文章来源于“雷科技”

景鲲要再造一个百度？生成式AI颠覆搜索为时尚早

关键词: 景鲲 , AI , AI搜索 , Genspark , MainFunc

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址：https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装：https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体，能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址：https://github.com/hitsz-ids/airda

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。
项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。
项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目
项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。
项目地址：https://github.com/TaskingAI/TaskingAI

AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架，其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址：https://github.com/InternLM/MindSearch
在线使用：https://mindsearch.openxlab.org.cn/

【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费，搜索结果包含文本，图片，视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目，测试搜索结果最好。
项目地址：https://github.com/miurla/morphic/tree/main
在线使用：https://www.morphic.sh/

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。
项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0