# 热门搜索 #
搜索
景鲲要再造一个百度?生成式AI颠覆搜索为时尚早
7835点击    2024-06-23 11:03

AI搜索不是救世主,但是一种新选择。


这一轮生成式 AI 引发的浪潮可以说愈演愈烈,几乎每隔一段时间就会有新的 AI 公司和 AI 产品出现在我们的面前,也能看到很多已经功成名就的人选择投身 AI 创业热潮。


就在昨天,前小度 CEO 景鲲公布了离职百度后的新动态,宣布和前小度 CTO 朱凯华联合创立了 AI 创新产品公司 MainFunc,旗下首款 AI Agent 搜索产品 Genspark 已经 Beta 上线。



图/ Genspark


此外,MainFunc 还拿到了 6000 万美元(约合人民币 4.35 亿元)的种子轮融资,投后估值直接来到了 2.6 亿美元(约合人民币 18.87 亿元)。


此时距离他辞任百度集团副总裁和小度 CEO,刚刚过去 8 个月。耐人寻味地是,他在离开百度后选择的领域恰恰是百度的核心业务——搜索。


不留在百度的体系内做 AI 搜索,而是选择和前小度 CTO 一起自己做,这在一定程度上说明了百度面对 AI 搜索这个全新领域存在一些问题。但更重要的可能还是,景鲲的选择再次证明了很多人相信的一点:


AI 搜索,大有前途。


但这种「前途」会彻底改变我们获取信息的方式吗?又会打破现有的搜索市场格局吗?


Genspark,又一个有点不同的 AI 搜索


和所有 AI 搜索一样,Genspark 也采用了以对话为主要交互方式的设计,用户提出问题后,Genspark 会生成相关的简短回答,直接给你你可能需要的信息,而不是给你你可能需要点击、浏览、判断的「十个蓝色链接」。


此外,MainFunc 官方相信,Genspark 可以提供更高质量的搜索结果——也是回答。按照官方的说法,Genspark 使用多个专门的人工智能模型,每个模型都旨在处理特定类型的查询。


在底层,Genspark 依靠内部训练的模型以及来自 OpenAI、Anthropic 等的第三方模型来对用户的搜索查询进行分类,并确定如何组织和呈现结果。比如我们搜索「OpenAI 什么时候推出的 AI 搜索?」(实际没有推出):




图/ Genspark


Genspark 的每个搜索结果页面首先会呈现 AI 生成的结果摘要,后面是指向更详细的 Sparkpage 的链接,基本上可以理解为针对问题生成的一篇完整回答。最后还有一些推荐链接,这部分就相当于传统搜索引擎的结果页面。


而 Sparkpage,也是 Genspark 区别于其他任何 AI 搜索的独特性交互设计。除了生成一个类似维基百科的详细回答,用户还可以在 Sparkpage 右侧的对话窗口,继续与 AI 进行对话,不管是针对回答的疑惑进行展开,还是针对部分内容进行深入。



图/ Genspark


针对大模型的「幻觉」问题,AI 搜索一般都采用 RAG(检索增强生成)技术降低「幻觉」的出现概率。景鲲则在 TechCrunch 的采访中另外表示,Genspark 的 AI 模型偏爱具有高权威性和流行度的网页,对过滤掉更多「外面」的信息有很大帮助。


「我们非常重视数据质量,我们相信数据质量是赢得这场比赛的关键,」景鲲强调。但现实是,在这场 AI 搜索的比赛中,重视数据质量的不仅是他们,参加比赛的对手也是层出不穷。


生成式 AI 掀起的搜索革命


曾几何时,以谷歌和百度为代表的搜索引擎可以说是整个互联网最重要的「入口」,基于搜索引擎,谷歌一直以来的使命就是:「整合全球信息,供大众使用,让人人受益。」


但在很长的时间内,搜索引擎的产品形态和商业模式并没有发生质的变化,甚至体验还有所退步。


在传统的搜索体验中,用户通常是脑中存在一个或模糊或清晰的问题和需求,然后需要将这种需求转化成一个或几个相关的关键词。


接着,搜索引擎根据关键词、索引库找出相关的网页链接,再通过算法排序的方式呈现相关程度最高的网页链接。同时,在搜索结果中还往往穿插着几个「伪装成搜索结果」的广告。



图/百度


与之相对的,得益于大语言模型实现了强大的自然语言理解能力,用户可以用最自然的自然语言进行搜索,AI 搜索也能够更准确地理解用户的提问意图。


此外,虽然 AI 搜索同样需要匹配超大规模的索引库来找到相关的网页,但在呈现上彻底改变了过去信息的组织和设计,没有「信息排序」,直接给出答案,不需要用户点击排在前的最相关链接,再找出自己真正需要的信息。


简而言之,相比传统的搜索体验,AI 搜索是一种交互和效率上质的变化,也被很多人视为搜索的未来。所以即便 AI 搜索严重挑战了现有的搜索广告商业模式,谷歌也还是推出了 AI 搜索。


今年 5 月 15 日,谷歌在 Google I/O 开发者大会上宣布将在谷歌搜索上线基于 Gemini 大模型的 AI Overviews 功能,简单来说,就是根据用户问题在搜索结果页直接生成一个简短的回答,然后才是以网页链接为主的传统搜索结果。



图/谷歌


用过 New Bing 的读者一定不陌生这种形式,事实上这也意外着谷歌搜索终于也迈出了通往「AI 搜索」的一步。


相比之下,作为全球第一大中文搜索引擎,百度同时还是国内最早推出自主训练大模型,虽然旗下也有主打 AI 搜索的「简单搜索」,但百度搜索却取消了 AI 搜索功能(文心一言推出早期有上线过)。


而与此同时,由前 OpenAI 研究科学家 Aravind Srinivas 联合几位合伙人共同创办的 Perplexity,已然成为了当下最具代表性和影响力的 AI 搜索。截至今年 1 月,Perplexity 的月活跃用户就超过了 1000 万,访问量超过 4500 万次,总搜索量超 5 亿次。


加上转型 AI 搜索的传统搜索公司,以及一大批新涌现的 AI 搜索初创公司,AI 搜索似乎已经到了「万马奔腾」,一举取代传统搜索的局面。


但 AI 搜索已经到了取代传统搜索的阶段吗?可能还为时尚早。


我放弃了把 AI 搜索作为默认搜索引擎


坦白讲,从去年开始小雷就尝试过将浏览器的默认搜索引擎换成「AI 搜索」,主要是用连英伟达 CEO 黄仁勋都在用的 Perplexity,今年还尝试过将之前中文搜索体验还不错的秘塔 AI 搜索设置成默认搜索引擎。


但现实是,我其实都用不了多久就会换回谷歌,理由并不复杂,核心是 Perplexity、秘塔 AI 搜索以及其他 AI 搜索都:


不可靠。



比如刚刚问到的回答,图/ Genspark


作为科技编辑,小雷几乎每天都需要使用搜索引擎,也严重依赖通过搜索来获取信息,同时信息的准确性也非常重要。这一点应该很好理解。


但 AI 搜索本质上是能联网的 AI,同时基于 RAG 技术,大模型会结合用户提问和相关检索信息作为 Prompt 输出回答。虽然不少观点认为 RAG 技术是当下缓解大模型幻觉的最佳解决方案,但不仅远谈不上解决,实际缓解的效果也有限。


具体到 AI 搜索体验中,小雷看到有些回答会明显怀疑一些信息的真实性,这个时候又不得不需要通过谷歌等传统搜索引擎进行检索、查证,因为 AI 搜索的来源链接也充满了幻觉。


但我又不可能每个信息都重新进行搜索、查证,否则就与「使用 AI 搜索提高搜索效率的初衷」背道而驰了。


更大的问题是,如果一些信息错得并不离谱,我对一些特定领域也并不了解,很可能不会意识到错误,甚至会直接使用了错误的信息,从而产生错误的理解和观点。


简单来讲,作为能联网的大模型,目前的 AI 搜索很多时候是存在幻觉的黑箱,我很难信任 AI 回答里面的各种信息,所以宁愿退回传统的搜索体验,使用关键词找到相关的网页,再人工寻找和判断我需要的信息。


但这不意味着我会放弃使用 AI 搜索。


首先,大模型的流行注定会改变互联网的内容生态,我们很早就在文章中表达过对生成式 AI 内容充斥互联网的担忧,今年你甚至还可以看到字节跳动、掘金等公司通过 AI 生成了海量中文网页「污染」搜索引擎。



豆包生成的就有 1560 万条,图/谷歌


而不同于传统搜索引擎的机制和交互方式,AI 搜索理论上相对更容易绕开这种「污染」,同时对话式的交互也能避免了大量无价值内容,提高效率。


其次是在「What」之外,我们经常需要向搜索引擎提出的问题还有「Why」和「How」,这方面对信息的准确性要求较低,更强调整合梳理能力,而这恰恰是大模型极其擅长的,这是小雷需要的。


同时从更长远的角度来看,大模型和生成式 AI 技术还处在快速发展的阶段,当下幻觉的问题并不意味着在不远的将来会有更好的解决方案。


写在最后


AI 搜索不是救世主。


AI 搜索的出现无疑给我们提供了一种全新的信息获取方式,也带来了不少新的思考和挑战。但在使用 AI 搜索过程中,我们能明显发现了其在准确性和可靠性上的不足带来的困扰。但这并不意味着 AI 搜索毫无价值。


相反,AI 搜索在整合信息、提升搜索效率以及避免无价值内容方面展示了巨大的潜力。随着技术的进步,生成式 AI 的能力将会更加完善,或许就能解决当前存在的问题。


所以比起一种取代传统搜索的「救世主」,我更愿意把 AI 搜索看作一种新的选择。我们在使用中需要不断探索和适应,找到最适合自己的使用方式。在这个过程中,传统搜索引擎和 AI 搜索并不是互相排斥的,而是可以相辅相成,共同改进我们的搜索体验。


或许在不久的将来,AI 搜索能够解决目前的不足,比传统的搜索方式更能「整合全球信息,供大众使用,让人人受益」,成为人类获取信息的主要方式。


文章来源于“雷科技”


关键词: 景鲲 , AI , AI搜索 , Genspark , MainFunc
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0