ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI搜索,战火重燃
6898点击    2024-10-17 09:28

告别罗曼蒂克


随着月之暗面宣布上线具备AI自主搜索能力的Kimi探索版,一时间,AI新的竞争战火燃烧至一个并不新的领域——搜索。 


今年下半年以来,整个AI搜索都呈现出热闹的景象:海外,OpenAI推出AI驱动的搜索引擎SearchGPT,谷歌在近期也宣布将推出由人工智能组织的搜索结果页面,加速搜索变革。 


最新融到热钱的一批AI创业者中,也不乏AI搜索的影子。除了Perplexity等明星企业外,还有前小度CEO景鲲创办的Genspark、企业搜索领域的Glean、Hebbia,专注电商领域的Daydream。10月,Ai Pin两位高管再创业推出的AI事实审查搜索引擎Infactory也已完成400万美元种子轮融资。 


国内,几乎所有AI牌桌上的玩家,无论是大厂、中厂抑或是创业公司,都推出了AI搜索产品。不久前,百度文心一言改名文小言,定位为新搜索。 


据「AI产品榜」发布的今年9月网站榜数据,国内AI产品中,知乎直答、360AI搜索等增长势头十分明显。中长期来看,理想情况下,随着AI搜索向智能助手转变,或重塑互联网的新入口,前景和钱景都有。短期来看,作为高频刚需的确定性赛道,在技术和场景上,传统搜索和AI搜索也并非泾渭分明,无论是作为智能助手的「过渡形态」,抑或是AI原生产品的附加功能,都具备可观的想象空间。 


不过,在行业热度背后,不少业内人士对此轮AI搜索的态度则十分冷静。区别于「搜索无所不在」的浪漫幻想,成本、数据、体验与商业模式等各类更现实的问题,已然浮出水面。


1、为何战火重燃?


海内外科技大厂与创业公司重燃AI搜索战火,并非是偶然。 


一位互联网大厂搜索业务人士告诉「硅基研究室」:“搜索一直都AI行业玩家的必争之地。”一方面,搜索能为苦于流量的大厂带来重塑入口的可能,它们可借移动时代的生态优势,快速整合自身能力。而由于搜索应用场景多元,传统搜索在搜索效率、交互设计等方面又存在很多问题,也自然给创业公司在垂直领域提供了更多「弯道超车」的机遇。 


从去年至今,AI搜索领域涌现出三类主要玩家:一类是定位C端和B端的原生AI搜索工具,典型秘塔AI、Perplexity AI、Genspark、YOU、Glean等,大多为创业公司。一类是为传统搜索引擎中增加AI功能或推出相关AI搜索产品,如微软的New Bing、Google的 AI Overview,360推出的AI搜索、夸克等,大多集中在搜索大厂,它们更多是一种焦虑情绪趋势。360集团副总裁、360AI搜索应用负责人梁志辉就谈到,在非常早期启动AI搜索业务的原因主要是「担忧」:“AI搜索用足够的时间发展起来后,我们的传统搜索引擎和浏览器的业务可能被彻底颠覆掉”。 



还有一类则是给现有AI产品锦上添花,比如在chatbot专门增设搜索功能的Kimi,百度的文小言等。

 

不过,区别于上轮AI搜索的火热,此轮玩家们又集体翻新「旧瓶」,离不开以下几点原因:


一是,用户搜索行为的变化。 搜索实际是一个需求泛化的场景,梁志辉在播客《AI产品经理》中曾透露,2019年的360搜索里,有42%的用户在寻址,21%在找资源,37%在提问题,但到了2024年,在360AI搜索里,寻址的用户和找资源的用户占比均有两位数下降,而超七成的用户都在提问题,也就是说,生成式AI技术与应用的爆发进一步催熟了用户以提问为主的搜索需求。 


二是,头部科技大厂焦虑情绪的缓解。 它们逐步意识到,传统搜索与AI搜索间并非是绝对的替代关系,用户搜索行为的惯性依旧存在。面对新AI搜索产品,用户短期出于尝鲜需求可能会投入成本尝试,但长期来看,考虑到迁移成本,传统搜索在端侧、生态与内容上的优势依旧存在,一旦推出类似的AI搜索功能,部分用户也很快选择调转车头。 


三是,上一阶段,AI搜索的火热很大程度上得益于RAG(Retrieval-augmented Generation,检索增强生成)」技术的发展, 其将信息检索(Retrieval)和内容生成(Generation)两个步骤融合,有效地降低了大模型的幻觉问题,实现了大模型技术和实际场景需求间的平衡。 


现阶段,技术服务需求的趋势也越发明显,行业竞争逐步向技术工程化和产品化发展,无论是智能体的调用、多模态能力的集成,抑或是在技术层对模型能力进行优化,如Prompt工程上的优化,各家都在结合自身的技术优势和搜索资源,去寻找AI搜索的新形态与新体验。“外面看这波(AI搜索)很热,但我们还是很冷静。”有行业人士向「硅基研究室」这样评价此轮AI搜索的爆发。 


2、告别罗曼蒂克


一提到搜索的想象力,人们常提到这句话:「忘掉搜索框,搜索将无处不在」。 


搜索的核心本质其实用户寻求特定信息的过程,用户搜索的目的从来都不是搜索行为本身,而是寻求答案,因此每一次query(查询)往往都是个人需求和意图的组合,而配合大模型的泛化能力,能源源不断地满足个人长尾需求。 


这也是为什么Perplexity创始人Aravind Srinivas并不把自己当作谷歌竞争对手的原因所在:“我们最大的敌人不是Google,而是人们不是天生就擅长提问的这个事实。”现阶段,AI搜索最关键的任务,其实是通过新技术、新产品和新交互去更精准地理解用户的提问和搜索意图。 


换言之,一个共识是,AI搜索正在告别某种技术的罗曼蒂克想象,变得更接地气,这源于此轮AI搜索的三个明显变化。 


第一个明显的变化是,AI搜索的入场门槛正在变高。


DayDream在今年6月完成了5000万美元的(约3.56亿人民币)种子轮融资,7月,Genspark也完成了6000万美元(约合4.35亿元人民币)的种子轮融资,估值达到了2.6亿美元,英伟达参投的一家AI搜索引擎公司Exa AI也获得了1700万美元的新一轮融资。 



入场门槛变高的原因在于,入局成本在变高。 


目前,市场上很多的AI搜索产品都是通过「接入传统搜索引擎API+大模型」实现能力的整合,并没有基于真正的AI架构重新在底层搭建一套搜索系统,原因在于AI搜索的成本还是很高。 


从成本端来看,AI搜索的成本可以分为模型成本(大模型接口费、模型搭建、训练与运营成本)、搜索API费用、私有数据存储和服务费用(自建索引库),还有人工和运营获客成本。 


AI搜索核心的一个壁垒就是数据的量和质,这直接影响答案的生成质量,因此底层数据的质量和数量至关重要。比如,传统搜索大厂在成本端的一个固定开销就是自建索引库,昆仑万维董事长兼CEO方汉在采访中提到,光是爬虫集群的开销,如果索引全球的网页的话,那基本上在3000台服务器到1万台服务器之间。OpenAI此前也是通过收购了一家名为Rockset的数据库公司,才弥补了自己在数据层的短板。 


这也是为何AI搜索公司估值水涨船高的原因,成本无疑是初创企业需要考虑的最直接问题。 


第二个变化是,无论如何都不能单纯只做搜索。 猎豹移动董事长兼CEO、猎户星空董事长傅盛在接受采访时提到:“AI搜索,现在虽然是大一统了,在很多细微的地方,就能看到不同的产品,是不一样的。” 

「硅基研究室」观察到,背靠科技大厂、自身有着搜索业务的玩家结合自身的数据和生态积累,正在集成更多样化的AI能力,寻找更多的场景入口,让搜索无所不在。 


在多样化的AI能力上,比如百度副总裁、AI产品创新业务及MEG战略运管中心负责人薛苏就提到,AI搜索和传统搜索的最大不同就是从单纯的工具性的「搜」,走向了更具人性的「搜+创+聊」,这之中,包括我们已熟悉的多角度的总结、长文本的归纳、多模态交互、Agent等融合。 


在更多场景入口上,结合更多的硬件入口、多模态入口,做统一和整合,也在规划之中。例如,夸克不久前发布全新PC端,谷歌与三星合作的推出的「即圈即搜」等功能,都是在为搜索寻找新入口,提升搜索的价值。 


而大厂外,垂直领域的AI搜索初创企业走向更精更专与更定制化的体验。 


以Genspark为例,聚焦在旅游和商品等垂直领域,可以利用AI copilot,为用户生成定制化名为Sparkpage的自定义页面,支持用户的自定义编辑,每一个模块也以卡片形式展现,很像「小红书」。 



另一个备受科研人士和学生党喜欢的国内工具秘塔搜索,则在近期上线了播客、文库以及图片分析功能,丰富信息源,本质上也是更好地为核心人群服务,契合目标人群的工作流。 


第三个变化,则是更多玩家谈到了商业化。 如前文所说,商业化是AI搜索一个老生常谈的话题。月之暗面在推出探索版后,就向记者透露,未来会考虑做一定的商业化尝试。从盈利模式来看,AI搜索主要有订阅制和广告两类。不久前,谷歌就宣布将AI搜索能力整合进Google Lens,增加了Lens的购物功能中,同时开放了购物广告展示位。Perplexity AI也在探索搜索广告的营收模式,Perplexity首席商务官Dmitry Shevelenko在近期表示,9月份处理了 3.4亿次查询,有几家「家喻户晓的顶级」公司希望在该平台上投放广告。 


来源:谷歌


3、AI搜索没到终局


Perplexity创始人Aravind Sriniva曾在一次采访中提到两个AI能实现「技术-产品-用户」良性循环的行业——一是自动驾驶,另一个就是搜索:“AI的任何进步,语义理解、自然语言处理,都会改善产品,更多的数据也让嵌入式向量表现得更好”。 


当AI与搜索这一古老的领域相结合,创业者所面临的是一个两难抉择:前方是林立的巨头,把持高度集中的市场份额;后方,是AI的无穷魅力,它能改造传统搜索的体验,为搜索拓宽边界。


至少从目前AI搜索工具的百花齐放来看,竞争还远没到终局,产品、场景与技术的迭代还会继续,如何降低成本、塑造用户信任,把流量变留量,又如何技术工程与数据上的诸多问题,行业玩家们都有很多苦活儿要干。 


参考资料: 


1、甲子光年:拆解SearchGPT后,我们发现了AI搜索的壁垒、突破和未来 


2、AI产品Rena:AI搜索产品深度分析-搜索原理和商业模式分析 


3、Founder Park:张鹏、傅盛&方汉:连谷歌都下场了,为什么OpenAI没有推AI搜索? 


4、播客AI产品经理:国内增速第一的360AI搜索在做什么?| 对谈360VP梁志辉 


5、中信证券:AI搜索:搜索新范式,流量新入口 


文章来自于“硅基研究室”,作者“kiki”。




关键词: AI , AI搜索 , RAG , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
AI爬虫

【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。

项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai

5
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

6
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

7
秘塔AI

【开源免费】metaso-free-api是一个逆向秘塔AI搜索的开源项目,它支持超强检索超长输出,支持高速流式输出、超强的联网搜索以及零配置部署。

项目地址:https://github.com/LLM-Red-Team/metaso-free-api

8
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0