ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
当AI搜索开始赚钱养家
5732点击    2024-11-04 22:57

近期,在GPT-4o创造的新范式影响下,月暗、智谱、Perplexity和OpenAI相继上线了AI搜索推理功能。


与此前“大海捞针”不同,最近更新中AI搜索长了“脑子”,在面对问题时,能像人一样先拆解步骤,再精准搜索,最后呈现答案。


根据“知识管理模型”,数据本身无序且缺乏意义,只有向上进化为信息、知识、智慧才能具备价值。信息解决了“What”的问题,知识解决了“How”的问题,金字塔最顶端的智慧应对了“Why”的问题。以此进化逻辑来看,CoT(思考链)加持下的AI搜索已经开启了2.0时代,从信息聚合走向规律总结和辅助决策。


用户对AI搜索的依赖程度超出了预期,Perplexity宣称其每周能处理1亿次查询,每月能处理约4亿次。从巨头手中抢夺用户还远远不够,更重要的是,AI搜索在商业化上释放出了积极信号。国外最新报告显示,随着AI搜索的发展,谷歌搜索广告市场份额十年来首次跌破了50%。


无论新老玩家,都盯上了谷歌们留出来的“蛋糕”。目前有两种路径,一种是效仿谷歌做通用型AI搜索工具,向C端售卖使用权,向B端出售广告席位和创建AI搜索能力;另一种以应用为载体,将AI搜索能力嵌入场景中,欲绕过搜索引擎中间商,自建分发渠道和数据入口。既能通过搜索优化用户使用体验感,提升付费可能性,也能防止中间商赚差价,增强盈利能力。


月暗大搞饥饿营销,疯狂上分,怒刷“国内首个4o搜索”存在感;靠Talkie赚到回头钱的Minimax,将精力放在了AI应用的搜推上;就连一向温吞慢热的微信也在求变,灰测AI问答功能,打通混元与微信间的生态。


“越是共识,门槛越高”,有业内人士认为,正是由于普遍看好AI搜索,才加大了竞争,“如果不突出,还是选谷歌”。


搜索+深度推理=?


深度推理模式下的AI搜索对拆解、分析能力的需求,远远超越了“搜”这个动作本身,搜推的底层逻辑嵌套在了寻找和解决问题答案的过程中。


结合Perplexity和Kimi的使用体验,AI搜索推理模式的基本过程如下:提出一个可能涉及大量搜索和多个意图的问题,针对该问题AI不急于回答,而是先解题,将一个复杂的指令拆解成几个步骤,然后依次完成“搜索+分析”动作,最后才是呈现答案。


以前的AI搜索是“书呆子”,拿着关键词在题库里找,开卷作答。现在的AI是“机灵鬼”,在掌握解题思路后,依照解题步骤分点作答。而且整个解题是实时动态的,边思考边解答。


以Perplexity官方给出的case为例,提问是“阅读贝索斯每年所有股东信,并列出一个每年关键要点的表格”。为了解决问题,AI将其分解为了三步,分别为“搜索并找到贝索斯所有年度的股东信”“获取贝索斯每封股东信的内容”以及“制出贝索斯每年股东信关键要点表格”。如果使用Kimi探索版,会在答案生成完毕后再次搜索,完成“反思后的补充”。


“搜索+深度推理”可视为执行搜索任务的Agent,所以能看到AI给出的是可行性的操作步骤,而不是类似“贝索斯”“股东信”“要点”一类的搜索关键词。AI搜索的底层逻辑发生了变化,从“找到”转向了“解决”,“搜”这一动作变成了解决问题底下的子集。如果把搜索视为辅助解决问题的工具,那这个子集可以无限扩充,比如文档、知识库、PPT、办公软件等等,Agent工具的开放性和延展性为提升搜索质量埋下了伏笔。


当然就目前而言,搜索Agent有其无法克服的自身缺陷。


光子星球在测试中发现,当去过分强调搜索步骤的完整性时,就会发生过程正确,而结果错误的现象。这意味着单个CoT的链条没有问题,但是链与链之间的连接关系出现了错误。在某些问题中出现了“鬼打墙”,搜索和步骤拆解动作反复循环,这将是对算力的巨大浪费。


上述也提到好的解题思路大于搜索,当CoT代替RAG成为标配,更要警惕出现把简单问题复杂化的倾向。比如在一些经典的逻辑问题中,本来可以两步到位的问题,非要强行增加分析过程,反而增加了搜索的难度。CoT不是拿数量说话,而是构建的质量。


AI搜索进阶2.0


跳出单个功能语境,AI搜索离解决问题又进了一步。


搜索筛选出的内容有维度之分,最底层是信息,互联网时代的搜索是通过关键词来匹配到信息池,具体怎么找还要靠用户手动点击进行页面筛选。AI搜索最先填补了上面的断裂,联网的AI可以在自行搜索后,得到确定而非模糊范围的答案。


但这个阶段,用户的感知非常明显,ChatGPT等助手只能回答类似于4W的问题,“谁、什么、何时、何地”。聚合的好处是不用打开N个网页,来了解某个事物的最基本情况,通过prompt以上的构成要素可以随意组合。此时,限制AI搜索是否好用的关键是搜索量,即搜索的范围越大,所能涵盖的4W越全面,也能靠量提升准确性。


知识在信息的基础上进一步被提炼出来,它涉及到对信息的深度理解和处理,是通过大量搜索、对比后发现的规律、趋势。智慧是知识的进一步升维,是运用规律后的指导决策和执行。


2.0阶段的AI搜索处于知识与智慧中间,例如可以追加提问“贝索斯经常提到的关键词”“贝索斯提到的关键点对亚马逊发展产生了怎样影响”等问题。也可以上传《孙子兵法》文档,让AI提出亚马逊发展建议。以上都脱离了4W层面,来到了How、Why问题的探讨。正是因为搜索处理信息维度升高,其价值才水涨船高。


就目前而言,开卷考试和自主思考两种搜索方式的差距并不大,同样的问题用关键词搜索也能获取差不多水平的答案。从信息到智慧,AI 2.0搜索押注的是长期价值,但鉴于目前后训练推理投入不充分,这仍需时间。


除了CoT方式,AI搜索也有其他增强方式。信息搜索是地基,基于此衍生出三条思路,一是扩大搜索量和范围。Kimi探索版的搜索量是普通版的十倍,一次搜索可精读超过500个页面。


Kimi探索版产品负责人曾下过一个结论:“如果 Kimi搜不到的信息,那大概率用户也很难自己通过传统搜索引擎找到”。其潜台词充满了对Kimi搜索量的自信,但也忽略了一个问题,“全”不能与“准确”“优质”划等号。


这就诞生了第二条思路,优质化搜索。核心是提前过滤冗余、低质的信息,确保搜索池质量的基础上再开发搜索能力。相当于建立了一个搜索漏斗池,顶部是未经筛选的信息,第二层按照AI搜索公司或用户定制标准进行过滤,第三层进一步细分,比如关联性强弱、相似程度、优先级等,将重新分配信息的把关权、分发权。


最后一种是直接补充信息来源,因为无论怎么在数量、质量上做取舍,都可能不符合用户预期。如果这样,不如让用户自己上传数据和文本。


瓜分“谷歌”,人人有份


传统搜索退,AI搜索进,趋势日益凸显。当下,AI搜索成为了必争之地。


招聘信息显示,AI六小虎中重押AI搜索推理方向的是月暗,大量涉及推理和工程优化方向的岗位显示在招。Minimax同时也在招聘搜索推荐相关的工程师,但思路有所差异,聚焦在旗下AI应用里的算法、广告投放优化。



谁也不知道留给新玩家的窗口期有多久,尽快吞下显现出的“蛋糕”迫在眉睫。此前积累的用户规模和留存沦为了AI搜索的“饵”,到了广告变现时刻。据悉,Perplexity即将在本季度在其应用内投放广告,可投放广告位有“问题回答”的媒体赞助,搜索答案下方的“相关问题”以及”显眼位置“的视频投放。



 (来源:Perplexity、Kimi)


参照Perplexity,Kimi探索版一改免费版界面,新增搜索展示页面,预留广告招商位。Kimi本身免费使用,其公司月暗也没有其他业务,投流、算力、人力成本的投入急需输血,To B广告商收入是选择项之一。


“二次售卖”达成的前提是将“用户”售卖出去,用户构成决定了卖给谁。有数据显示,Perplexity中65%用户为“高收入职业白领”(医学、法律、软件工程),30%处于“高级领导职位”。这决定Perplexity瞄准的是高端广告市场,科技、金融、艺术等领域。媒体报道,Perplexity的CPM(每千次展示成本)广告收费为50多美元,是市场平均水平的4.5~20倍。


对Kimi们不算友好,其普遍用户画像为大学生、初入职场白领、宝妈、老师等。对广告主来说,上述用户的消费和转化能力相对有限。Perplexity的用户定价与ChatGPT持平,一年多的时间已完成了用户筛选。国内AI搜索和助手类应用,为了争夺市场,采取免费策略至今。投流打响了知名度,却也让收费更加难以推行,更广泛的用户意味着更模糊的广告投放市场。


值得注意的是,Perplexity借鉴Notion协作空间提供了AI搜索to小B的模式。Perplexity对外开放了AI搜索能力,既能共享知识库,也能提升检索、分析问题的效率,取代了一部分“RAG+知识库”的解决方案。在该版本上,有很大想象空间,比如提供AI搜索融入软件生态的渠道。像Notion一样,开放自身也允许其他产品API接入,既能弥补能力缺陷,也能提高用户使用率。


在这基础上,订阅收费模式进一步分层。除了原先的专业版收费模式,还会按照企业规模数量为标准收费,小规模、中等规模、大规模和定制化解决方案。


种种迹象表明,AI行业正在步入营收和利润导向阶段。搜索被誉为“离钱最近的领域”,AI搜索如果能打响大模型商业化的第一站,无疑是一针强心剂。谷歌们后退,谁能吃掉第一口“蛋糕”?



文章来自于 “ 光子星球 ”


关键词: AI搜索 , AI , Perplexity , OpenAI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

5
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0