ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI搜索要卷什么?
5547点击    2024-08-20 15:10


看两个现象:


上周,我和一个做电商朋友聊天,他正研究干果品类市场趋势。聊着聊着,他说,现在AI 搜索不太好用。我问为什么,他说:


我想知道上个月哪种干果卖得火,抖音上真实用户评论怎么样,以及未来的销售趋势会如何?但是,AI 搜索后,得到一堆关于整个行业的研究总结,这些信息既不够深入,也不够精准,帮助不大。


当时我没太在意。结果,昨天这种情况又出现了。


在微信上,聊到工作流,一个在医疗行业做培训的朋友说,他经常要查阅很多学术报告;报告大多从知网之类的平台下载,然后用豆包 AI帮他做本地化总结和提炼关键内容。


同时,也会用夸克、知乎直答垂直 AI 搜索工具。但问题是,工具能找到一些博主写的不错的问答,当想更深入地了解问答背后知识时,就卡壳了。


其实,我更想要其他维度的内容,类似于案例分析,数据解读之类的。但AI搜索只能给出总结性的结论,有些失望。


所以,这两次无意识聊天让我感受到,要让 AI 搜索真正满足用户的需求,要找到具体场景。


01


什么是具体场景?怎么理解AI使用场景呢?


得从用户任务下的行为方式看。我们每天从早到晚活动,都围绕完成特定任务展开,用户使用产品、服务时,根本目也是为了完成任务。


昨天,有个朋友和我说到他使用AI搜索的方式。


他日常工作是监测品牌声誉,使用 AI 搜索工具会设定一些关于品牌名称、相关话题讨论情况的提示语,然后,用它们捕捉网上每天关于品牌的评价;最后,利用这些信息,制作成日报,反馈给领导。


也就是说,他把 AI 搜索当作一个信息聚合工具,利用它来索引、总结当天的重要反馈和评论。


还有人使用AI基于话题形式。比如说高考,众多家长在面对孩子高考后,不知道如何填报志愿、不知道怎么选专业。


这时,会用AI搜索获取帮助,AI 搜索像一个专业顾问,能够依据家长、学生提供的具体情况,(兴趣爱好、学科优势、未来职业规划等)进行综合分析,进而做出针对性选择。


从这个行为来看,用户主要关注两方面:一,功能性;二,实用性。


所谓功能性,即,AI 完成搜索任务后,能基于结果进一步生成思维导图,制作图标,提供多维度数据对比工具,甚至能做中英文互译等等。


而实用性,是把知识答案作为起点,去解决具体问题。实际上,每个问题是一个场景,问题的聚合代表着大量资源的挖掘。


我前段时间看徐峥导演的《逆袭人生》,想写篇文章。


写作过程中,我想查查全网关于徐峥的各类话题数据,我用 AI 搜索找好久,最终,只能找到一些其他媒体的数据;其实,我更希望当我问 AI 时,它能帮我搜索、总结一下,然后用工具做成表格,直接拿来用。


最近各家公司都在发布财报,我如果能对 AI 搜索说,帮我找一下瑞幸 2024 年中期报告,比较一下和 2023 年的数据,并把毛利、净利做成表格,那该多好。


显然,目前 AI 搜索产品还做不到这一点。


或者说,大家都在卷AI搜索、把AI总结前置化思维方式,限制了产品经理的思考,他们没能从任务角度出发,用问题、话题索引信息源后,再总结,再用工具串联起来。


Perplexity标语叫做 “Where Knowledge Begins”(知识从这里开始),我觉得,用这句话来形容 AI 产品的用途很合适。这意味着,AI 帮助我们从知识的起点开始,解决实际的问题。


02


把用户任务前置化的思维方式很重要。不信,冷静下来想一想,不论是什么样的 AI 搜索产品,它们主要目的是什么?


说白了,只有一个:用 AI 力量,帮用户找到他们真正需要的内容,让他们能拿到更准确的信息。


过去用传统搜索引擎时,很多用户需求都没被好好满足。如果我们要找个答案,可能得先把问题分成 A、B、C 三部分,然后一个个地输到搜索框里。


搜索引擎用爬虫技术在网上抓信息,然后,按自己的逻辑排个序,列出结果。我们拿着这些信息,自己再分析、总结一番,最后才能用来支持决策。


但有了AI 搜索产品后,一切变简单了,你不用再走 A、B、C 三步。只要提出问题,AI 就直接理解你的意图,拆解问题,并找到相关网页。然后,大模型会分析信息,最后整理成结构化的结果直接给你。


但问题是,单单列出 A、B、C 还不够。我们希望在信息被列出后,还能用工具进一步深入分析,然后再总结,最后生成报告。这才是关键。


这个过程像建筑师设计房子:


先画出草图(提出问题并进行拆解),然后,找合适的材料(收集和分析信息),最后,精心挑选材料,确保每一步都非常精准,这样才能建造并完成精装,保证房子既坚固又好看。


可问题是:现在 AI 帮我们收集和分析了信息,但选择材料的权利没给用户,也没提供足够的工具,就直接总结了。这跟以前有什么区别呢?


因此,在创造新需求之前,AI 搜索要先满足传统搜索没解决好的需求;也就是说,过程中被忽视的需求。


虽然现在看起来 AI 降低了搜索产品的门槛,实际上很多产品很相似,都像 AI 版知乎直答,它们主要任务是简化搜索流程,把来自不同渠道的信息集中起来。


所以,我说 AI 搜索卷错了方向,那么,自然也就出现,很多人经过一段时间尝试之后,又回到传统搜索引擎行为上,因为传统搜索引擎提供的信息更全面。


显然,如果想让用户把 AI 搜索变成一个真正提高效率的工具,必须深挖并满足传统搜索技术没满足的需求,这才是刚需。


03


因为所有AI搜索,本质上,都在解决三种题型:


第一种,填空题。这种时候,用户其实已经心里有个问题:“这是什么?”


比如:他们想查查最新的新闻,或者想知道某个名人最近怎么样了,又或者想知道一家公司去年挣了多少钱。这些问题,传统互联网搜索已经能解决得很好了。


第二种,证明题。这时,用户已经有了自己的想法,可能会说:“我觉得是这样,因为……”,他们需要的是一大堆事实来支撑这个看法。


这种情况就像老板给你个想法,你得去找证据来证明它是对的。这种任务,听起来简单,其实挺费劲的,要花不少人力、物力和时间。


比如说:


如果要证明某家公司的某个看法,我得去翻这家公司过去几年的各种数据和信息。就像我想写徐峥导演的《逆袭人生》,本质上也是个证明题,要通过数据来证明我的观点,那就得找准确的数据。


实际上,AI搜索产品都在尝试解决填空题、和基础证明题,所谓的基础证明题,是有明确标准答案的问题,但它们处理复杂证明题的能力还需要提高。


我觉得最难的是论述题(discussion question)。


什么是论述题呢?这种题像:“我也不太清楚,帮我在网上找找看?”这种问题和前两种的区别在于更像语文和数学。


数学有明确对错,语文没有。高级证明、论述,就像写作文一样,没有固定对错,分数更多是老师主观给的。


搜论述题挺复杂,你找的是关于一个问题的各种观点,本来就没有绝对的正确或错误。搜完后,还得自己头脑风暴一番,最后才能总结出个答案。


可以看出来,这三种题型,难度一级比一级高。要回答好“高级证明题”和论述题,不光需要工具,还得人工参与一下。


这是啥意思呢?


现实世界里,复杂问题很常见,因为无论是在工作还是生活中,很多问题都没有绝对的对错,常常是因为不同人的价值观、看法不同。


我们人类又有点懒,总希望AI能一步到位帮我们搞定这些复杂的问题。但用过几次后,发现AI没那么给力,用的次数就少了。


还有,要回答这些问题,比如我找了好多论据,到底哪个最靠谱,哪个最有力,你得一个个筛选;如同写论文一样,为了支持一个观点,得查很多资料,还得想清楚怎么表达得简洁明了。


现在,ChatGPT都解决不了高级证明题和论述问题。比如,你问它一个问题,它回答后,你说不对,它会马上改,改成你想要的答案,尤其是文科类。


04


那为什么大语言模型搞不定这类问题呢?因为大语言模型是根据前一个词来推理下一个词,它是在猜高频词。


但问题是,出现最多的词,不一定是最好的答案,有些词或句子出现的次数很少,但可能就是关键的见解。


比如:


好的学术论文,平时可能没多少人看,用得也不多,但要你想深入研究一个问题,这些论文就特别重要。法律、医疗、政策研究、市场分析的专业报告也是一样,这些深入和具体的内容通常不太流行,但对做决策超重要。


还有一点,AI不太会拆解复杂问题,我们得把问题拆得特细,一步步来,才能找到答案。所以,要解决证明题、复杂论述题,就得让用户参与进来。


这个过程就是:AI搜索后,用户可以选择优质语料、剔除不太准确的信息,然后扔进工具里,自己再总结一下,最后才能得到满意的答案。


举个通俗的例子:


你想研究全球变暖,对北极熊生存环境的影响。一般AI搜索,只能给你一些基本的信息和新闻报道。


但作为研究者,你要找到相关的学术论文、和详尽的环境研究报告。可是,第一次搜索结果里,你会发现很多过时的或者不相关的内容。


这时,为了拿到真正有用的数据,你就不得不一个个地筛选包含严格科学研究和具体数据分析的文章;这一步做完后,你就可以把精选的资料扔进一个分析工具里,或利用某些功能,做成图表、PPT,插入一个页面中,最终制作出自己需要的报告。


前一段时间,GitHub热榜上,曾经有位AI 大神仅用 500 行代码就打造了一个AI 搜索引擎的Demo ,我还体验了一次,不仅响应速度快、回答的内容也能跟进最新时事。


所以,想要AI搜索产品脱颖而出,最关键条件是什么?


一方面,是数据,尤其是垂直细分的数据。垂直细分的数据要通过具体的场景、话题、主题来引导用户分享,并参与提问。


另一方面,想应对低门槛挑战,要努力打造自己产品特色,AI 搜索产品是由用户需求驱动的,不是单纯的技术驱动。


用户价值可以通过这样的公式来表达:用户价值 = 新体验 - 旧体验 - 迁移成本。想想看,如果一个AI搜索工具能提供明显优于传统搜索的结果,但,同时使用起来又非常简单,那么,用户自然更愿意转向使用这种新工具。


我最近老看大模型的文章,文章都在哪找的呢?


主要是两个地方:一个是技术社区,另一个是知乎直答上的一些专门写这方面的博主。每次我搜索这些内容时,它们几乎总能给我找到需要的东西,所以,我现在挺依赖它的。


这就是用户价值。


因此,从这个角度看,国内AI搜索产品的发展路径,不能完全模仿国外Perplexity。外媒平台Decoder一周前发表了一篇文章,介绍了Perplexity的现状。


文章中提到,Perplexity首席业务官Dmitry Shevelenko表示,Perplexity每个月要处理2.5亿个问题,增长速度令人惊讶。虽然谷歌仍然是搜索市场的主导者,每天处理85亿次查询,但Perplexity的增长速度也非常迅速。


Perplexity是希望打造知识平台,成为生态入口,它的定位是LLM+搜索引擎的中间态,将二者优点结合,侧重搜索体验的产品力而非基模型。


对比国内的搜索环境,传统搜索引擎已经占据通用搜索场景。如果新的AI搜索产品知识库规模不够大,使用效率不够高的情况下,还在努力处理填空题、基础证明题,那么,很难在市场脱颖而出。


所以,国内AI搜索产品,每家要找到自己独特的发展路径,或许,在特定垂直领域深耕,利用AI优势来提供更精准、更垂直细分的内容,才能机会瓜分市场。


总结

到场景任务中去。


场景、任务里,存在着许多尚未开采的金矿,未来AI搜索要么成为工作流中一部分,要么,走向UGC+AIGC路线,但后者要具备庞大知识系统,构建起来要烧更多钱,何其容易。


文章来源“王智远”,作者“王智远”




关键词: AI , AI搜索 , AI应用 , AI应用场景
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
AI爬虫

【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。

项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/