在信息爆炸的时代,我们面对的最大困境是噪音太多。答案无穷无尽,但真正有价值的回答却依然难以找到。
AI 搜索的兴起,似乎理清了杂乱无章的线索,为每个问题捋出一条清晰的信息脉络。大厂也纷纷入局,陆续推出主打产品。而另一边,初创公司却在寻找一条更细致,更灵活的出路,新一代 AI 搜索引擎 Miku 就是其中之一,率先尝试将 AI 搜索与知识库相结合。
Miku 认为,大模型能够学习大量文本数据,理解不同事物背后和含义和关联,因此相比传统搜索只能基于关键词反馈几十页链接,AI 搜索能够直接提供最终答案,为用户节约大量时间。不仅如此,Miku 采用了自研的 Agent 引擎,能够将搜索结果自动整理成个性化知识库,帮助用户将碎片化的信息转化为清晰的结构化知识,形成独属于自己的知识网络图谱。
Miku 联合创始人范国斌是一位 00 后连续创业者。在他看来,新一代AI搜索的定位是充当用户的信息官,而要返回精准答案的前提,就是大模型必须能够充分理解用户上下文信息、精准识别用户意图。在同类语言大模型的横向评测中,阶跃星辰“Step-2 模型的上下文理解能力突出,在颗粒度方面的理解和捕捉比较细致,不会丢失关键信息”,因而成为了 Miku 的选择。
什么样的 AI 搜索才算是一位好的信息官?未来的 AI 搜索到底能做到多精准?初创团队如何在搜索赛道中找到自己的破局点?带着这些疑问,我们采访了繁星计划的合作伙伴国斌。
以下是部分文字记录:
Q:什么是 AI 搜索?现在有哪些是 AI 搜索还不能替代传统搜索引擎的?
A:我理解的话,AI 搜索就是机器开始主动理解人的需求,精准生成返回符合人类意图的结果。过去因为技术的限制,机器不能真正理解信息内在的含义和信息之间的关系。比如说我搜 AI 搜索引擎有哪些,传统搜索只能通过关键词的检索或排名的排序算法返回相关的网页,而我们需要在这些大量的网页中去一个个去筛选、整理。随着大模型的诞生,大模型通过学习大量的文本数据,它开始理解事物的含义及事物之间的背后的关系,给出你最终想要找到的一个答案。
当然现在 AI 搜索也有许多地方是不能替代传统搜索引擎的,比如说我最近在搜索关于支付宝如何缴费医保的问题,好像涉及到这种图文并茂的操作流程,传统搜索引擎会有它的优势。然后还有需要搜索特定的网站,比如我搜索阶跃星辰开放平台,它是需要我在这个平台上面做交互的,但是 AI 搜索它显然还不能做到跟特定垂直网站进行交互。
Q:现在 AI 搜索的行业格局是什么样的?
A:目前来看,AI 搜索在市面上的产品主要分为几个阵营:一个是大厂比如说 360 AI 搜索、腾讯、知乎直达等;然后是Miku、秘塔等初创企业;还有就是独立开发者,比如 ThinkAny。特别有意思的一个点是,大厂的 AI 搜索基本上都是后面才加入到这个赛道的。当时秘塔跟 Miku 上线的时候还没有 360 AI 搜索或者知乎直答这些大厂的 AI 搜索产品。
目前总体来说大家也都在盲人摸象,还没有真正跑通整个商业模式。本质还是因为目前市面上相关的 AI 搜索产品产生的价值还达不到用户付费的需求。我们在 6 月份的时候就已经意识到了这一点,所以增加了知识库的功能,应该是国内最早提出 AI 搜索加知识库这个想法的,后来腾讯的 Ima 也相继推出了 AI 搜索加知识库。大家现在还是在 AI 搜索基础上,通过丰富各种组合去挖掘 AI 搜索最大的价值。只有 AI 搜索产生真正足够的价值,才会产生商业模式。
Q:作为初创公司如何去赢得竞争?
A:初创者不适合做通用搜索,适合做垂直领域。初创公司要卷 AI 搜索这个赛道,以传统搜索引擎的商业模式,最后是很难能活下来的。对于我们这种初创小团队来说,更重要的还是把资源集中在一个比较垂直的点上去突破。我们也在找一个更加垂直,但是消费意愿又很高的场景去探索,通过这些垂直的场景把每个功能点打磨到极致,然后再回到通用的场景,这样对于初创小团队来说会提高成功的可能性。比如我们现在正在探索的日本温泉酒店的一个冷门场景,但是它的垂直领域有特别丰富的知识库。我们会思考如何让 Agent 自主去挖掘更多数据,或者说如何构建一个更丰富的垂直知识库,Agent 自主学习的能力和非结构化数据的处理能力会变得越来越重要,这个场景探索完也会反哺到 Miku 通用能力身上。
另外一个机会的话,目前有很多 AI 工具和 AI 开放平台,初创团队可以在没有大规模人力资源的情况下,快速高效地实现目标。借助这些工具,让我们能够以更低的成本、更快的速度进入市场,与大型公司竞争。
Miku 是一个什么样的产品?关键的里程碑事件可以梳理一下吗?
A:Miku 最初的诞生是来源于解决”人类一生的时间很短暂,我们很多时候大多数时间都是花在重复无聊的工作上,我们应该花更多时间去做自己想做有意义的事情,体验生活,追随梦想热爱...“的信念,所以内心一直想要打造一个解决人们繁琐工作的超级助手,让人们更多时间花在有意义的事情上。于是大模型时代的到来Miku 诞生了。
Miku 是 AI 搜索加知识库的一个 AI 信息官,它会自动地处理我们日常的资料收集和分析工作,同时会将我们每次搜索的任务量化成一个知识结构,成为我们第二大脑。Miku 的最终愿景是想彻底改变人类与知识、与工作、与创造力本身的关系,让你从繁琐的资料收集和初步分析中解脱出来,专注于真正需要人类独特洞察力的任务。在 Miku 的世界里,每个人都有机会成为一个思想家、创新者和问题解决者。我们目前主要在 Multi-agent system、数据挖掘以及知识库上下功夫。
关键的里程碑事件的话,1.0 版本的诞生当时就只有一个简单的搜索功能。不久后增加了 Agent Manager 的角色去更好地进行意图识别和策略的召回,分为简单和深度两个模式。接下来,我们开发了一个基于 Multi-agent system 的报告生成功能,可以根据用户的需求生成对应知识领域工作场景的报告。
第四阶段我们增加了知识库功能。因为用户搜索会留存大量记录,为了更好的利用这些记录,于是每次搜索完之后会打标签,进行量化的数据分析,形成用户自己的知识库。
再后面,我们打通了跟微信的连接策略,帮助用户订阅微信公众号,存储用户感兴趣领域的公众号文章。接下来我们会上线知识图谱功能,帮助用户更好地追踪和管理自己的知识体系。
Miku 的下个阶段将重点在垂直领域发力,保持通用能力的同时将重点体现在垂直领域的 Agent 能力,效果的体现主要取决于团队对该垂直领域的工作流理解以及该领域的优质信息源。
Q:一个好的信息官应该是什么样的呢?
A:一个好的信息官能够最精准地解决用户的问题。比如我问它 AI 搜索引擎有哪些?我想要的是其实就是有哪些产品以及每个产品大概的介绍和相关网址就够了,不用给我太多冗余或是无效的信息。而且它在帮我整理信息的过程中,能帮我量化出背后的知识结构,比如市场、竞品分析或是帮我形成一个关于产品之间的一个知识图谱,也可以就是纳入到我的知识库帮助我实时地追踪知识的积累。
Q:为什么会选择阶跃的模型?
目前我们接入的是 Step-2 大模型。比较满意的是它在意图识别、理解用户语义效果出色,还有就是上下文理解能力突出。AI 搜索返回的网页是大量的长文本,Step-2 在颗粒度方面的理解和捕捉比较细致,不会丢失关键信息。比如用户输入查询苹果的价格,可能是苹果官网的价格,也可能是作为水果的苹果价格。每个用户都有自己的丰富的个性化档案,模型会根据个性化档案输出答案。但有的其他模型就不会特别稳定,太长的文本输入会丢失掉关键信息特征,导致有时候理解成苹果水果价格,有时候又理解成苹果手机价格,不能一次性命中,但 Step-2 就可以做到。
Q:怎么理解 Miku 是一个 Agent-based 的AI搜索?
我们和其他搜索引擎最大的差异是,我们是有自研的 Agent 引擎,Miku 从开始搜索到输出的过程都是由 Agent 在驱动的。它首先会理解用户的意图,然后再基于我们系统本身设定好的用户个性化档案去做意图分析。它可以分发生成适配这个问题的不同的 Agent ,每个 Agent 会对用户的意图进行拆解,生成相关的关键词,再去调用搜索引擎返回相关的网页。再基于用户的意图、个性化档案及问题去做 RAG 召回,最终返回相关的信息整理成答案。
它背后涉及到了大量的 Agent 任务分发的决策,所以也会有一个 Agent Manager 去主导分发这个过程。Agent Manager 有点像我们的一个项目经理,将不同的项目分发到最适合做这件事的人。我们可以把每个 Agent 理解成这个人。比如我问一个计算问题,如果大模型解决这个问题的效果不好,它就会分发给专门处理计算的这个 Agent。
我们有一个专门生成报告的 Agent 团队。普通人搜索某个产品相关信息可能给出的回答就比较简洁。而如果我的个性化档案显示出我是一位产品经理,那么 Miku 可能会推测我要一份竞品报告,它就会调用一个 Agent 团队,包括市场分析师,算法工程师等,它们通过问答的形式进行讨论,最终再交给一个 Agent 撰写总结报告。
Q:从 AI 搜索过渡到 agent 会是什么样的过程呢?
AI 搜索一定是打开 Agent 的入口,因为它本质上解决的是获取信息的问题。Agent 作为智能体能够做出正确的决策、规划和行动,实现这个的基础是保证其能够获取充分足够的上下文信息,而获取足够的上下文信息的关键因素是通过AI搜索挖掘不同的符合用户意图的信息。所以对于 Agent 来说,AI 搜索只是获取信息的工具。MIKU目前正在研究数据挖掘Agent,以及能够根据项目说明文档自主学习和开发的Agent,而这一切都离不开强大的AI搜索能力的支撑。
Q:用户通常会在哪些场景下使用 AI 搜索?
A:我们从后台数据其实也能发现,大部分用户的搜索场景大部分是是事实类的查询和定义类的查询,这类查询 AI 往往能够直接输出结果。第二类场景是用户需要对比分析类的查询,通过 AI 归纳总结。
Q:早期阶段怎么获取用户?
A:我们有一个 AI 自媒体社区 GeekSavvy,通过这个渠道以及其他社群挖掘招募了一批 Miku 的先行者,建立了种子用户群,大部分都是高认知用户。功能上新时,我们会在第一时间发布到群内,他们会积极地提出反馈建议。比如我们最近要上的知识图谱功能,他们就会基于自己所在的行业领域提出见解和意见,探讨怎么把知识图谱更好地呈现给用户。不过目前的用户更多是自然增长流量。
Q:很多优质的内容是被锁在单一的私域生态里面的,搜索引擎是无法触达跟抓取,这个问题 AI 搜索可以突破吗?
确实是的,特定的网站是有很高的搜索价值的,我觉得这个是接下来可能大家都会选择的一个方向。现在已经有一些搜索产品和 Agent 已经能实现用户与特定网页的交互了,只是说还没有做出进行数据挖掘的 Agent,不过未来是一定会实现的。通过智能体的决策结合传统的爬虫工具,让 Agent 自主地分析不同网页结构,然后生成抓取代码,做到批量化的处理。
Q:做 AI 应用现在最重要的是什么?怎么找到这个 AI 应用PMF?
A:一方面就是他是否真正的能解决用户的问题,第二个方面就是它解决的问题能给用户带来的价值有多大?现在有很多 AI 产品解决的很多都是伪需求,娱乐性比较高,但并不能真正解决到用户问题。其实 AI 搜索前期也一样的,当时我们都觉得 AI 搜索它帮助我们去节省网页筛选的时间,已经足够产生价值了,但是后面慢慢发现它产生的价值还不够足以让用户去产生付费。所以最重要的话第一个点肯定是要真正能解决用户的一个问题,第二个的话就是解决这个问题产生的价值是否足够让用户产生付费冲动,我觉得这才是最关键,也是值得我们这些 AI 应用开发者真正去思考的一个地方。
文章来自于“阶跃星辰开放平台”,作者“阶跃星辰开放平台”。
【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。
视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/
项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。
项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/