大厂要出“框”,小厂要入“框”
下半年,搜索领域变得热闹起来。
8月27日,夸克发布全新PC端,整合AI搜索、AI写作、AI PPT、AI文件总结等功能。差不多同一时间,字节继头条搜索、悟空搜索、闪电搜索之后,在移动市场上线“抖音搜索”App,第四次把脚踏入了搜索的“河”。9月4日,百度推出新搜索“文小言”,融合一系列能力后,提供“搜创聊”的体验。
三家动作各不相同,夸克希望补全在PC端的能力,赶上AIPC风口;字节则希望完善搜推一体化,巩固自身内容生态;百度则希望让文小言成为探索搜索4.0时代的“先锋”,提前卡位。如果把视线放到整个搜索领域,抖音、视频号在搜索框新增电商入口,这门古早的生意,又变得热闹起来。
百度副总裁、AI创新业务负责人薛苏认为,传统搜索与AI搜索有三个不同。一个是支撑技术上,AI搜索的底层是生成式大模型;其次是场景与需求差异,传统搜索用排序方式解决需求,而AI搜索则是用生成式方法;再次是在产品理念与定位上,存在工具性与人性的差异。
实际上,目前领跑“AI搜索”的大厂们,对于技术本身要保守得多。由于RAG与搜索的亲缘性,主导着当下国内AI应用开发。然而,OpenAI最近发布的新系列模型,为行业提供了新的参考:o1两个版本专注在推理上,不再通过prompt完成CoT(思维链),而是使用强化学习,执行链式思考。
即便学术界已在今年开始讨论RAT(RAG+CoT)的可行性,但国内巨头似乎还未将重心放在这里,反而更具现实主义地押注生态。相较而言,初创公司所面对的挑战要艰难得多,没有巨头那么多花式各样的“缝补布料”(生态),有且只有一身蛮力。
移动时代的老巨头们依托于生态优势,试图打通端与端、应用与应用、内容形式的隔阂——试图摆脱搜索框的束缚,从而在下个时代来临前,为通用搜索上竖起“盾”。而Kimi、智谱、MiniMax,则长袖善舞,想要找到更垂直的领域,完成数据的输入与输出,比如想尽办法附着在搜索框中。
眼下,搜索框成了钱钟书的“围城”,有人想打破,有人却在死命朝里钻。
分类目录、文本检索、整合分析、用户中心、生活生态圈,被归类为搜索的五个发展阶段。
五个发展阶段的确存在代际之分,但不是今是昨非。分类目录仍然在各应用中普遍存在,文本检索依然是爱如生古籍库这些文史类专用数据库中最基础的搜索形态,当下主流搜索市场仍以整合分析为主,至于用户中心与生活生态圈,还有待AI技术与端侧成熟。
去年以来,百度、阿里(夸克)、字节、360等传统搜索引擎厂商都推出了各自号称“AI搜索”的产品,实际上都只是完成了搜索AI化改造中的部分环节,包括结果上的智能化排序、推荐、关键词解析等。
无论字节完善搜推一体化,还是夸克补全PC端,抑或是百度推出“新搜索”,都表明巨头们视搜索为打开商业生态的一把“钥匙”。这便是字节始终不愿放弃搜索的核心原因,也恰好证明搜索本身在AI时代的重要战略价值。毕竟,学习和搜索是唯二的能够无限scaling计算能力,简单来说,因为豆包与内容生态的存在,字节不缺学习,缺的只有搜索。
而在搜索的AI化改造过程中,通用搜索至少面临着两重挑战,第一个来自端侧。
日前国内一家半导体公司表示,作为新业务板块,今年AI芯片市场的需求井喷,且大客户集中在国内互联网巨头。而Canalys日前发布的数据显示,处于中游的联想,其AIPC第二季度出货量环比增长228%。PC端之所以率先起量的核心原因,是办公智能化推动。因此,夸克8月末升级后,完成了移动端与PC端的布局,并上线了多种面向办公场景的功能,初步坐上了牌桌。
互联网公司推出适配端的产品,并不意味着AI搜索往后是一片坦途,在端的调用权限仍然在硬件厂商手中。早前,苹果在Apple Intelligence的发布会上,展现了一家硬件厂商如何通过端侧内置全系统调用工具,提供新的用户体验,甚至连第三方应用也得配合,显示出封闭生态下的硬件厂商,会更有主导权。
第二重考验是打破以移动App为首的信息孤岛,解决内容、场景、知识垂类间的隔阂。
阿里与腾讯在几个月时间内,先后打通了信息流(微信广告跳转淘宝天猫)与资金流(淘天接入微信支付),巨头间正在拆除藩篱。这一背景,对于通用AI搜索而言是一大利好。
百度在“文小言”的发布会上呈现了多种类搜索的探索,包括对话框式的传统搜索、交互式的AI助手、自主专题订阅,以及涉及到图文视频等媒介下的搜索等。传统订阅机制以App、内容平台为核心,例如微信公众号订阅。而文小言的“自由订阅”则呈现了“需求导向”的特点,例如按照关键词订阅,从而可以跨App与内容平台。
尽管“文小言”算得上是目前通用AI搜索最大胆的尝试,但从内容、产品、场景等层面来看仍有诸多挑战。
内容上,百度既有生态占比权重非常高,其他巨头的内容权重占比很低。产品方面,经历移动时代规训的用户,能否适应各种AI原生的交互形式,还有待观察。前文提到的“自由订阅”并没有在文小言界面中呈现,而是需要在与AI助手对话中才能实现。
“AI时代的超级应用,大概率会是一个AI助理”。诚如月暗杨植麟在最近的采访中所言,比起随时会被超越的大模型,现阶段资本和AI巨头更愿意把赌注压在看得见产品和增长的AI助手上。
OpenAI是指引的灯塔,AI助手成为了各家“秀肌肉”的窗口,从Sora到GPT-4o,凡是被OpenAI“鸽掉”的功能都被聚合在了国内的AI助手中。于是,在一个看似平平无奇的App中,同时可以验收大模型训练、推理、长文本、多模态、Agent等多项技术成果。
智谱把对话、AI生图、AI生视频、AI视频通话等统统打包进了智谱清言中,Minimax同样把对话、语音、AI生图、AI生视频、AI生音乐等功能内嵌入海螺AI当中。
追逐最前沿的技术,以此与传统的大厂作出区隔,成为了AI头部创业公司的选择。毕竟OpenAI式的叙事极具诱惑,据媒体报道,OpenAI正在洽谈新一轮融资,其估值达到了1500亿美元,对比中国大模型公司目前30亿美元的最高估值,差距相当于50个智谱和月暗。
大厂高调谈AI搜索,而AI公司却缄默不语,只是在其应用内部悄悄上线“联网”或“AI搜索”相关功能。一方面,国内的AI公司将AGI奉为圭臬,不愿意被贴上“AI搜索”的标签,像“Perplexity”一样把路走窄;另一方面,也暴露出其被互联网巨头围剿的困境。
阿里、百度、腾讯之长,恰恰是AI公司之劣势。内容、产品、场景、生态,大厂均已提前锁定,反观AI公司产品尚未成熟就被迫推向市场,宛如一个个“打黑工”的童工。智谱、月暗、Minimax等声称的“联网”与“AI搜索”本质上还是在“爬数据”,只不过内化为生成问答的步骤之一。上述的“爬”绕不过互联网大厂的生态藩篱,这意味着如果某厂拒绝向AI公司开放链接,那就有一定概率影响最后回答质量。
这过程中还存在一个问题,即缺乏场景支撑的搜索问答更加容易出现幻觉和泛化问题。假设将AI搜索和问答锁定在电商领域,就会自然划分出种草、交易、售后易等几个细分场景,无论是AI搜索还是数据反馈都能更加精准对应,如此迭代下来,远比毫无目的的搜索对话效果更强。当用户打开Kimi、海螺AI时,他们是茫然的,大部分人可能还得思考几秒提什么问题,但打开淘宝,用户的搜索是相对明确的。
为此,市面的AI助手都不约而同地弱化了“搜索”的标签。为了能建立集中获取数据反馈的渠道,在互联网大厂的地盘上,这些AI公司也只能低头,双手奉上投流“过路费”。为了解决问答不够垂和专,弥补场景缺陷,AI公司也在尝试通过专家数据标注和用户数据分类收集、处理等方式来解决。
每一次新技术升级和产品推出都能引发圈内的一次狂欢,帷幕落下,尚未有明确的数据证明带来了直接的用户或商业转化。靠资本去治疗AI公司的先天体弱,到底还能支撑多久?
时至今日,国内市场对AI助手的期待经历了“Copilot辅助”“效率工具”再到“Super App”的转变,其所承载的意义早已超过了本身。
从上文的描述中不难发现,围绕着AI助手和AI搜索,互联网大厂的思路是跳出“框”,进而去补足和强化生态体系;AI公司则在入“框”,把对话框视为与用户交互和反馈最有价值的渠道。
到现在,AI搜索在技术方面已经没有壁垒,模型推理能力的不足靠RAG缝缝补补,大厂和AI公司也能交出一份差强人意的答卷。对未来AI搜索发展可能会涉及几个方面:跨端、跨场景、跨数据、主动适应、自然语言唤起、多轮对话以及多步推理。
近期,OpenAI发布o1,将此前普遍运用于Agent训练的CoT技术自动化,实现模型的自我理解和进化,标志着大模型推理能力迈上新台阶。
从RAG到CoT,也将开启了AI搜索的新时代。CoT的本质是将复杂问题切分为若干个简单执行任务,重推理而弱化了搜索色彩,最后导向的方向是既垂直又精专。
OpenAI已经落子,国内大概率要follow。CoT就像给AI搜索再次开启了“加速器”,会进一步明晰化大厂与AI公司的分野。
对强技术而弱搜索生态的AI公司不失为一个好消息,从整体上提升模型推理能力,搜索和强化学习机制内化,不过多地展示过程和呈现参考资料,直接解决问题。毕竟,AI助手内的参考资料引用明为“提高准确率”,实则是给推理能力不足的大模型“开外挂”。
互联网大厂的落地在垂直场景中,“CoT自动化+Agent”也许是下一个“黄金拍档”,先理解、推理与制定计划,再由Agent执行。在娱乐、电商、社交等场景,既能简化跳转步骤,减少流程,还能直接替代用户上手操作。
短期内,AI搜索的产品形式不会有太大变化,但是速度和效果将会提升一个level,唯一需要考虑的因素是推理成本。
AI搜索是否需要以一个独立的产品存在值得商榷,毕竟国内已经有无数多的场景和产品可以嵌入。包括新生代的AI助手,如何与旧业务和产品融合打通,怎么在新场景中发挥其功能,可能才是众多玩家关注的重点。
文章来自于“光子星球”,作者“郝鑫,吴先之”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0