# 热门搜索 #
搜索
王小川首个AI应用来了,一手测评:有特点,但不完美
8932点击    2024-05-24 10:37

懂搜索,但又不止搜索


昨天,百川智能发布了新一代的基座大模型 Baichuan 4,同时推出了首款 AI 应用——百小应。


与市场上大部分大模型厂商一样,百川智能瞄准的是AI智能助手。有意思的地方是,虽然定位于AI 智能助手,但百小应主打的特点却是「懂搜索、会提问」。这点又与目前很火的 AI 搜索应用类似。


强调搜索特点,并不意外。王小川可以说是国内最懂搜索的人之一,其创立的搜狗长期稳坐搜索行业第二把交椅。AI搜索又是AI应用的三大场景,连OpenAI都在布局。


令人好奇的是,从移动互联网到生成式AI,王小川是如何理解搜索产品的变化?百小应与市面上的AI搜索产品又有什么不同?在百小应上线的第一时间,乌鸦君就上手用了下。今天,大家可以跟着乌鸦君,先来探探水。


01 懂搜索,但又不止搜索


从定位上,百川推出的“百小应”是一款类似于ChatGPT、Kimi的智能助手产品,不仅可以随时回答用户提出的各种问题,速读文件、整理资料、辅助创作等,还具备多轮搜索、定向搜索等搜索能力。


产品本身也具备多模态相关功能,用户可以上传图片、pdf等文档,让百小应辨别其中的内容,并且完成相应指令,如撰写文案等。


要说百小应与市面上智能助手产品最大的不同,还得是搜索功能。用王小川的话说,“百小应”的一大特点在于,可以让模型学会“多轮搜索”。


什么是“多轮搜索”?多轮搜索就是指,针对用户提出的问题,百小应能够更进一步,探究问题的核心答案。相比单轮搜索,在市场调研、产业分析等复杂场景下,多轮搜索能够有效地获取更专业、更有深度的信息。


在搜索结果呈现方面,与其他在单次搜索后简单总结网页信息的应用不同,百小应将能够搜索结果作为观点、论据直接应用到问答结果中,能够将搜索结果以表格等结构化形式呈现,优化信息布局,便于用户快速定位、解读所需信息。


尽管以“搜索“功能作为特点,但百川并不希望将其看做一款搜索+AI的产品。用王小川的话说,“如果是将搜索结果简单总结,搜索公司自己就可以做,不是创业公司做的事。”长期来看,AI助手将会从AI“工具”升级到“伙伴”。


也就是说,比起市面上直接给到搜索结果的搜索产品,百小应更愿意将搜索作为与用户互动的场景。


02 搜索功能一手测评:有特点,但并不完美


打开百小应应用,会直接出现一个对话框,这也是搜索功能的入口。



为了更好感受百小应与市面上AI搜索产品的差异,我们通过三个问题对百小应的AI 搜索实用能力进行了一个测试。


第一个问题是,杨立昆对AGI的看法。对于这个看似并不难的问题,百小应的回答令人意外:


杨立昆教授是中国科学院自动化研究所的研究员。同时,百小应也没办法给出杨立昆的观点,原因是:由于无法访问最新资料库,其无法提供最新观点。



对比之下,秘塔AI和Perplexity的表现要好很多。


秘塔不仅给出了杨立昆的部分核心观点,还对观点进行了梳理,形成了大纲。在回答的后面,还有与杨立昆相关的信息、事件科普。



Perplexity尽管不能做到像秘塔一样详细,但至少能给到一些核心观点,算是基本合格。



就算是与同样定位于AI助手的Kimi,至少给出了杨立昆的一些基本资料和笼统的观点。



问题二是,AI搜索与传统搜索相比有什么不同?对于这个问题,秘塔的表现一如既往地稳定,既有整体的总结,又有要点的分类。



Perplexity则直接给出了AI搜索与传统搜索的6个不同点,从要点总结来看,Perplexity与秘塔略有差异。



再来看百小应的表现,百小应同样给出了五点不同分别是:搜索结果的相关性、交互方式、学习与优化、搜索结果呈现、搜索引擎的智能化程度。



不仅如此,百小应还基于用户AI搜索的信息需求更进一步,给出了百度、谷歌在AI搜索领域的实际应用案例。至少在这个问题上,百小应在与秘塔和Perplexity的对比中没有落于下风。



在这里,乌鸦君还多问了一句:在AI搜索上,秘塔和百度谁更有优势?百小应并没有直接给出结论,反而分别给出了秘塔和百度各自的优势,甚至还做了表格。更多样的结构化呈现形式,也是百小应的一大特色。


从前两个问题看,相比秘塔和Perplexity,百小应在信息准确性上表现很不稳定。要想把 AI 搜索真正用到工作里,比起什么连续对话和实时性,答案的准确度才是优先考虑项。


所以,最后的测验里,乌鸦君特地挖了一个坑,问了一个根本不存在的数据:拼多多2010年的用户数量?


百小应不仅没有上套,还直接点破了这个套路:拼多多成立于2015年9月,所以2010年没有用户数据。



Perplexity也没有上套,不仅给出了正确信息,还围绕拼多多用户表现这一信息点,给出了更多的相关信息。



让乌鸦君没有想到的是,之前表现很不错的秘塔,却在这个问题上犯晕了。虽然秘塔在总结里说的是,没办法给到拼多多2010年的数据,但在概括里仍然给到了一个错误事实:拼多多成立于2010年。



三轮测试下来,除了Perplexity表现稳定外,百小应与秘塔在信息准确性都“翻了车“,相比之下,百小应的错误要更严重一些。


百小应对杨立昆AGI观点的事实错误,一部分原因是模型知识库造成的信息实时性不足。


比如,当我向百小应提问,评价一下GPT-4o?百小应会回答,数据知识更新日期为2023年,没有相关资料。但如果你把同样的问题给到秘塔和Perplexity,它们却能够给出有关GPT-4o的最新资料。



这与百小应产品定位有很大关系。百小应的定位是类似于ChatGPT的个人助手,这意味着其信息获取依赖于模型的训练数据,而AI搜索则可以实时抓取最新的网络信息,因此在信息实时性上更有优势。同样的Kimi也没办法给出GPT-4o的评价。


根据其他媒体的说法,在对百小应进行提问的时候,不一定会触发搜索功能。不过这样设计多少令人感到奇怪:


虽然定位于个人助手,但百小应在对外宣传时强调的是,搜索技术和大模型深度融合。“懂搜索的AI助手”,也是百小应的Slogan。但在实际使用过程中,无法像市面上AI搜索一样完成实时信息的获取,对用户体验影响极大。


当然,考虑百小应刚刚上线,这些不完善也能够理解,期待后面产品有进一步改善。


文章来源于“乌鸦智能说”,作者“智能乌鸦”



AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

3
秘塔AI

【开源免费】metaso-free-api是一个逆向秘塔AI搜索的开源项目,它支持超强检索超长输出,支持高速流式输出、超强的联网搜索以及零配置部署。

项目地址:https://github.com/LLM-Red-Team/metaso-free-api

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/