ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI大模型搜索之战开启,胜出黑马竟是ta?
5196点击    2024-04-09 14:52

【新智元导读】距离AI「杀死」搜索引擎,到底还差几步?


几天前,ChatGPT突然官宣免注册,让网友直呼AI取代搜索引擎的宏伟蓝图已经拉开帷幕。


就像搜索引擎在2000年后逐渐成为了全世界互联网的大门一样,如今LLM的迅猛发展似乎也标志着互联网即将进入Gen AI时代。



ChatGPT、Gemini、Copilot等AI工具,让我们在线查询和消费的信息的方式,正在发生翻天覆地的变化。


Perplexity和You.com,已经将自己定位为下一代搜索产品。连谷歌和必应,都押注AI是搜索的未来。


那么问题来了,AI大模型真的能取代搜索引擎吗?


理论上,当然存在这种可能。但前提是能够做到以下两点:


1. 对于用户的问题,能否找到相关、可信的来源,从而给出准确的答复。


2. 对于用户有时效性的问题,能否找到最新的来源。


现在国内的各个大模型产品,能完成这两项任务吗?


话不多说,让我们把这些AI拉出来遛遛,在各种搜索任务上,来一番实测PK。


LLM VS 搜索引擎


此次参与搜索竞赛的,不仅有老牌搜索引擎,还有国外很火的模型A,以及国内主流的大模型选手B、C、D。


赛事第一项,考核的就是时效性。


我们先来问一个既隐含时间信息,表述又比较模糊的问题:「百度接下来会举办什么发布会么?」


显然,传统搜索引擎既不能准确定位时间信息,也无法直接理解基于自然语言的提问。


小试一下就知道,传统搜索会帮你删减一些它认为「不关键」的关键词。



而模型A很快就找到了5个新闻地址,但由于无法识别当前的时间信息,结果把百度去年举办的活动搬了出来。




模型B的答案要更加完善,但同样没搞清楚时间,给出的是往届发布会的信息。



模型C准确识别出了小编提问的时间是在4月7日。


然后很轻松地将搜索的时间点卡在7日之后,并具体列出了接下来百度即将召开的三个会议。


不过,没有参考连接这一点,有些遗憾。



相比之下,模型D的答案就比较惊艳了。


它不仅回答准确,而且最大的亮点是,在联网搜索后给出了参考链接,能够溯源验证信息。



内容虽然相对简洁,但精确回答了问题,也引用了完整的参考文献


PK赛的第二项,就是总结的完整度。


清明假期的一匹黑马,就是宫崎骏的动漫电影《你想活出怎样的人生》了,刚刚票房已破了8.55亿元。电影到底讲什么了呢?


传统搜索引擎只会搜什么,给什么,呈现了观影评分、网友评价,却无法对影片进行总结。



模型A则从主题内涵和评价分歧两方面进行了分析,似乎更有条理。




不过,这里的参考链接「2」直接对应的是「知乎登录验证」,也不知道模型A最后是怎么绕过去的?



模型B则给出了3篇参考文章,以及更加丰富的回答。


但遗憾的是,它搞错了主角的名字——原著是叫「小哥白尼」,在电影中则是「牧真人」。




同样,模型C也把主角在原著和电影里的名字给搞混了。



模型D在熟读3篇文章之后,从影片的主旨核心,叙事风格进行了总结。



经过小编的验证,所有参考链接也都可进入查询。



综合能力如何?


从上面的PK中不难看出,模型D可以说是几位选手里最有潜力的存在。


不过,正如文章开篇所提到的,大模型如果想「接替」搜索引擎,就必须能够针对用户的问题找到实时且正确的来源,并给出准确的回答。


时效性


首先,在时效性方面,选手D可以精准地搜出事件发生的时间。


比如,「探索一号」科考船圆满完成首次中国-印度尼西亚爪哇海沟联合深潜科考航次任务的时间是3月28日。



相关性


而在准确性方面,选手D的表现尤为出色。


它不仅根据非常简短的搜索词「NAKAKITA招聘」,找到对应的官网。


而且还能准确地判断出问题中的关键「招聘」,并对网站内容进行详细的搜索。然后,进一步给出了正确的结论——官网上没有与招聘相关的内容。




当然,除了搜索能力之外,大模型到底好不好用,还需要全方位地考察一下才行——


文档解析


话不多说,接下来我们就加大难度。


首先,上传一个文档,要求画出折线图,显示连板变化,数据在文件中,x轴是日记,在开始画的位置写上股票名称,每次发生变化都要写。



原始数据


如此细节的要求,它都一一做到了,丝毫不差。




然后,再要求在另一份表格中空白的单元格中都填上1,它也圆满完成了。




更多功能


此外,选手D在图片生成、图片描述、文字提取等多模态领域的表现,也十分出色。



而最近大热的智能体功能,它甚至可以完美支持PC、App和小程序三个入口。



到这里,我们就可以揭秘选手D的身份了,它就是——智谱清言。


来自国内唯一一家全模型产品线对标OpenAI的企业智谱AI


大模型取代搜索引擎,可能性多高?


众所周知,大模型相比于传统搜索引擎有着更强的问题分析、归纳总结、理解和推理能力,让我们不必再去研究需要使用哪些「关键词」才能找到自己想要的内容。


但卡脖子的地方在于,大模型训练数据的时效性。


ChatGPT虽然打开了认知,让AI模型更像大模型了,但它还并未用到实时搜索。


而国内的这些模型,则给了我们更多希望。


当大模型工具能够整合先进的数据抓取和整理能力时,就能形成全新的搜索引擎链条:


首先AI会根据提问进行需求分析-网页搜索–答案归纳,然后通过自然语言对话的方式直接回答问题,从而实现与用户更好地交互,而不仅仅提供一系列网站链接。


所以,现在AI大模型究竟离搜索引擎有多远呢,它们能杀死谷歌吗?


让我们从细处着眼。


当我在讨论搜索引擎的时候,我在讨论什么?


这里贡献一个冷知识:每年都有大量的人去谷歌搜索框中,输入「谷歌」两个字。



其实,并没有那么多人去谷歌上查找难以访问的科学信息,但用它查找邮箱、购物网站的人,要多出几个数量级。


或许,摆在这些潜在的谷歌杀手AI面前的问题,不是它们找到信息的能力,而是它们是否能做搜索引擎能做的一切。


1. 网站导航


其实,搜索引擎的最主要工作,是把我们带到一个网站。


Google上所有排名靠前的查询,从「YouTube」到「Yahoo Mail」,都是导航查询。


但AI机器人往往会思考几秒钟,然后提供一堆公司信息,但可能并没有链接到Amazon之类的具体网站。


2. 信息查询


对于体育比赛比分、现在几点了之类的实时信息,谷歌都做对了,而AI工具往往都会过时(原因如上文所示)。


并且,谷歌往往会有关于你特定位置、背景的信息,而AI机器人很多都没有。


当然,如果查找「一年有多少周」这种问题,AI产品往往会给我们惊喜。


谷歌会回答:52.1429周。


而Perplexity和智谱清言则给出更加全面的答案——不仅分别考虑到了平年和闰年的情况,而且还给出了计算过程,非常清晰易懂。




3. 探索性查询


「如何打领带」、「为什么会发明电锯」类似的问题,都属于探索性的查询。


这些问题往往没有单一答案,而是学习过程的开端。


就比如,你在谷歌查找一位歌手,或者NASA历史之类的问题,这时的你就是在探索。


这并不是人们使用谷歌的主要目的,但正是AI搜索工具大放异彩的时刻。


比如,针对「为什么发明电锯」这一问题,Perplexity就会给出电锯的医疗起源,并描述其技术演变过程,最终被伐木工人采用。



4. 参考链接引用


AI搜索工具最大的亮点之一,便是提供了引用来源的链接。


这意味着,如果用户在搜索结果中发现了一个特别感兴趣的事实,可以点击链接,进入原始出处获得进一步了解。


总之,当我们谈起搜索引擎,最大的问题恐怕不在于技术,而在于产品。


如果将以上问题一一解决,同时探索出合适的商业模式和结构,AI取代搜索引擎,应该就不远了。


那时,我们搜索时会出现的,不仅仅再是简单的链接罗列,而是一个开门见山的准确答案。


参考资料:

https://www.theverge.com/24111326/ai-search-perplexity-copilot-you-google-review

https://chatglm.cn/main/alltoolsdetail


文章来自微信公众号“新智元”,作者:新智元


关键词: AI搜索 , AI大模型 , ChatGPT , LLM
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/