
基于 LLM 的查询扩展:信息更全,搜索更准
基于 LLM 的查询扩展:信息更全,搜索更准最初,查询扩展是为那些靠关键词匹配来判断相关性的搜索系统设计的,比如 tf-idf 或其他稀疏向量方案。这类方法有些天然的缺陷:词语稍微变个形式,像 "ran" 和 "running",或者 "optimise" 和 "optimize",都会影响匹配结果。虽然可以用语言预处理来解决一部分问题,但远远不够。技术术语、同义词和相关词就更难处理了。
最初,查询扩展是为那些靠关键词匹配来判断相关性的搜索系统设计的,比如 tf-idf 或其他稀疏向量方案。这类方法有些天然的缺陷:词语稍微变个形式,像 "ran" 和 "running",或者 "optimise" 和 "optimize",都会影响匹配结果。虽然可以用语言预处理来解决一部分问题,但远远不够。技术术语、同义词和相关词就更难处理了。
知乎直答默默掏出了自己的“底牌”。为啥这么说呢?因为知乎不仅有自己的AI模型,还攒了十多年的中文高质量知识库,再加上真实的问答场景作为AI的“实战训练场”,简直就是AI界的“学霸”。有了DeepSeek-R1的加持,知乎直答的推理能力直接拉满,传统搜索看了直呼“内行”,妥妥成了AI时代的“搜索界天花板”。
“张小龙觉得对这个功能自己最满意的地方之一,就是一经发布几乎没有改进余地而稳定运行了十年。”极客公园创始人张鹏在与张小龙对话后,这样总结微信的产品逻辑。这一点在微信成为真正意义上的“国民社交App”之后,也没有发生改变。
AI搜索“老大哥”Perplexity,刚刚也推出了自家的Deep Research——随便给个话题,就能生成有深度的研究报告。
早在2024年5月,DeepSeek-V2就凭借GPT-4的百分之一的价格,被称作“价格屠夫”、“AI界的拼多多”,彼时,它带来的冲击还停留在底层模型竞争中的定价等具体动作。
Perplexity CEO Arvin Srinivas 在今天 CNBC 采访中谈到了 Perplexity 与 DeepSeek 的整合,以及作为美国初创公司如何确保用户数据安全、避免审查问题,并提出了其与 TikTok 合并的战略构想。
DeepSeek千般好,万般好,就是联网搜索还用不了.但先别急,这块拼图也被国产AI搜索玩家用自己的能力补全了: 就在刚刚,秘塔AI搜索宣布融合了DeepSeek-R1满血版。
自Perplexity官宣引入广告后,AI搜索再次成为关注焦点。而我们国内创业团队这边,也传来了新消息——Hika AI,一个仅由5人打造的AI搜索,上线不久竟能和国外当红顶流同台竞技了?!
大模型,三十年搜索战争的收官一战。2010 年,十年你追我赶,百度谷歌之战,以百度胜利暂时落下帷幕。那时,所有人都以为,全世界范围内的搜索之战,自此落幕,谷歌、百度两大巨头分别占领两大市场,360、 bing 等则依靠搜索产品的带动,分食长尾市场。
我最近发现,秘塔 AI悄悄上线了一个「阅读模式」,在手机上读PDF体验非常爽,虽然不是大功能,就是那种会让你觉得用了很舒服的小细节。