本年度最优秀的公关措辞出现了:没有“search”,就没有“research”。
上周末,知网指责秘塔搜索未经允许便收录自己的论文数据,向秘塔发出了告知函。
秘塔迅速给出回应,不仅反驳了知网的指控,获得了大量用户的共情和支持之外,还提到了一项重要的协议《布达佩斯开放存取倡议》,并以此作为自己对知识开放精神的背书。
开放”一直是互联网精神的核心构件。2002年,《布达佩斯开放获取计划》发布,该计划为首个开放获取倡议,该计划提议:通过由作者自行存档形成的OA知识库和OA期刊两种途径,实现对学术资源的自由获取。
严格来说,这项倡议并不完全适用于两者之间的纷争,更像是秘塔直接往知网脸上摔了一份倡议书。
知网既不是作者自发组织的非盈利组织,也不是倡议书所提出的OA期刊,仅仅只是一个平台。真要论起来,知网和秘塔都是内容聚合平台,怎么就这么大气性了?
借这次争议,秘塔也简单解释了一下自己的技术原理,并且强调了一点:秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,用户阅读正文仍需通过来源链接跳转至知网等网站获取。所以,这不算损害知网的权益。
在AI搜索大行其道的背景下,“跳转”被衬托得像是一个很古典的操作。
“跳转”之所以能够完成,是因为有超链接的存在——这项互联网最不可或缺的基础功能。
我们来快速回顾一下超链接的历史:Tim Berners Lee提出了一个连接全球、共享信息的想法,这就是万维网的雏形。很快,就出现了第一个网页浏览器、服务器和HTML技术。
超链接就是一种HTML元素,通过在标签中添加链接地址(URL),可以将内容与其他相关资源进行连接,实现网页之间的导航和信息组织。
随着互联网的发展,超链接的功能也在不断扩展。最初,超链接仅限于从一个网页跳转到另一个网页,现在已经可以用于更广泛的资源连接,如电子邮件、图片,不一而足。
在操作上,超链接赋予了用户至高无上的自主权。读者不再是被动地接受信息,而是可以根据自己的兴趣选择不同的阅读路径,从而增加了阅读的灵活性和参与感。而对于作者,超链接能让作者将相关的信息点串联起来,形成一个网络结构。
从一个链接,可以跳转到无数其它的内容上。这不仅丰富了内容的表现形式,也促进了知识的传播和共享。
而在意义上,超链接的引入改变了传统的线性文本结构,创造了超文本,“hypertext”。这个词前半为希腊语里的“hypér”,意为“在……之上、超越”。后半为拉丁语的“texere”,意为“编织”。来自于文本,却超越了文本,这是互联网超文本的意义所在。
二者互为表里:超文本是一种组织各种内容的机构,而超链接是实现这个结构的具体工具;因为嵌入了超链接,才形成了超文本。
正是因为超链接独特又重要的角色,蓝色+下划线的设计呈现被传承下来,以保证超链接能被用户快速识别。
至于为什么是蓝色——Berners Lee当年发明设计初代万维网时,很多电脑只支持黑白,在黑白的屏幕上,蓝色成了那个比黑色更深的颜色,得以跳出来,而且为了进一步保证它真的能被用户识别,还加上了下划线。
2014年时,Google在自家搜索页面的结果显示列表里,取消了默认下划线,当用户的鼠标悬停于链接上方时,才会显示。
同样是在这一时期,不少研究发现塞进了大量超链接的网页文本,虽然促进了用户的主动跳转和检索,但也加重了大脑的信息过载、注意力分散等问题。更糟糕的是,链接一旦失效,跳转不成功,却还留在字里行间,观感非常糟糕。
更何况,进入移动互联网时期之后,手机、平板等设备的显示屏不比电脑,太过于强调超链接的存在,只会诱发视觉疲惫。于是超链接一时间星光黯淡了不少。
在这方面,走得最极端的莫过于微信公众号。在2018年起,公众号平台就开始减少对外链的支持,后来更是直接取消了文字消息中包含的外链识别和跳转功能,只支持内链、小程序跳转,和认证账号添加外链。
当时微信挨了不少骂,可是快进到AI搜索出现之后,外链再一次“褪色”了。
AI加持后,超链接褪色
AI搜索的领头产品Perplexity给出了典型示范:在提出询问hyperlink简史之后,答案区分点分段,给出了一串综述。引用来源是以标注的形式,出现在段落末尾的。而点击一个引用链接,在跳转之后显示的一个网页,才生动展示了嵌入超链接之后的效果。
Perplexity的CEO曾经说过,他们是从自己作为学术人的经验出发,设计了显示引用来源这一产品特点。
但相比于Perplexity,Kimi反而更接近学术论文的引用方式:不仅在句子末尾做了标注,点击时,拉起右侧引用栏,会直接跳到被引用摘录的段落,更加具体准确。
而秘塔,一如它在回应中所说,的确为跳转动作提供了必要的支持。只不过,有些支持显得太聪明了点:在右侧的分栏,鼠标悬停上去之后每一条都反应是超链接,但全是内链,点击等于直接开启一个新对话。多点几个,就会在浏览器里形成一大串带着秘塔logo的标签页,非常有压迫感。
禁止套娃啊秘塔。
总体上,AI搜索在返送答案时,都非常工整,干干净净,没有任何一个字段是蓝色、有下划线的,也就是没有超链接。
当然,这是由AI搜索背后的技术——大语言模型——所决定的。它能够检索内容、善于组织语言,可以把海量的信息,整合在简洁明了的文字叙述里。
但是,插入超链接,而且还要准确地插入,就不是它能完成的了。相比于传统搜索引擎,AI实际上是一种对链接目标内容的提取,转化融进文本里,某种程度上就“吃掉”了超链接。
可如果没有了超链接,“search”的意义也会丧失。超文本之所以影响深远,是因为它让用户有更多自主行动的空间,可以沿着一条条链接不断深入。而AI介入之后,编织的工作是由大模型自动来完成,的确让用户更方便了,却也失去了很多主动性。
那么,现在还有简洁明了、行文工整、信息含量高,还提供超链接以便自由跳转的地方吗?
有的,大家也早就知道:维基百科。
维基媒体基金会及企业服务高级总监Lane Becker在接受采访时说,尽管AI搜索的能力越来越强,但目前没有数据显示维基百科的访问量在下降,更找不到可以完全怪罪于AI工具的地方。
这并不难理解:作为全球最大的在线百科,维基有最丰富、又最与时俱进的信息,眼下没有哪个AI搜索能完全跳过维基百科,或者完全不被它影响。维基也向企业开放了付费API,Google就是他们的第一个客户。
“我们相信人工智能的新浪潮可以带来巨大的机遇,它可以帮助更多人,以更多语言,更快地获取知识。”Lane Becker表示,维基组建了自己的机器学习团队,并且在开发相关的工具,不过,目标是为了更方便志愿者们编辑、维护词条内容。
一直以来,维基的使命都是创造每一个人可以自由分享所有知识的世界,维基百科中密密麻麻的超链接,正是这一使命的映射。
Perplexity等AI搜索在标记引用来源上不完善,损害的是版权方的权益;而褪掉所有超链接,只留下干净到光秃秃的文本,却是在削减普通用户的自主权。棘手的是,大模型吸收海量数据,生成的答案根本无从辨析来源,脚注、拉参考列表就够了,超链接已经失去意义。
Lane Becker说,他并不担心维基会被干掉,而是担心一种脱节。“如果知识产生的地方和知识消费的地方(例如GPT或者Google AI Overview)之间存在脱节,我们就有可能失去志愿者和他们贡献的知识。”
用户的主动性,既影响着他们自己的吸收,也影响着知识的流动,“当人们直接访问维基百科时,他们才更有可能成为志愿者、贡献者。”
文章来源微信公众号:APPSO ,作者“Selina”
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】metaso-free-api是一个逆向秘塔AI搜索的开源项目,它支持超强检索超长输出,支持高速流式输出、超强的联网搜索以及零配置部署。
项目地址:https://github.com/LLM-Red-Team/metaso-free-api