ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
知网28页文件控诉秘塔背后,AI搜索让超链接失去意义了吗
5548点击    2024-08-20 09:38


本年度最优秀的公关措辞出现了:没有“search”,就没有“research”。


上周末,知网指责秘塔搜索未经允许便收录自己的论文数据,向秘塔发出了告知函。



秘塔迅速给出回应,不仅反驳了知网的指控,获得了大量用户的共情和支持之外,还提到了一项重要的协议《布达佩斯开放存取倡议》,并以此作为自己对知识开放精神的背书。



开放”一直是互联网精神的核心构件。2002年,《布达佩斯开放获取计划》发布,该计划为首个开放获取倡议,该计划提议:通过由作者自行存档形成的OA知识库和OA期刊两种途径,实现对学术资源的自由获取。



严格来说,这项倡议并不完全适用于两者之间的纷争,更像是秘塔直接往知网脸上摔了一份倡议书。


知网既不是作者自发组织的非盈利组织,也不是倡议书所提出的OA期刊,仅仅只是一个平台。真要论起来,知网和秘塔都是内容聚合平台,怎么就这么大气性了?


借这次争议,秘塔也简单解释了一下自己的技术原理,并且强调了一点:秘塔AI搜索的“学术”版块仅收录了论文的文献摘要和题录,并未收录文章内容本身,用户阅读正文仍需通过来源链接跳转至知网等网站获取。所以,这不算损害知网的权益。


在AI搜索大行其道的背景下,“跳转”被衬托得像是一个很古典的操作。


超链接:互联网开放精神之所在


“跳转”之所以能够完成,是因为有超链接的存在——这项互联网最不可或缺的基础功能。


我们来快速回顾一下超链接的历史:Tim Berners Lee提出了一个连接全球、共享信息的想法,这就是万维网的雏形。很快,就出现了第一个网页浏览器、服务器和HTML技术。


超链接就是一种HTML元素,通过在标签中添加链接地址(URL),可以将内容与其他相关资源进行连接,实现网页之间的导航和信息组织。


随着互联网的发展,超链接的功能也在不断扩展。最初,超链接仅限于从一个网页跳转到另一个网页,现在已经可以用于更广泛的资源连接,如电子邮件、图片,不一而足。


在操作上,超链接赋予了用户至高无上的自主权。读者不再是被动地接受信息,而是可以根据自己的兴趣选择不同的阅读路径,从而增加了阅读的灵活性和参与感。而对于作者,超链接能让作者将相关的信息点串联起来,形成一个网络结构。


从一个链接,可以跳转到无数其它的内容上。这不仅丰富了内容的表现形式,也促进了知识的传播和共享。


而在意义上,超链接的引入改变了传统的线性文本结构,创造了超文本,“hypertext”。这个词前半为希腊语里的“hypér”,意为“在……之上、超越”。后半为拉丁语的“texere”,意为“编织”。来自于文本,却超越了文本,这是互联网超文本的意义所在。


二者互为表里:超文本是一种组织各种内容的机构,而超链接是实现这个结构的具体工具;因为嵌入了超链接,才形成了超文本。



正是因为超链接独特又重要的角色,蓝色+下划线的设计呈现被传承下来,以保证超链接能被用户快速识别。


至于为什么是蓝色——Berners Lee当年发明设计初代万维网时,很多电脑只支持黑白,在黑白的屏幕上,蓝色成了那个比黑色更深的颜色,得以跳出来,而且为了进一步保证它真的能被用户识别,还加上了下划线。


2014年时,Google在自家搜索页面的结果显示列表里,取消了默认下划线,当用户的鼠标悬停于链接上方时,才会显示。


同样是在这一时期,不少研究发现塞进了大量超链接的网页文本,虽然促进了用户的主动跳转和检索,但也加重了大脑的信息过载、注意力分散等问题。更糟糕的是,链接一旦失效,跳转不成功,却还留在字里行间,观感非常糟糕。


更何况,进入移动互联网时期之后,手机、平板等设备的显示屏不比电脑,太过于强调超链接的存在,只会诱发视觉疲惫。于是超链接一时间星光黯淡了不少。


在这方面,走得最极端的莫过于微信公众号。在2018年起,公众号平台就开始减少对外链的支持,后来更是直接取消了文字消息中包含的外链识别和跳转功能,只支持内链、小程序跳转,和认证账号添加外链。


当时微信挨了不少骂,可是快进到AI搜索出现之后,外链再一次“褪色”了。


AI加持后,超链接褪色


AI搜索的领头产品Perplexity给出了典型示范:在提出询问hyperlink简史之后,答案区分点分段,给出了一串综述。引用来源是以标注的形式,出现在段落末尾的。而点击一个引用链接,在跳转之后显示的一个网页,才生动展示了嵌入超链接之后的效果。



Perplexity的CEO曾经说过,他们是从自己作为学术人的经验出发,设计了显示引用来源这一产品特点。


但相比于Perplexity,Kimi反而更接近学术论文的引用方式:不仅在句子末尾做了标注,点击时,拉起右侧引用栏,会直接跳到被引用摘录的段落,更加具体准确。



而秘塔,一如它在回应中所说,的确为跳转动作提供了必要的支持。只不过,有些支持显得太聪明了点:在右侧的分栏,鼠标悬停上去之后每一条都反应是超链接,但全是内链,点击等于直接开启一个新对话。多点几个,就会在浏览器里形成一大串带着秘塔logo的标签页,非常有压迫感。




禁止套娃啊秘塔。


总体上,AI搜索在返送答案时,都非常工整,干干净净,没有任何一个字段是蓝色、有下划线的,也就是没有超链接。


当然,这是由AI搜索背后的技术——大语言模型——所决定的。它能够检索内容、善于组织语言,可以把海量的信息,整合在简洁明了的文字叙述里。


但是,插入超链接,而且还要准确地插入,就不是它能完成的了。相比于传统搜索引擎,AI实际上是一种对链接目标内容的提取,转化融进文本里,某种程度上就“吃掉”了超链接。


可如果没有了超链接,“search”的意义也会丧失。超文本之所以影响深远,是因为它让用户有更多自主行动的空间,可以沿着一条条链接不断深入。而AI介入之后,编织的工作是由大模型自动来完成,的确让用户更方便了,却也失去了很多主动性。


那么,现在还有简洁明了、行文工整、信息含量高,还提供超链接以便自由跳转的地方吗?


有的,大家也早就知道:维基百科



维基媒体基金会及企业服务高级总监Lane Becker在接受采访时说,尽管AI搜索的能力越来越强,但目前没有数据显示维基百科的访问量在下降,更找不到可以完全怪罪于AI工具的地方。


这并不难理解:作为全球最大的在线百科,维基有最丰富、又最与时俱进的信息,眼下没有哪个AI搜索能完全跳过维基百科,或者完全不被它影响。维基也向企业开放了付费API,Google就是他们的第一个客户。


“我们相信人工智能的新浪潮可以带来巨大的机遇,它可以帮助更多人,以更多语言,更快地获取知识。”Lane Becker表示,维基组建了自己的机器学习团队,并且在开发相关的工具,不过,目标是为了更方便志愿者们编辑、维护词条内容。


一直以来,维基的使命都是创造每一个人可以自由分享所有知识的世界,维基百科中密密麻麻的超链接,正是这一使命的映射。


Perplexity等AI搜索在标记引用来源上不完善,损害的是版权方的权益;而褪掉所有超链接,只留下干净到光秃秃的文本,却是在削减普通用户的自主权。棘手的是,大模型吸收海量数据,生成的答案根本无从辨析来源,脚注、拉参考列表就够了,超链接已经失去意义。


Lane Becker说,他并不担心维基会被干掉,而是担心一种脱节。“如果知识产生的地方和知识消费的地方(例如GPT或者Google AI Overview)之间存在脱节,我们就有可能失去志愿者和他们贡献的知识。”


用户的主动性,既影响着他们自己的吸收,也影响着知识的流动,“当人们直接访问维基百科时,他们才更有可能成为志愿者、贡献者。”


文章来源微信公众号:APPSO ,作者“Selina”


关键词: AI , AI纠纷 , AI版权 , AI搜索 , 秘塔AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

3
秘塔AI

【开源免费】metaso-free-api是一个逆向秘塔AI搜索的开源项目,它支持超强检索超长输出,支持高速流式输出、超强的联网搜索以及零配置部署。

项目地址:https://github.com/LLM-Red-Team/metaso-free-api