# 热门搜索 #
搜索
沉默了很久的知网,对 AI 重拳出击了
4907点击    2024-08-20 10:27

知网何必呢?


知网又又又搞事情了。


就在前两天,上海秘塔网络科技有限公司发布声明,表示自己在 15 号的时候,收到了一份侵权告知函。


这个告知函洋洋洒洒总共写了足足 28 页,省流版就是一句话: “秘塔 AI 搜索,能够检索出我家的学术文献题录和摘要数据,侵权了” 。




那目的其实也很明显,原文里明明白白写了: “如需商务合作,请与我司联系” 。


这不妥妥的就是,“ 打钱 ”的意思吗?


而这个《 中国学术期刊( 光盘版 ) 》电子杂志社有限公司是谁呢?


仔细一看,原来是大家都熟悉的老朋友知网啊。



这位曾经一己之力击退 “ 翟博士 ” ,在前两年被中科院停用、被赵德馨老教授状告,甚至被国家市场监督总局以反垄断罚款 8000 多万,结果一转头,又把手伸向了 AI 了?


秘塔这边也不怂,直接在文章里反怼,文献的摘要和题录压根就不是你们能用来赚钱的大宝贝,咱家 AI 在收录之后,老老实实贴了你们知网的链接,根本没有侵权。


甚至他们还表示: “ 没有 search ,就没有 research” ,还怼了一口知网: “ ( 如果都像知网这样 )科学文献若成为一种奢侈品,既不利于知识的公平获取,也不利于科学研究的发展。 ”



甚至在官网界面直接恶搞了一句 “完蛋!我们收到了知网 28 页的侵权告知函” 。



但说归说,秘塔可能是为了规避风险,光速与知网做了切割。



甚至还因为这波事件,获得了其它几家数据库的橄榄枝



01


我们也立马试了下秘塔搜索,发现他们如今的论文来源除了外网,基本都以万方数据库内容为主了。



咱们先找了公司的法务了解了下,他告诉我们,最主要是看获取资料涉不涉及盈利性质



另一边,我们也找到了在清华的法学博士朋友阿天( 化名 )聊了聊。


他告诉我们,整个事情很诡异,在他看来,知网大概率就是为了吓唬一下对方,真闹到对簿公堂,法院怎么判,依他看来大概率知网赢不了。


阿天告诉我们,所谓的律师函,如今经常被作为一种 “ 法律策略 ” 来使用,说白了就是吓唬一下对方。



比如我们网上冲浪,也经常会看到什么明星,遇到了一些狗血闹剧,然后他第一时间就是发一个律师函。


但其实他发了律师函不代表这个狗血闹剧就被法律洗白了,很多时候,他只是为了吓唬一下。


所以,这次知网给秘塔发律师函,到底在法律上走不走得通,不是知网说了算,是法院说了算的。


而且,阿天感觉这事儿,知网法律依据还真不是那么足。


因为秘塔用的数据其实就是标题和摘要,这些在知网页面,你只要搜索甚至不用登录都能看到,说白了它其实是公开的状态,所以秘塔 AI 搜索检索到这部分内容,压根就没啥毛病啊。


论文摘要和标题啥的在知网完全就是公开的



不仅如此,在阿天看来,国内很多论文,尤其是核心期刊,虽然被知网收录了,但其实这些论文也在期刊的官网、官方公众号等平台被免费公开了,那如果 AI 是通过这些渠道抓取到的论文,虽然和知网收录的一样,但很难说是 AI 侵权了知网。。。


除非是知网收录的文章本身,是一个付费的非公开资源,然后 AI 搜索利用技术破解出全文,并把这些内容公开了,那才是侵权。


但秘塔可能也存在一些不正当操作。


根据界面新闻报道,或许秘塔 AI 搜索的播客和文库板块,可能是有索引库的。



图自AI 产品 Rena



也就是秘塔把批量收集的文献,先在内部做了一个 “ 蓄水池 ” 。


当用户搜索时,秘塔会在外部搜新鲜的,然后把这些新鲜数据和 “ 蓄水池 ” 的内容整合在一起提供答案。


如果有这个操作,那么或许就可能会面对法律上的风险了。


我们也试了下让秘塔家的 AI 自己回答,结果它自己也确实有点不自信了。



02


可知网那边真的纯粹是为了版权才找秘塔的麻烦吗?


只能说不一定。


因为搜索引擎能不能抓取到网站内容,压根就是网站 robots 文件设置决定的。


如果网站的 robots 文件不允许被抓取,而搜索引擎强行抓取,那才会涉及到侵权。


但知网主站 robots 文件网页却没禁止任何搜索引擎爬虫,那又怎么说秘塔违规了呢。



所以,综合看起来,秘塔暂时和知网断开连接大概率是出于保险,而知网更可能是想维护自己的利益。


大家可能对秘塔还不怎么熟悉,秘塔科技成立于 2018 年 4 月,推出 AI 搜索后,立马起飞。


今年 3 月,据 SimilarWeb 数据, “ 新生代 ” 秘塔 AI 搜索网站日均访问量达到 20 万次以上,月增速达 551.35% 。


而咱们编辑部在今年初发现了这个秘塔 AI 搜索,当时它凭借着出色的资料检索能力,特别是 “ 深入 ” 搜索模式,能够帮我们快速从茫茫论文中找到自己想要的资料,很快就在编辑部流行开了。



后来秘塔也算是爆红,甚至在前不久,秘塔才刚完成了超 1 亿元人民币的新一轮融资,估值已经上涨到了 1.5 亿美元。


兜里有钱了,知网过来提个醒,想和秘塔搞点合作赚点钱,似乎也是人之常情。


但没想到,秘塔异常刚,根本不卖知网面子。


虽然这一下获得了大家的关注和同情,可后面的路,秘塔或许会挺费劲的。因为哪怕秘塔刚拿到融资,可这些 AI 新势力们,大家卷的程度也已经到了难以想象的地步。


就问常刷 B 站的差友们,上半年有没有被 Kimi 铺天盖地的广告洗脑。



图自 36Kr



在这种海量营销下, Kimi 收到的效果也相当明显,隐隐有着破圈的趋势。




图自智能涌现



而秘塔在这批 AI 新势力中,最大的特色就是深度搜索做的好,如今一下子断了知网的口子,还能不能稳住自己的特点,还得再看看。


03


对于知网的这次的操作,咱们也是有点奇怪。


明明秘塔这些 AI 搜索们,在一定程度上是给他们引流啊,比如我自己用的时候,就经常会从参考资料来源直接点进知网官网,然后登录看全文。


可偏偏要用这种显然不被外界接受的方式,玩个大的。。。


但无论咋说,这次知网和秘塔的故事,也是提前给大家提了个醒。


在未来, AI 数据应用的混乱,恐怕还会带来更多争议。


就在上个月,手握《纽约客》、《 Vogue 》和《连线》等媒体的康泰纳仕就出手给海外秘塔 Perplexity 发了份类似的停止函,也是怼这家 AI 搜索公司抄袭。


再往前一个月,福布斯也同样指控了 Perplexity 。


这次知网可能是小题大做了,可下次呢?


文章来源微信公众号“差评X.PIN”,作者“江江”



关键词: AI , AI纠纷 , AI版权 , AI搜索 , 秘塔AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI爬虫

【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。

项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai

2
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/