ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
网文作者打响AI训练反击战
7967点击    2024-07-27 14:07

伴随着人工智能的高速发展,用户或创作者与平台间围绕AI侵权的纠纷时有发生。


平台对AI的“训练”正在激怒越来越多的内容创作者。 


近日,有网文作者在“龙的天空”网站上发文控诉,称网络文学平台“番茄小说”用作者的内容去“投喂”AI,催生出不少AI作者,遂要求解除AI协议。 


与此同时,番茄小说被曝存在多个作品高度雷同的情况,有新手作者日更超过200本小说,远超正常更新水平。 


上述事件一经发酵后,许多作者选择停更,甚至断更。一位知名作者在其小说的最新一章表达了抗议,称新协议出来后,很多作者一直在努力维权。“但是我们人微言轻,加上信息茧房、(受到)嘲讽等各种原因,我无法坚持下去,也不会再在这里写了。” 



网友质疑平台出现AI作者洗稿抄袭。图源:受访者 


01


作者所指的AI协议,是与平台签约时的一项合同条款,具体涉及以下内容: 


甲方可将签约作品的全部部分内容及相关信息(包括作品名称、简介、大纲、章节、人物、作者个人信息、封面图等)、数据、语料、文本、素材等,用于标注、合成数据/数据库建设、Al人工智能研发、机器学习、模型训练、深度合成、算法研发等目前已知或未来开发的新技术研发/应用领域,包括但不限于: 

(1)用于智能对话、智能文本/图像/视听/语音等作品/成品的编辑、生成、转换、深度合成、虛拟现实技术等的研发和应用。 

(2)用于任何技术下的Al人工智能模型训练,或用于生成提供给模型训练的合成数据/数据库。 

(3)其他任何新技术研发或应用场景。 

注:甲方为番茄,乙方为作者 

作为平台方的番茄小说很快给出了解决方案,删除了原协议中Al模型训练场景条款,给出了补充协议。 



补充协议内容。图源:受访者 


番茄小说作者羊羊也注意到了最新的补充条款,她选择继续签约。在她看来,番茄小说比较适合新作者。羊羊是在两个月前入驻番茄小说的,最近刚完结一篇20余万字的小说。 


但并非所有作者都给予认可,其中一些还在社交媒体发文,质疑平台补充协议的标点符号、分段是在“挖坑”,双方的信任关系仍有待修复。 


作者平平对于内容被用于AI训练感到不满,认为AI发展是趋势,作为生产工具可以协助工作,解放劳动力,“但不应该是取代劳动力”。她希望番茄小说能发布公告“承诺未来不会使用AI一键成文”等功能,之后再签补充协议。 


上述两位作者都明确表示,未来会选择离开番茄小说。 


但眼下还有另一重麻烦,不少作者担心会被平台方起诉泄露合同内容。一旦败诉,赔偿金也会是一笔不小的费用。 


02


伴随着人工智能的高速发展,用户或创作者与平台间围绕AI侵权的纠纷时有发生。即便是掀起AI大潮的OpenAI也多次被美国媒体状告,在未经允许的前提下,后者的新闻报道被用于AI训练。为此,OpenAI开始与媒体集团签署合作协议。 


美国知名女演员斯嘉丽·约翰逊也曾指责OpenAI盗用她的声音。该公司所推出的产品ChatGPT-4o中内置的语音之一“Sky”,与斯嘉丽的声音极为相似。尽管OpenAI予以否认,但最终暂停使用了“Sky”的声音。 


刚刚发布最强大模型的Meta,也会要求社交媒体Instagram用户同意上传的内容被用于AI训练,否则无法使用该平台。 


而在国内,界面新闻注意到,部分创业公司并不避讳通过采集公开发表的新闻报道或文章,用AI“洗稿”生产内容并盈利,也有一些公司的AI绘图被画师质疑抄袭。 


对于上述情况,上海大邦律师事务所高级合伙人游云庭表示,在未取得作者授权的情况下,将作品用于AI训练,‍‍涉嫌侵犯著作权法上规定的著作权的其他权利。但到目前为止,训练是否构成侵权,尚没有相应的‍‍法院判决可以来支持。‍正因为有一定的争议性,即使被法院认定为侵权,也不构成犯罪。‍‍ 


游云庭补充称,如果平台将作品用于AI训练,需要跟作者单独协商‍‍达成新协议。‍‍如果单方面改变协议内容,或在更新时强制签署协议,就违反了现有合同,法院不会认可新合同的效力。 


其次,如果平台声称AI训练只是为了提升服务质量,而非商业盈利,这在法律上是站不住脚的,因为平台提升商业‍‍服务质量也是为了盈利,法院不会认可企业的抗辩。 


03


平台普遍在进行的“AI训练”更进一步引发了创作者对私有内容泄露的担忧。近日,有网友称,WPS疑似把作者未公开内容“喂”给抖音豆包AI,因在该AI上问出了相应内容。 


对此,字节跳动称相关传言完全不实,豆包上部分书目信息来源于公开信息;豆包与WPS在AI训练层面并未开展任何形式的合作,也没有使用任何用户未公开的私人数据进行训练。而WPS官方也回应称,相关问题完全失实。 


不过,今年4月北京互联网法院一审开庭宣判的全国首例AI生成声音人格权侵权案,可以为内容创作者们维权提供一种借鉴。在该案中,配音师殷某发现,某软件公司将其配音制作的作品AI化处理后出售给相关平台,该作品在多个知名App广泛流传。 


法院经审理认定,被告文化传媒公司对录音制品享有著作权等权利,但不包括授权他人对原告声音进行AI化使用的权利,其在未经原告本人知情同意的情况下,授权软件公司AI化使用原告声音的行为无合法权利来源。法院判决相关被告向原告赔礼道歉,并赔偿损失共计25万元。 


法院指出,即使合法获得了作品授权,也并不意味着有权将其进行AI训练。这表明相关权利人、创作者对其作品等应有相应的控制权,仅凭模糊的授权条款,而不另行支付对价,不能保证平台可以进行AI训练。 


04


我国已于去年开始实施的《生成式人工智能服务管理暂行办法》(下称《办法》)规定,在提供和使用生成式人工智能服务的过程中,应尊重知识产权、商业道德等,不得利用算法、数据、平台等优势实施垄断和不正当竞争行为。 


《办法》还对生成式人工智能服务提供者提出了一系列规定,包括依法开展训练数据处理活动、承担网络信息内容生产者责任和个人信息处理者责任、明确服务的适用人群等。 


然而,要判定生成式AI侵权存在一定难度,包括侵权对象的界定、生成内容的独创性判断、证据收集和技术分析、法律适用的不确定性等问题。 


其次,生成式AI的生成内容是向特定用户提供的,本身不具有直接公开性,不会出现大规模的直接侵权现象,这与传统的网络侵权有所不同。 


AI技术的不断进步,也对法律的“思想-表达二分法”造成冲击,传统上“接触+相似”的侵权判断标准不再完全适用。生成式AI可以快速学习人类作品并生成不同的表达结果,导致“思想与表达”难以清晰“二分”,从而增加了侵权认定的难度。 


整体而言,现有的法律规定难以完全涵盖AI的应用场景和生成形式的所有情况。为了应对这些困难,法律界需要不断探索和完善相关法律规定和侵权认定标准,综合考虑技术特点、社会影响等多方面因素,以实现对生成式AI侵权行为的合理判定和有效规制。 


文章来源于“界面新闻”,作者“陈振芳



AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/