
4月20日,最高人民法院举行2026年知识产权宣传周新闻发布会
AI生成内容版权归谁?模型参数能不能算商业秘密?爬数据训练大模型到底合不合法?最高法正式公布:专项司法意见正在起草,三条裁判逻辑已经有了雏形,还附上了真实判决案例。
4月20日,最高人民法院副院长陶凯元在2026年知识产权宣传周新闻发布会上,说了一句被很多人忽略的话:
「数据、人工智能等新兴领域技术迭代快,权利边界和权属相对复杂,保护规则亟需明确。人民法院妥善审理涉AI生成内容、AI模型参数等前沿问题的民事案件……最高人民法院正在抓紧起草关于依法妥善审理涉人工智能纠纷案件的意见,努力推动人工智能朝着有益、安全、公平的方向健康有序发展。」
2025年全国法院审结涉数据权属和交易纠纷案件908件,同比增长25.6%。这个增速,解释了为什么要"抓紧起草"。
最高法已经在今年同步发布的《人民法院知识产权司法保护实施方案(2026—2030年)》里,给出了认定标准——
【条款原文·第九条】「综合考量自然人输入指令的具体内容、选定和修改的具体过程等因素,判断生成内容是否体现自然人独创性的选择和表达,依法准确认定人工智能生成内容的法律属性。」
不是说AI参与了就没版权,而是看你在整个生成过程中投入了多少脑子。你只敲了几个字让AI跑出来的?大概率不算你的作品。你反复调整、迭代、精心构建了输出结果?可能有版权。
今年4月,上海黄浦区法院刚刚审结全国首例AI绘画提示词著作权案,判决结果印证了这个逻辑:
原告用六组结构化英文提示词(比如"新艺术风格+巨型海蓝宝石冥河水母+纸莎草手绘手稿+镜面对称")生成了一批绘画,后来发现被人用相同提示词复制了画作,于是告侵权。法院怎么判的?
「涉案提示词仅是对艺术风格、主体元素、材质细节的简单罗列,属于AI绘画领域的常规表达……未达到作品标准。」—— 上海市黄浦区人民法院(2026年4月,一审驳回)
关键在"输入端"和"输出端"的分野:提示词本身只是指令堆砌,不保护;但如果生成的图片经过你大量调整、反复迭代,输出结果体现了你的独创性,那张图是有可能受保护的(参考2023年北京互联网法院"春风送来了温柔"案)。
这是AI公司和内容平台之间的核心战场。《实施方案》给出了三个关键词:
【条款原文·第九条】「坚持促进发展和规范管理相统筹,稳妥审理大模型训练语料使用及涉人工智能生成内容侵权等新类型案件。探索研究人工智能生成物权属认定等司法规则,依法准确界定人工智能开发者、经营者、使用者等主体的法律责任。」
训练语料侵权这件事,法院既不会一刀切封死,也不会放任不管。核心思路是"促进发展和规范管理相统筹"——AI公司不能以"促进创新"为由随意抓版权内容训练,但也不至于让版权方一告一个准。
更重要的是后半句:开发者、运营者、使用者三类主体,要分别承担不同的法律责任。你是写代码训练模型的,还是把这个模型包成产品卖给别人用的,还是最终用它生成了侵权内容的——法律要追的人,很可能不是同一个。
这是2025年典型案例里唯一有完整裁判要旨的AI相关案件。浙江一家比价公司,用插件绕过反爬机制抓取了某电商平台的商品数据,卖给第三方做"价格监测"服务。法院判:
【裁判要旨原文】「对于公开数据应当划清合理使用与不当攫取的边界;对于附条件公开数据,应当审查授权范围、协议约定与使用方式;对于不公开数据,应当强化技术保护和法律保护……各被告利用技术手段,绕开某电子商务平台的风控机制,突破正常的访问权限,以模拟普通用户需求的方式大量爬取涉案商品数据,妨碍、干扰了该平台的正常运行……构成不正当竞争。」—— 浙江省宁波市中级人民法院,判赔500万元
数据被分成三层来保护:完全公开的,可以用,但不能恶意大量抓;有访问条件的(比如要注册、要同意协议),超出协议范围就违规;本来就不对外的,动就是侵权。
这个逻辑直接适用于AI训练数据场景:你的爬虫有没有模拟用户绕过反爬机制?有没有超出robots协议约定的范围?有没有拿去做商业数据产品?三个问题,决定你是否违法。
《实施方案》第十七条还提了一件事:最高法要用AI来反制AI滥用——
【条款原文·第十七条】「探索完善'版权AI智审'等辅助智能化应用……加强非正常批量诉讼、虚假诉讼、恶意诉讼综合治理。」
换句话说:如果你打算用AI批量生成"作品"、然后批量起诉别人侵权来薅羊毛,法院已经在用AI识别这种操作,并准备把它定性为"恶意诉讼"。
目前意见全文还没有公布。但从已经落地的《实施方案》条款和今年的典型判决来看,三条主线已经相当清晰:
第一,AI生成内容有没有版权,看人的参与程度,不看是否用了AI工具。投入越多,越可能保护;纯粹跑一个提示词,不算你的作品。
第二,爬数据训练AI,只要绕过了反爬机制或超出协议范围,就构成不正当竞争,赔的不是小钱。500万只是开始,后续对AI公司来说可能更高。
第三,AI模型参数保护,会走商业秘密路线。参照今年典型案例里芯片商业秘密案(涉案许可使用费3.17亿元),技术参数保护级别相当高,前提是企业要自己做好保密措施。
最高法民三庭庭长李剑用了一个说法:知识产权是创新主体的"护身法宝",又是影响公共福祉的"调节阀"。AI时代的版权规则,不是要赢者通吃,也不是要把创新闷死——而是要在两者之间找到一条平衡线。这份意见,就是在画那条线。
来源:最高人民法院2026年知识产权宣传周新闻发布会 / 21世纪经济报道
文章来自于微信公众号 "超前观察",作者 "超前观察"
【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。
项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0