DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规
6610点击    2025-03-11 23:53

DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规


乙巳新春,中国的推理大模型DeepSeek R1火爆全球。作为一款在推理能力上媲美OpenAI的o1且收费标准远低于o1的国产大模型,DeepSeek一时间在国内刮起一股扑面而来的全民AI风潮,并不令人意外,但这款来自大厂体系外创业团队的开源大模型,经由数位外国商界领袖与技术大佬口碑相传并最终形成在外国新闻媒体上“刷屏”的效果,则是非常耐人寻味了。


在笔者看来,DeepSeek火爆全球不仅仅是因为其在技术成熟度以及商业成本方面表现杰出,更重要的是DeepSeek是开源界一颗无比闪亮的新星,而美国1月份新出台的AI扩散框架新规,就像为DeepSeek闪亮登场打call一样。


通过分析为何DeepSeek的开源策略具有如此之大的“杀伤力”,我们可以看到中国企业必须要特别重视开源创新范式,避免简单地一提到“开源”就等同于“开源软件”,而是要以专业的战略性法律思维,探索开源创新范式在当前环境下对国内企业可能带来的战略价值。


01

DeepSeek火爆全球的背景回顾


DeepSeek-R1发布后7天内突破1亿用户,其用户增长速率远超ChatGPT同期表现,并在苹果应用商店登顶157个国家/地区下载榜。技术层面,R1以更低的成本取得了与o1同等水平的推理能力,同时开源推理系统代码,破解了行业闭源垄断的难题。全球科技巨头如微软、AWS、英伟达等迅速将其接入云平台,其也得到了微软CEO、谷歌前CEO、英伟达CEO等大佬的高度评价。


全球火爆之后,“麻烦”也接踵而来。以美国众议院“美中战略竞争特别委员会”主席约翰·莫莱纳尔(John Moolenaar)为代表的议员,指控DeepSeek“威胁美国国家安全”,主张扩大AI芯片出口限制,包括禁止英伟达特供中国市场的H20芯片,指责新加坡成为芯片转运中心。美国商务部着手调查DeepSeek采购的英伟达H800型号是否符合2023年10月生效的出口管制新规以及DeepSeek是否通过新加坡等第三方中转获取受限芯片。联邦调查局也正式启动调查其是否通过中间商获取被禁的英伟达高端AI芯片。美国总统特朗普公开表态称DeepSeek为美国AI产业敲响警钟,其发展对美国有益,但次日白宫就证实国家安全委员会已启动对DeepSeek关于数据流向和算法透明度的全面评估。另外,特朗普也召集英伟达CEO闭门会谈,据悉系讨论H20芯片更严格限制的相关议题。


除了技术先进性和商业成本方面的因素,为何来自中国的一款开源大语言模型在美西方引起如此轩然大波?——就在DeepSeek开源其推理模型R1并发布技术报告论文前的一周,BIS发布了“人工智能扩散出口管制框架”的临时最终规则和“实施先进计算集成电路额外尽职调查措施”的临时最终规则(“AI扩散框架”,具体介绍见《铁幕将至?——美国AI出口管制新规详解》)。该新规从AI训练算力和AI模型权重这一硬一软两个角度出发,设计了一套空前庞大的监管体系以限制AI能力向中国及其他对手国家扩散,也同时限制了其他国家(美国“盟友”国家除外)发展AI技术的潜力,其野心勃勃堪比三体人封锁地球科技。


但好巧不巧,开源偏偏是这套监管体系中最大的也或许是唯一的“漏勺”,更重要的是,这个“漏勺”原本是美国有意而为的,只不过DeepSeek的出现可以说是恰逢其时地打破了立法者的原有认知,也在一定程度上动摇了这套刚诞生不久的监管体系。


02

美国AI扩散框架新规有意“纵容”开源模型权重,但为什么?


众所周知,美国的阳谋是通过出口管制限制中国获取AI训练所需要的先进GPU算力和AI训练所得到的模型权重(model weight)的方式来遏制中国人工智能的技术发展。但是,BIS在本次新规中明确将开源模型权重排除在了管制范围之外。关于BIS这么做的理由,新规中有这样一段“自信满满”的论述:


“目前已知的开源模型,其训练规模没有超过1026的计算操作数(operations)。此外,美国商务部及其跨部门合作伙伴评估认为,目前最先进的开源模型比最先进的闭源模型能力更弱,部分原因是最先进的开源模型所使用的算力较少,以及专有(注:英文原文proprietary,在知识产权语境下其含义相当于私有闭源)算法的进步使得闭源模型开发者能够在相同的计算资源下开发出更先进的功能…相比之下,能够利用“闭源权重”模型能力的主体包括原始开发者、与原始开发者或部署者直接协商的主体以及窃取了权重的恶意主体。实际上,根据BIS的评估,最先进的闭源权重模型大多被其开发者严格掌控。”


基于上述理由,美国政府认为就现阶段而言,“纵容”开源模型所能实现的经济与社会利益超过了其可能造成的威胁,进而将其权重排除在了本次新规的管控范围之外。


开源的核心特征是源码向社会公众开放,虽然从常理出发来看,拥有最先进技术成果的企业往往会优先选择将技术用于商业化,而不是免费开放给公众做“公益”,但这充其量是一种基于当下世俗价值的经验判断,并没有其他依据可以证明开源技术就必然落后于闭源技术。事实上,从TensorFlow、PyTorch到Linux、Docker等,人工智能乃至计算机技术本身的发展就是建立在一个又一个里程碑式的开源项目之上。且在开发者圈子之中,开源精神与商业模式也已经出现了许多良性互动的迹象。


DeepSeek V3与R1开源模型恰如其分的出现时机,则是用板上钉钉的事实给了美国政府乃至全球企业界当头一棒,将AI扩散框架新规中“开源必落后于闭源”的预设碾得粉碎。


那下一个问题是,美国政府经过此次DeepSeek事件之后,是否会幡然醒悟加强对开源技术的出口管制监管呢?或许会,但就是这样简简单单一句话,想要在监管实操层面落地,其难度可能远超出人们的想象。


首先,美国出口管制监管体系将开源排除在外,并不是这次新规才出现的安排。EAR第734.7(a)条规定,“已发布的技术和软件”(published technology or software)一旦“可公开获得”(available to the public),即不属于EAR下的受控物项(除非涉及734.7(b)条所述的特定加密或武器相关软件/技术)。所谓“可公开获得”,包括以任何形式(不一定以出版形式,可以是互联网发布)向公众传播(不限制分发)。Linux基金会在其2021年的一份报告[1]中援引了这一条,表明来自Linux基金会以及与合作项目社区的开源软件均满足“已发布”的要求,故不属于受EAR管辖的“技术”或“软件”。


这一条款早已有之,即便本次新规不做专门说明,按照EAR既有规定也应当可以得到开源模型权重应当被排除在外的结论。归根结底,不是美国政府不想管,而是开源的核心特征就决定了开源技术在大部分情况下是无从管起,因为出口管制的基本对象仍然是物项(包括无形物意义上的软件、技术),其难以大规模地上升到以人的行为为基本对象,而开源技术在某种程度上可以视为是已经在全球范围内无限量存在的无形物项,即便其是美国人开发的、最早存储在美国的服务器上或是使用了原产自美国的工具。故想要封堵EAR中的开源“漏洞”,并非简单地移除EAR第734.7(a)条即可,而是需要将美国出口管制的底层逻辑做出重大调整,这将是一个体系性难题。


更重要的是,时至今日的开源文化已经不再是最初的理想主义情怀所能够解释的,使用开源进行二次开发(并且如果有能力的话进一步反哺开源社区)已经成为了世界上不同行业、不同规模企业的通行做法,开源生态在开发者界、学术界乃至商业界中都有着很高的威信。故如果美国选择封堵开源,则这种监管措施从一开始就站在了道德洼地、群众对立面上,相较于美国政府过往大多以维护国家安全、国际秩序、人权道义为名施加的各种单边贸易管制和制裁措施,其天然地缺乏“正当性”。


因此,如果开源在未来进一步威胁到美国贸易管制的“大局”,在理论上当然是不能排除美国政府会通过行政命令等方式限制掌握相关技术的美国企业开源其技术成果、限制美国人美国企业使用源于中国的开源技术、命令由美国人美国企业主导的开源社区或其他类似平台采用IP地址限制访问等方式限制中国用户获取或发布开源成果、乃至是废除将开源排除在EAR管辖范围内的既定规则等。但即便假设这些做法都具有可操作性且不会被法院认定违宪,那也同样很有可能因为缺乏足够的“正当性”而遭受全球范围的“口诛笔伐”,其背后所隐藏的监管成本以及可能产生的连锁反应或将超出我们所有人的预期。


从这个角度来看,开源之于美国出口管制体系可谓是釜底抽薪,这也就引出了我们在本文标题中所提出的核心议题——开源创新的战略价值。


03

上游软件技术的垄断地位是美国出口管制长臂管辖的顶层支点


在上文中,我们已经从美国出口管制现行规则本身出发,解释了开源在突破美国技术封锁上所可能发挥的重要战略作用。但规则是人定的,规则背后的底层原理才是法律调整手段能否达到预设目标的决定性因素。因此,就这个问题我们还可以往更深层次来思考,也即美国当前敢于采用超出一般主权意义上的行政手段、通过全球范围内的长臂管辖来实现技术封锁的底层原理是什么?


在此前《从出口管制到AI算力竞争实质(一):写在特朗普2.0时期前夕的回顾与展望》文章中,笔者已有论述美国出口管制之所以有能力实施长臂管辖是依托于美国在货币结算、供应链分配、军事布局方面的优势地位。这些因素毫无疑问都是美国长臂管辖的事实基础,但美国仍然需要为这样一套不符合“常识”的监管体系赋予一个在明面上合理正当的“法理”基础。在涉外司法案件的管辖权争议中,这样的法理基础一般被称为连接点,而在出口管制这样一个行政监管体系之中,美国建立所谓“连接点”的基础实际上是美国公司对上游软件技术所享有的垄断支配地位。


具体来说,当我们把美国出口管制的AI模型权重FDPR与先进计算FDPR这两个规则结合后,可以得到以下几个推论:


1. 采用了美国技术或软件的境外工厂所生产出来的先进计算芯片(主要见ECCN 3A090,另外最新规则将先进制程芯片也推定为先进计算芯片,先进制程定义见EAR第772.1节“Advanced-Node IC”)受EAR管辖;

2. 搭载该等先进计算芯片的计算机所训练出来的AI模型权重受EAR管辖;

3. 该等AI模型权重经过后训练技术进行调校后的进一步产物受EAR管辖。


于是乎,我们可以发现,在这样一套规则体系之下,只要是沾上了上游美国技术或软件,则下游链条上的一切软硬件产物均难以逃脱EAR的管辖。事实就是,从EDA、CAD、CAE、CUDA到PLM、ERP、数据库、操作系统,现代工业生产和组织管理体系之下任何人工智能或先进产品的设计与制造活动均依赖美国公司拥有的或受EAR管辖的专有软件技术。因此将上述几个推论在结合事实现状后,就可以知道美国出口管制规则的言下之意是——当今世界上任何先进计算芯片以及采用该等芯片所训练的先进AI模型权重,无论是通过任何途径购买的芯片或是通过云服务获取算力,都受到美国的监管。


换句话说,FDPR规则可以说是美国为自己量身订造的一条规则,其表面上“公平合理”,但结合当前世界的事实现状,上游软件技术就是美国的“一言堂”,所谓“连接点”实际上就相当于覆盖到全球任何国家地区、任何较为先进的工业领域里的任何下游产品。尽管FDPR的完整规则会对最终管制的对象做一定程度的缩限,但就像我们在《从出口管制到AI算力竞争实质(一):写在特朗普2.0时期前夕的回顾与展望》一文中提到的那样,管辖和管制在这里是两个不同的法律概念,只要美国政府有充足理由去建立覆盖全球的长臂管辖,那具体管制口径都是可以在不同时期、根据不同情况为满足当时利益而做出即时调整的,其范围可大可小、“收放自如”。


04

开源创新在AI数字时代和地缘竞争时代的战略价值


不可否认的是,在当前这样一个数字技术大发展的时代,软件技术处于创新核心地位,其主要原因包括但不限于:


1.软件生态是上下游产业链合作的基础;

2. 任何领域先进产品的设计与制造都已经离不开软件技术;以及

3. 软件技术并不像硬件那样惧怕反向工程(关于“蒸馏”的问题留待未来讨论),故天然地不依赖专利获取合法垄断优势,相应地也就不会受到专利保护期限的限制。


软件是技术世界的通用语言,美国软件技术具有如此巨大的影响力,以至于可以支撑其出口管制实现全球范围内的“管辖力”,恰如英语在当今世界的科研与外贸活动中的影响力。


也正因为软件的“语言”特性,就和语言一样,其生命力在于运用、在于交流。再好的软件,如果束之高阁、无人问津,那也只是一件摆设。因此,即便软件技术不依赖专利保护,理论上可以通过闭源的方式获得永久的知识产权保护,也仍然有像DeepSeek这样的创新主体会主动选择开源策略。开源便是这样一个天然具有促进软件技术运用与交流作用的战略性、平台性、开放性的创新工具。


同时,从这次DeepSeek事件可以看出,开源技术的横向竞争力极强,于行业而言也有着显著的鲶鱼效应:


对于很多国内外SaaS服务商来说,在考虑集成大模型API时,DeepSeek已经一跃成为与OpenAI o1、Claude、Gemini等行业龙头并驾齐驱的热门选择;


DeepSeek全球火爆后,OpenAI紧急推出免费模型并加速GPT-4.5发布,Anthropic快速迭代Claude 3.7,Meta紧急研究DeepSeek开源代码以优化自身模型的训练成本,谷歌、xAI等推出Gemini 2.0、Grok-3等升级模型;


当前国内较为流行的通用大模型技术底座之中,DeepSeek、Qwen和GLM均具有显著的开源商业特征,可谓占据半壁江山。


对于在上游软件领域想要挑战美国垄断的我国企业而言,开源的战略意义就更加重大。无论是从DeepSeek还是从前谷歌的安卓系统、Chromium浏览器内核来看,当最前沿的技术成果与开源的力量相结合后,一场挑落行业霸主的破坏式创新大戏,或许就已经悄然上演。


而站在整个行业乃至是国家层面,多几条开源的“鲶鱼”有益于激活开发者群体的创新热情,加快新兴技术领域的生态构建速度,并最终有助于破解软件算法乃至是硬件算力卡脖子难题的终极“命门”——适配性与兼容性问题。以DeepSeek为例,其正在推动算力市场从“英伟达依赖”向“多元适配”转型,华为昇腾910B、寒武纪MLU370已完整适配DeepSeek,在国产芯片集群上实现92%的英伟达A100等效算力利用率,成本低40%,催动边缘计算崛起[2]。


引用DeepSeek创始人梁文锋在访谈中的一句话,“在颠覆性的技术面前,闭源形成的护城河是短暂的。即使OpenAI闭源,也无法阻止被别人赶超。…我们不会闭源,我们认为先有一个强大的技术生态更重要”[3]。


05

开源≠公益,开源也可以很商业


对于开源,常见的误解是——开源就是免费,企业赚不到钱就无法长久,所以开源就只是少数理想主义者的自发公益行为,而且开源只允许自用、用于商业目的就会侵权等等。但事实上,业内主流的Apache、MIT、BSD、GPL系列等通用许可证都并未限制将开源技术运用于商业目的(尽管有部分许可证会要求下游用户在二次开发后将自己的开发成果继续开源,对于商业主体来说这样的限制可能会难以接受)。而且,当我们看到各种Linux发行版、RedHat、

Android、Chrome、TensorFlow、Github、MySQL、MongoDB、Raspberry Pi时会发现,当今商业世界已经有数不尽的案例可以证明,开源也可以很商业。


简单研究下这些案例就会发现,这些企业并非赚不到钱,有些甚至是赚得盆满钵满。与大多数人的“常识”不同,开源与商业模式并没有必然的冲突(开源甚至与专利也没有必然的冲突,受限于篇幅此处不展开讨论)。相反的,开源由于用户门槛、受众群体数量、二次开发成本、知识产权可控度、数据流向透明性方面的优势,很容易在与同级别商业闭源软件的竞争中占到先手优势。


同时,以Apache License 2.0为代表的通用许可证,由于允许下游用户在二次开发后转闭源、自带专利许可、保留著作权必要声明,在做到尊重原作者著作权人身性权利的同时,也大大降低了商业主体使用开源技术的后顾之忧。更重要的是,大模型时代出现了定制化开源许可证的需求,且市场也仍然有一定的接受度,这就为开源技术贡献人进一步扩展了开源商业模式可用的法律工具。


结语


笔者及团队多年来为银行、金融、通信、电子、电商、自动驾驶等诸多领域的多家国内头部企业提供过涉及开源相关咨询,完整覆盖了从引入外部开源技术到开源自主技术成果的开源合规全链条,以实际经验体会到了开源在中国与企业商业模式、国家产业创新战略的不断融合。在地缘竞争的背景之下,开源的重要性更胜以往,可以说是走到了世界舞台的中央。


DeepSeek的出现,毫无疑问给中国企业自主创新打入了一针强心剂,也让AI赋能万物的时代又临近了一些。我们有幸见证了这样一个属于中国开源创新生态的重要时刻,也乐于看到有更多的传统大厂或是创业团队开始逐步尝试打造自己的开源商业模式,并在此过程中为中国企业贡献更多的力量。


我们认为开源的精髓在于加快构建行业内的创新生态,而生态的建设是无法通过一厢情愿地“砸钱”或是闭门造车式地钻研技术来实现的。世界上任何具有重大经济实用价值的创新,无一例外地是站在巨人的肩膀上诞生的。企业的发展离不开有序的竞争与协作(后者往往容易被忽略),而开源归根结底就是一场大型的社会协作。


从特朗普2.0时代开启以来,美国政府各方面的动作频出,从关税、301调查、出口管制等多个方面向中国打出组合拳,俄乌与加沙战场局势也恐将发生巨变。在这样一个快速变化的时期,我们仍应清醒知晓问题的根源并不在于美国眼花缭乱的各种花式套路,而仍然在于我们自身如何加快推动高质量发展、创造大量可持续的新赛道来拉动国内城乡消费型经济增长、构建一带一路突围地缘竞争的包围圈。对于实现上述战略性目标,国内企业开放创新体系的构建将长期居于核心地位,特别是开源创新范式规则和生态系规则的研究。


中国企业参与或引领国际化的开源创新项目所需要的框架搭建和商业生态的战略规划,不是传统的战略咨询项目,当然也不是传统的法律咨询业务。在企业的商业模式和竞争力与当下地缘政治和AI技术的蓬勃发展多重因素叠加的互相作用下,中国企业需要的应是出海业务竞争力的综合咨询或者是由企业主导的开源生态建设咨询项目。



脚注:

[1] https://www.linuxfoundation.org/resources/publications/understanding-us-export-controls-with-open-source-projects

[1] 上海数据交易所,《DeepSeek对数据要素产业的关键影响分析》,https://mp.weixin.qq.com/s/2MKciqhVgmoW9hZhO3JD-w

[1] 36氪暗涌,《揭秘DeepSeek:一个更极致的中国技术理想主义故事》,

https://mp.weixin.qq.com/s/CfIzV8RumzjbIAELdBkG3g



本文作者



DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规



楼仙英

金杜国际中心知识产权业务负责人


业务领域:知识产权事务和跨境技术贸易,包括知识产权商业化和运营、知识产权合规与保护、科技成果转化及知识产权管理,特别是跨境交易并购中的品牌与技术许可和技术交易合规事务,例如技术进出口审批等

楼女士精于为客户提供商业交易中的知识产权咨询服务,包括在收购和兼并、上市、私募、合资、技术转让以及设立研发中心、服务外包、战略合作等方面,提供知识产权尽职调查、自由实施调查(FTO调查)、知识产权风险排查、技术投资价值评价、企业知识产权白皮书及技术竞争力等综合咨询服务,擅长协助客户制定申请策略和所有权安排、指定发明人奖励报酬制度及核心人员激励机制,为企业上市提供业务梳理和科创性分析。楼女士在知识产权争议解决方面有丰富的经验,尤其是在专利、商标、商业外观以及商业秘密等领域。她亦经常代表客户参与谈判,帮助客户建立行之有效的企业知识产权管理制度,特别是涉及跨国的职务发明、保密和竞业限制等方面的企业管理制度。楼女士是国际国际许可工作者协会(LES)中国分会理事及上海市知识产权服务行业协会理事。



DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规



杨恺盛


资深律师

知识产权部



文章来自微信公众号 ” 金杜研究院 “


DeepSeek事件「慢思考」——论开源创新的战略价值兼评美国AI扩散框架新规


AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda