亲爱的读者朋友们,
这一周,围绕DeepSeek的热议让一些关键事实浮出水面:首先是,中国在生成式AI领域正在迅速追赶美国,这将对AI产业链产生深远影响;第二,开源权重模型正在让基础模型逐步商品化,为应用开发者带来了新的机遇;第三,扩大算力并不是推动AI进步的唯一途径。尽管计算能力备受关注,算法创新正快速降低训练成本。
大约一周前,总部位于中国的DeepSeek发布了DeepSeek-R1这一模型,其基准测试表现可媲美OpenAI的o1。此外,该模型以MIT许可证开源,这位AI的应用开发者提供了极大的灵活性。在上周的达沃斯论坛上,许多非技术背景的商业领袖都向我询问关于它的情况。而在本周一,股市出现了“DeepSeek抛售潮”,英伟达及多家美国科技公司的股价大幅下跌(截至目前,股价已有所回升)。
以下是围绕DeepSeek一些关键事实:
当ChatGPT在2022年11月推出时,美国在生成式AI领域领先中国不少。观念的改变通常滞后,因此直到最近,我仍然听到来自美国和中国的朋友表示,他们认为中国落后。然而,过去两年里,这一差距正在迅速缩小。随着Qwen(我的团队已使用数月)、Kimi、InternVL 和DeepSeek等中国模型的推出,中国的AI实力已经显著提升。在某些其他领域,比如视频生成,中国甚至已经展现出领先迹象。
我很高兴DeepSeek-R1以开源权重模型的形式发布,他们还附带了一份详细的技术报告。相比之下,一些美国公司则推动对开源AI进行监管,并通过渲染“人类灭绝”等假想风险来限制其发展。如今已十分明确,开源权重模型是AI产业链的重要组成部分,许多企业都会使用它们。如果美国继续限制开源,中国很可能在这一领域占据主导地位,届时许多企业将不得不使用更符合中国价值观的AI模型,而非美国的。
正如我之前所写,LLM的Token价格正在快速下降,开源权重的普及加速了这一趋势,并为开发者提供了更多选择。OpenAI的o1模型每百万输出Token的成本为60美元,而DeepSeek-R1仅需2.19美元。这近30倍的价格差异让许多人注意到AI计算成本正在大幅下降。
训练基础模型并通过API访问收费的商业模式并不好走。许多企业仍在寻找回本途径,而训练大模型的成本极其高昂。文章《AI的6000亿美元问题》很好地阐述了这一挑战(当然,我认为基础模型公司正在做出卓越贡献,我希望它们成功)。相比之下,在基础模型之上开发AI应用是更具吸引力的商业机会。如今,许多公司已投入数十亿美元训练模型,而你只需花费几美元,就能利用这些模型构建客户服务聊天机器人、邮件摘要工具、AI医生、法律文件助手等各种应用。
近年来,围绕“扩大模型规模能够推动AI进步”的观点备受追捧。事实上,我曾是这一理念的早期支持者。一些公司利用这一叙事成功融资数十亿美元,声称只要有足够资本,就能通过 (i) 扩大规模和 (ii) 预测性改进来持续提升AI性能。因此,行业对扩大算力的关注远超对其他创新路径的探讨。然而,美国对中国的AI芯片出口限制促使DeepSeek团队进行大量优化,使其能够在H800 GPU(算力远不如H100)上高效运行,从而在不计研发成本的情况下,仅用不到600万美元的计算成本完成模型训练。
DeepSeek的成功经验是否意味着降低对算力的需求仍有待观察。有时,当某项技术变得更便宜时,反而会促使整体投入增加。我认为,从长期来看,人类对智能和算力的需求几乎没有上限,因此我仍然看好AI计算需求的持续增长。
我在社交媒体上看到人们对DeepSeek进展的解读各不相同,仿佛是一场Rorschach test,每个人都在其上投射自己的理解。我认为DeepSeek-R1在地缘政治上的影响尚有待厘清,同时它也为AI应用开发者带来了巨大机遇。我的团队已经开始头脑风暴,探索因开源高阶推理模型的可及性而催生的新应用方向。现在依然是一个绝佳的AI创新时代!
原文:Three Takeaways fromDeepSeek’s Big Week: Innvations by China’sAIpowerhouseDeepSeekhighlight major shifts in the international scene
https://www.deeplearning.ai/the-batch/three-takeaways-from-deepseeks-big-week/
编译:Elena Chen
文章来自微信公众号 “ Z Potentials “,作者 The Batch
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda