深度|吴恩达谈DeepSeek:中国AI迎头赶上,扩大算力并不是AI进步的唯一途径

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
深度|吴恩达谈DeepSeek:中国AI迎头赶上,扩大算力并不是AI进步的唯一途径
6360点击    2025-02-07 12:19
  • 有时,当某项技术变得更便宜时,反而会促使整体投入增加。我认为,从长期来看,人类对智能和算力的需求几乎没有上限,因此我仍然看好AI计算需求的持续增长。


  • 我认为DeepSeek-R1在地缘政治上的影响尚有待厘清,同时它也为AI应用开发者带来了巨大机遇。


深度|吴恩达谈DeepSeek:中国AI迎头赶上,扩大算力并不是AI进步的唯一途径


亲爱的读者朋友们,


这一周,围绕DeepSeek的热议让一些关键事实浮出水面:首先是,中国在生成式AI领域正在迅速追赶美国,这将对AI产业链产生深远影响;第二,开源权重模型正在让基础模型逐步商品化,为应用开发者带来了新的机遇;第三,扩大算力并不是推动AI进步的唯一途径。尽管计算能力备受关注,算法创新正快速降低训练成本。


大约一周前,总部位于中国的DeepSeek发布了DeepSeek-R1这一模型,其基准测试表现可媲美OpenAI的o1。此外,该模型以MIT许可证开源,这位AI的应用开发者提供了极大的灵活性。在上周的达沃斯论坛上,许多非技术背景的商业领袖都向我询问关于它的情况。而在本周一,股市出现了“DeepSeek抛售潮”,英伟达及多家美国科技公司的股价大幅下跌(截至目前,股价已有所回升)。


以下是围绕DeepSeek一些关键事实:


中国正在迅速追赶美国的生成式AI技术


当ChatGPT在2022年11月推出时,美国在生成式AI领域领先中国不少。观念的改变通常滞后,因此直到最近,我仍然听到来自美国和中国的朋友表示,他们认为中国落后。然而,过去两年里,这一差距正在迅速缩小。随着Qwen(我的团队已使用数月)、Kimi、InternVL 和DeepSeek等中国模型的推出,中国的AI实力已经显著提升。在某些其他领域,比如视频生成,中国甚至已经展现出领先迹象。


我很高兴DeepSeek-R1以开源权重模型的形式发布,他们还附带了一份详细的技术报告。相比之下,一些美国公司则推动对开源AI进行监管,并通过渲染“人类灭绝”等假想风险来限制其发展。如今已十分明确,开源权重模型是AI产业链的重要组成部分,许多企业都会使用它们。如果美国继续限制开源,中国很可能在这一领域占据主导地位,届时许多企业将不得不使用更符合中国价值观的AI模型,而非美国的。


开源权重模型正在让基础模型商品化


正如我之前所写,LLM的Token价格正在快速下降,开源权重的普及加速了这一趋势,并为开发者提供了更多选择。OpenAI的o1模型每百万输出Token的成本为60美元,而DeepSeek-R1仅需2.19美元。这近30倍的价格差异让许多人注意到AI计算成本正在大幅下降。


训练基础模型并通过API访问收费的商业模式并不好走。许多企业仍在寻找回本途径,而训练大模型的成本极其高昂。文章《AI的6000亿美元问题》很好地阐述了这一挑战(当然,我认为基础模型公司正在做出卓越贡献,我希望它们成功)。相比之下,在基础模型之上开发AI应用是更具吸引力的商业机会。如今,许多公司已投入数十亿美元训练模型,而你只需花费几美元,就能利用这些模型构建客户服务聊天机器人、邮件摘要工具、AI医生、法律文件助手等各种应用。


扩大算力并不是AI进步的唯一途径


近年来,围绕“扩大模型规模能够推动AI进步”的观点备受追捧。事实上,我曾是这一理念的早期支持者。一些公司利用这一叙事成功融资数十亿美元,声称只要有足够资本,就能通过 (i) 扩大规模和 (ii) 预测性改进来持续提升AI性能。因此,行业对扩大算力的关注远超对其他创新路径的探讨。然而,美国对中国的AI芯片出口限制促使DeepSeek团队进行大量优化,使其能够在H800 GPU(算力远不如H100)上高效运行,从而在不计研发成本的情况下,仅用不到600万美元的计算成本完成模型训练。


DeepSeek的成功经验是否意味着降低对算力的需求仍有待观察。有时,当某项技术变得更便宜时,反而会促使整体投入增加。我认为,从长期来看,人类对智能和算力的需求几乎没有上限,因此我仍然看好AI计算需求的持续增长。


我在社交媒体上看到人们对DeepSeek进展的解读各不相同,仿佛是一场Rorschach test,每个人都在其上投射自己的理解。我认为DeepSeek-R1在地缘政治上的影响尚有待厘清,同时它也为AI应用开发者带来了巨大机遇。我的团队已经开始头脑风暴,探索因开源高阶推理模型的可及性而催生的新应用方向。现在依然是一个绝佳的AI创新时代!


原文:Three Takeaways fromDeepSeek’s Big Week: Innvations by China’sAIpowerhouseDeepSeekhighlight major shifts in the international scene

https://www.deeplearning.ai/the-batch/three-takeaways-from-deepseeks-big-week/


编译:Elena Chen



文章来自微信公众号 “ Z Potentials “,作者 The Batch


深度|吴恩达谈DeepSeek:中国AI迎头赶上,扩大算力并不是AI进步的唯一途径



关键词: DeepSeek , 吴恩达 , AI , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda