ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
马斯克加入了开源大模型阵营
3590点击    2024-03-24 15:51


在多次对美国人工智能研究公司OpenAI的闭源路线表达不满后,3月18日,特斯拉创始人埃隆·马斯克兑现了此前的承诺,宣布推出开源大语言模型Grok-1。


据马斯克旗下的人工智能初创公司xAI介绍,Grok-1由其从头开始训练,是一个混合专家模型,没有针对任何特定应用(例如对话)进行微调。Grok-1模型参数量高达3140亿,是迄今为止参数量最大的开源大模型。


在开源Grok-1的同时,马斯克仍然不忘在社交媒体上调侃OpenAI:“告诉我们更多有关OpenAI的‘开放’部分的信息……”OpenAI则在该消息下反击:“(马斯克)偷了我的整个笑话。”


作为科技界的领袖之一,马斯克是一位富有争议性的人物。在《埃隆·马斯克传》里,作者沃尔特·艾萨克森对马斯克的一部分描述是“冷酷”“冲动”“狂热”。此前,行行AI董事长、工信部工业文化发展中心AI(人工智能)应用工作组执行组长李明顺走访了中美百家AI前沿科技企业,并在美国硅谷与同行交流过马斯克和他广为人知的梦想——在火星建立一座城市。李明顺认为,马斯克并不是一位单纯考虑商业的企业家,而是“少见的地球主义企业家”。


“此次Grok-1的开源在人工智能领域可能会带来新的风潮,且间接地冲击了Llama-2(美国互联网公司Meta发布的开源大模型)的地位,这是对OpenAI的一次反击。马斯克想在起诉OpenAI案开庭之前,强调自己的世界观和价值观。”李明顺说。


在盘古智库高级研究员李培序看来,马斯克开源Grok-1大模型是对抗OpenAI的一次“行为艺术”,希望通过提供开源模型,建立一个更加开放、协作的人工智能生态系统。


一、马斯克的AI雄心


马斯克与OpenAI之间的纠葛,可以追溯到近十年之前。2015年,马斯克与山姆·奥特曼等人联合创立了OpenAI,但由于发展方向上的分歧,双方在2018年分道扬镳。此后马斯克多次对OpenAI作出批评。


据路透社报道,马斯克于今年2月29日向美国旧金山高等法院起诉OpenAI及其CEO(首席执行官)山姆·奥特曼,理由是OpenAI违背了最初的使命——为了全人类的福祉而非利润来开发人工智能技术。马斯克的诉讼指控OpenAI违反合同,称山姆·奥特曼和联合创始人格雷格·布罗克曼最初与他接洽是为了创建一家开源、非盈利公司,但这家企业现在专注于赚钱。


几天后,OpenAI在官网发布文章回应了马斯克的指控,表示“打算驳回埃隆的所有主张”。


文章称,2017年底,OpenAI和马斯克决定下一步的任务是创建一个营利性实体。马斯克想要获得多数股权、初始董事会控制权并担任CEO,“无法与他就营利性条款达成一致,因为我们认为任何个人对OpenAI拥有绝对控制权都是违背使命的……马斯克很快就选择离开OpenAI,称我们成功的概率为0,并计划在特斯拉内部建立一个AGI(人工通用智能)竞争对手”。


3月11日,OpenAI又对文章做了一次更新,表示正在寻求将诉讼分配给专门的案件管理人员,因为它涉及人工智能技术,而且索赔时间跨度近十年。


从大模型竞争层面看,xAI在2023年11月发布了其首个AI大模型产品Grok,相较OpenAI的大模型产品ChatGPT而言已晚了许多。李培序认为,马斯克曾公开特斯拉专利,推动全球电动汽车技术发展,他也凭借技术优势,成为了专利“开源”的最大赢家。这次Grok的开源,可能有战略逻辑上的考量,反映了马斯克在人工智能领域的雄心。


二、Grok的表现


Grok-1开源5天后,在开源社区GitHub已获得4.2万人的收藏。DeepMind(谷歌旗下人工智能公司)的工程师亚历克萨·戈迪奇预测,Grok-1的能力应该比LLaMA-2要强,但目前尚不清楚有多少数据受到了污染。另外,二者的参数量也不是一个量级。


但Grok-1的大参数给使用者带来了困扰。有用户在GitHub上评论,运行Grok-1的GPU(图形处理器)配置是8个英伟达A100芯片。xAI也强调,由于Grok-1的模型规模较大,参数量达到了3140亿,因此需要有足够GPU内存的机器使用示例代码测试模型。


李培序告诉记者,参数量是大模型的重要指标。一般而言,大模型参数量越大,意味着它越能够捕捉到丰富的数据特征,从而可能在某些应用领域展现出更强的性能。Grok-1模型是当前参数量最大的开源大模型,并且采用先进的混合专家架构,确实标志着它具有一定竞争力。但是参数量的大小并不是衡量模型性能的唯一标准,模型的架构、训练数据的多样性、算法的创新性等因素也同样重要。


“对于大模型赛道而言,开源Grok所带来的影响可能相对有限。首先,如此大参数量的模型需要大算力和大数据作为支撑,并不适用于个人或小团队开发,而大企业往往在技术上已有较强的储备,并不依赖于开源模型;其次,当前开源的大模型市场已经相当丰富,Grok的开源只是为开发者们增加了一个备选方案,提供了更多的选择空间,并没有技术上的颠覆性创新。”李培序表示。


三、开源与闭源之争


开源大模型允许任何人访问和使用源代码,而闭源模型则由单一实体控制,通常需要付费使用。与IT(互联网技术)产业中Windows(微软研发的闭源操作系统)和Linux(一种开源操作系统)、iOS(苹果研发的闭源操作系统)和Android(谷歌旗下的开源操作系统,下称“安卓”)的发展历史相似,一直以来,AI领域围绕大模型开源和闭源间的争论不断。支持大模型开源的一方认为,开源有利于技术和监管透明,推动人类共同进步,另一方则认为,闭源有助于防范AI技术被滥用。


从阵营来看,开源大模型包括Meta的Llama-2、开源生成式AI公司Stability AI的Stable Diffusion、阿里云的通义千问等,闭源大模型则以OpenAI的ChatGPT、百度的文心一言等为代表。


李明顺更倾向于站在开源一方,“我自己曾经做过开源软件,当时在没有很多钱的情况下,没花太多的经费,就推广了几百万的站长用我们的软件,其中开源发挥了重要的作用”。他说:“开源能降低使用者的门槛和成本,相较闭源更有生命力。安卓今天可能没有苹果那么挣钱,但是它的设备使用量和影响力远远大于苹果。”


李培序表示,开源模型的优势在于可以吸引全球的开发者共同参与改进和优化,形成一个强大的社区支持网络,这有助于快速提升模型的性能和质量。同时,开源模型降低了个人、企业、研究机构进入人工智能领域的门槛,使更多的人能参与到人工智能的研究和应用中。此外,开源模型可以作为教学和研究工具,这对培养新一代的技术人才至关重要。


“然而,开源模型也存在劣势。由于源代码是公开的,开源模型可能面临更高的安全风险。对于企业而言,开源模型较难形成稳定的盈利模式。”李培序说。


对于闭源模型,李培序认为,闭源模型更容易形成商业模式,企业可以通过销售许可、提供专业服务等途径获取收益。另外,闭源模型由单一实体集中管理和维护,模型的稳定性和安全性更有保障,并且它能够提供定制化的服务。但与此同时,闭源模型也缺乏开源模型那样的社区支持和协作环境,通常只能依靠内部团队进行改进和优化,因此创新速度可能会比较慢。


“大模型的开源与闭源之争,实际上是两种不同的研发和管理模式的较量,每种模式都有它独特的优势和劣势。在未来,大模型的模式可能会趋向于两者的融合,即在保持一定开源性的同时,通过合理的商业模式来平衡创新和盈利之间的关系。”李培序称。


本文来自微信公众号:经济观察报 (ID:eeo-com-cn),作者:陈奇杰



关键词: 马斯克 , AI , 开源大模型 , Grok-1
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner