开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

6478点击 2024-08-31 10:21

今天一大早，Meta 便秀了一把「Llama 系列模型在开源领域取得的成绩」，包括如下：

HuggingFace 下载量接近 3.5 亿次，较 2023 年同期增长了 10 倍；
过去一个月下载量达到了 2000 万次，使得 Llama 成为领先的开源模型系列；
云服务供应商对 Llama 需求巨大，自 5 月以来，Meta 最大云供应商的 token 使用量增加了一倍多；
Llama 模型正被整个行业采用，包括 Accenture、ATT、DoorDash、GoldmanSachs 等。

距离 Llama 3.1 的发布（7 月 24 日）仅仅过去了一个多月，Meta 已经将上下文扩展到了 128k，增加了对 8 种语言的支持，并且 405B 参数量的 Llama 3.1 成为全球最强的开源大模型。

可以说，Llama 的成果要归功于开源的力量。目前围绕 Llama 已经形成了一个充满活力和多样性的 AI 生态系统，开发者拥有了比以往更多的选择和能力，初创公司和各种规模的企业都在使用 Llama 来构建 On-premises（指公司的本地数据中心内运行的软件、服务或系统。）。

可以说，开源已经成为 Meta 的 DNA。此前，Meta 创始人扎克伯克公开写信声明开源的好处：这将促进更有活力的 AI 开发生态，对普通用户、Meta 以及其他公司都有利。

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

7 月 24 日，在 Llama 3.1 发布的同时，扎克伯格也发了一封标题为「拥抱开源 AI：通往未来的必由之路」的公开信。

历时 18 个月，Llama 成长为开源模型标杆

自 2023 年 2 月首次亮相以来，Llama 只用了 18 个月便从单一的先进基础模型发展成为面向开发者的强大系统。到如今，借助 Llama 3.1，Meta 为开发者提供了一个完整的参照系统，使他们可以轻松创建自己的智能体，并通过安全工具帮助他们负责任地创建。

除了下载量的持续增长，Meta 还与 AWS、微软 Azure、Databricks、戴尔、谷歌云、Groq、NVIDIA、IBM watsonx、Scale AI、Snowflake 等公司合作，帮助开发者发挥模型潜力。

发布 Llama 3.1 后，Meta 的主要云服务供应商的 Llama 使用量显著增长。具体来说，从 2024 年 5 月到 7 月，按 token 计算的使用量翻了一番多。

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

从今年 1 月到 7 月，Meta 的主要云服务供应商每月对 Llama 使用量增长了 10 倍。参数量最大的 Llama 3.1 405B 也很受欢迎，据某云服务供应商 8 月的数据显示，用户数最高的是 Llama 3.1 405B。

Llama 3.1 发布后，拥有访问 Llama 权限的合作伙伴增长了 5 倍，Wipro、Cerebras 和 Lambda 等知名企业也将成为其中的一员。

开发者社区对 Llama 的偏好也日益增长。据专注于 AI 基准测试的独立网站 Artificial Analysis 的调查，Llama 是开发者们的首选排行榜上的第二名。

在 Hugging Face 平台上，Llama 已有超过 60,000 个模型变体，活跃的开发者社区正在根据自己的需求，对 Llama 进行细致的定制和优化，包括 AT&T、DoorDash、高盛、Niantic、野村证券、Shopify、Spotify、Zoom 等在内的行业巨头，以及 Infosys 和 KPMG 等专业服务领域的领军企业，都已经将 Llama 集成到内部系统中。

在企业服务中，Llama 系列已经有一些成功的用例。基于 Llama 3.1 知名咨询公司埃森哲构建了一个用于 ESG（环境、社会和治理）报告的定制大模型。他们期望，用上了 AI 之后，写报告的生产力能提高 70%，质量提高 20% 至 30%。

通过微调 Llama 模型，美国电信巨头 AT&T 在客户服务搜索响应上取得了接近 33% 的大幅提升。这一改进不仅降低了成本，还提升了业务效率。

随着 Llama 生态系统的不断壮大，Meta AI 的功能和接入点也在同步扩展。现在，用户可以通过 Instagram、WhatsApp、Messenger 和 Facebook 等应用直接体验 Meta 的智能助手。

Meta 也没忘记心心念念的「元宇宙」，Meta 还在开发头显 Quest 系列和智能眼镜 Ray-Ban Meta，正在朝着一个目标迈进：届时，一个全天候待命、知冷知热、提供情绪价值的 AI 助手将以可穿戴的形式主动融入你的日常生活，为你提供帮助。

与此同时，OpenAI 也亮出了自己的数据，每周有超过 2 亿人在使用 ChatGPT，相比去年 11 月的报告，ChatGPT 每周的活跃用户数约为 1 亿，仅过半年，这个数字就涨了一倍。

在 ToB 赛道上，OpenAI 也不遑多让，92% 的财富 500 强公司都在使用 OpenAI 的产品，更便宜、更智能的 GPT-4o Mini 推出后，API 的使用量翻了一番。

评论两极分化：真·假开源

看到 Meta 的喜报，Grok 的 CEO Jonathan Ross 发来了贺电：一个大模型的下载量达到 3.5 亿次，太疯狂了！Linux 达到这个数字用了多久？

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

他还表示：开源赢了！到目前为止，Groq 已经向超过 40 万开发者每天提供 50 亿 Llama 系列模型的免费 token。但这仍然供不应求，Ross 称，即使 Groq 将部署的容量增加 10 倍，这些资源也会在 36 小时内用完。

Llama 系列以如此快的速度，达成了 3.5 亿次下载的成就，老黄也赶紧点了赞：「在过去的一个月里，我们见证了 Llama 3.1 以如此之快速度被应用部署，真是令人难以置信。」

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

但是在网友和合作伙伴的一片叫好声中，也有对 Meta 只开放代码，未开放模型权重的质疑声。

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

虽然 Meta 给自己全身贴满了「开源」的标签，但是最近开放源代码促进会（OSI）却明确表示：Llama 系列并不算真开源。

在 OSI 给出的定义下，判断一个 AI 模型真正开源，需要符合「四项基本自由」：不限制使用目的，允许深入研究其工作原理，支持随意修改，无论是否进行过修改都允许用户自由分享模型。

虽然 Llama 3 模型可以自由部署，但 Meta 限定了 Llama 3 可以生成的内容类型。因此， Llama 3 也不算真正的开源了。

然而，Meta 对 OSI 非黑即白的「二元论」提出了反对，他们认为开发大模型的成本很高，过程也很复杂。因此，对于开源的标准，应该有一个从完全开放到部分开放的范围，而不是只有完全开源或完全闭源两种极端状态，并且被 OSI 列入第一批「白名单」的开源模型中，都没有达到 Sota 的水准。

Meta 这么刚，知名杂志《经济学人》对此点评道：Meta 被指控正在「霸凌」开源社区。

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

在今年的 SIGGRAPH 大会上，扎克伯格曾在和黄仁勋的对谈中提及，Meta 做开源并非纯纯做慈善，而是一种明智的经营策略。在开源计算系统后，Meta 成为了行业标准，供应链主动对齐 Meta 的设计，这种为行业打造整套生态的经验，实际为 Meta 节省了数十亿美元。

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

同时，Meta 开源的决策也要拜苹果所赐，在以手机为代表的智能移动设备崛起后，苹果的闭源生态太过垄断，以至于扎克伯格放弃了很多想要开发的功能。为此，扎克伯格甚至当场爆粗。

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

但在 OSI 看来，Meta 现在的做法似乎让他们变成了「另一个苹果」。发出「Meta 正在霸凌开源社区」指控的正是 OSI 的执行董事 Stefano Maffulli：「扎克伯格真的在强迫整个行业跟随他的步伐」。

OSI 计划在今年 10 月正式揭晓对「开源 AI」定义的最终修订版。他们期望通过一个清晰而严格的标准，赋予开发者们信心：他们可以自由地使用、复制和修改像 Llama 这样的开源模型，而不必「受扎克伯格善意的摆布」。

文章来源“机器之心”，作者“佳琪”

开源启动！18个月Llama系列下载量近3.5亿，黄仁勋：快到难以置信

关键词: Llama , AI , 大模型 , meta , 开源大模型

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点，无需魔法付费，即可无限制使用GPT-4o等多个海外模型产品。
在线使用：https://ffa.chat/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner