ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
开源启动!18个月Llama系列下载量近3.5亿,黄仁勋:快到难以置信
5135点击    2024-08-31 10:21

今天一大早,Meta 便秀了一把「Llama 系列模型在开源领域取得的成绩」,包括如下:


  • HuggingFace 下载量接近 3.5 亿次,较 2023 年同期增长了 10 倍;
  • 过去一个月下载量达到了 2000 万次,使得 Llama 成为领先的开源模型系列;
  • 云服务供应商对 Llama 需求巨大,自 5 月以来,Meta 最大云供应商的 token 使用量增加了一倍多;
  • Llama 模型正被整个行业采用,包括 Accenture、ATT、DoorDash、GoldmanSachs 等。



距离 Llama 3.1 的发布(7 月 24 日)仅仅过去了一个多月,Meta 已经将上下文扩展到了 128k,增加了对 8 种语言的支持,并且 405B 参数量的 Llama 3.1 成为全球最强的开源大模型。


可以说,Llama 的成果要归功于开源的力量。目前围绕 Llama 已经形成了一个充满活力和多样性的 AI 生态系统,开发者拥有了比以往更多的选择和能力,初创公司和各种规模的企业都在使用 Llama 来构建 On-premises(指公司的本地数据中心内运行的软件、服务或系统。)。


可以说,开源已经成为 Meta 的 DNA。此前,Meta 创始人扎克伯克公开写信声明开源的好处:这将促进更有活力的 AI 开发生态,对普通用户、Meta 以及其他公司都有利。



7 月 24 日,在 Llama 3.1 发布的同时,扎克伯格也发了一封标题为「拥抱开源 AI:通往未来的必由之路」的公开信。


历时 18 个月,Llama 成长为开源模型标杆


自 2023 年 2 月首次亮相以来,Llama 只用了 18 个月便从单一的先进基础模型发展成为面向开发者的强大系统。到如今,借助 Llama 3.1,Meta 为开发者提供了一个完整的参照系统,使他们可以轻松创建自己的智能体,并通过安全工具帮助他们负责任地创建。


除了下载量的持续增长,Meta 还与 AWS、微软 Azure、Databricks、戴尔、谷歌云、Groq、NVIDIA、IBM watsonx、Scale AI、Snowflake 等公司合作,帮助开发者发挥模型潜力。


发布 Llama 3.1 后,Meta 的主要云服务供应商的 Llama 使用量显著增长。具体来说,从 2024 年 5 月到 7 月,按 token 计算的使用量翻了一番多。



从今年 1 月到 7 月,Meta 的主要云服务供应商每月对 Llama 使用量增长了 10 倍。参数量最大的 Llama 3.1 405B 也很受欢迎,据某云服务供应商 8 月的数据显示,用户数最高的是 Llama 3.1 405B。


Llama 3.1 发布后,拥有访问 Llama 权限的合作伙伴增长了 5 倍,Wipro、Cerebras 和 Lambda 等知名企业也将成为其中的一员。


开发者社区对 Llama 的偏好也日益增长。据专注于 AI 基准测试的独立网站 Artificial Analysis 的调查,Llama 是开发者们的首选排行榜上的第二名。


在 Hugging Face 平台上,Llama 已有超过 60,000 个模型变体,活跃的开发者社区正在根据自己的需求,对 Llama 进行细致的定制和优化,包括 AT&T、DoorDash、高盛、Niantic、野村证券、Shopify、Spotify、Zoom 等在内的行业巨头,以及 Infosys 和 KPMG 等专业服务领域的领军企业,都已经将 Llama 集成到内部系统中。


在企业服务中,Llama 系列已经有一些成功的用例。基于 Llama 3.1 知名咨询公司埃森哲构建了一个用于 ESG(环境、社会和治理)报告的定制大模型。他们期望,用上了 AI 之后,写报告的生产力能提高 70%,质量提高 20% 至 30%。


通过微调 Llama 模型,美国电信巨头 AT&T 在客户服务搜索响应上取得了接近 33% 的大幅提升。这一改进不仅降低了成本,还提升了业务效率。


随着 Llama 生态系统的不断壮大,Meta AI 的功能和接入点也在同步扩展。现在,用户可以通过 Instagram、WhatsApp、Messenger 和 Facebook 等应用直接体验 Meta 的智能助手。


Meta 也没忘记心心念念的「元宇宙」,Meta 还在开发头显 Quest 系列和智能眼镜 Ray-Ban Meta,正在朝着一个目标迈进:届时,一个全天候待命、知冷知热、提供情绪价值的 AI 助手将以可穿戴的形式主动融入你的日常生活,为你提供帮助。


与此同时,OpenAI 也亮出了自己的数据,每周有超过 2 亿人在使用 ChatGPT,相比去年 11 月的报告,ChatGPT 每周的活跃用户数约为 1 亿,仅过半年,这个数字就涨了一倍。


在 ToB 赛道上,OpenAI 也不遑多让,92% 的财富 500 强公司都在使用 OpenAI 的产品,更便宜、更智能的 GPT-4o Mini 推出后,API 的使用量翻了一番。


评论两极分化:真·假开源


看到 Meta 的喜报,Grok 的 CEO Jonathan Ross 发来了贺电:一个大模型的下载量达到 3.5 亿次,太疯狂了!Linux 达到这个数字用了多久?



他还表示:开源赢了!到目前为止,Groq 已经向超过 40 万开发者每天提供 50 亿 Llama 系列模型的免费 token。但这仍然供不应求,Ross 称,即使 Groq 将部署的容量增加 10 倍,这些资源也会在 36 小时内用完。


Llama 系列以如此快的速度,达成了 3.5 亿次下载的成就,老黄也赶紧点了赞:「在过去的一个月里,我们见证了 Llama 3.1 以如此之快速度被应用部署,真是令人难以置信。」



但是在网友和合作伙伴的一片叫好声中,也有对 Meta 只开放代码,未开放模型权重的质疑声。



虽然 Meta 给自己全身贴满了「开源」的标签,但是最近开放源代码促进会(OSI)却明确表示:Llama 系列并不算真开源。


在 OSI 给出的定义下,判断一个 AI 模型真正开源,需要符合「四项基本自由」:不限制使用目的,允许深入研究其工作原理,支持随意修改,无论是否进行过修改都允许用户自由分享模型。


虽然 Llama 3 模型可以自由部署,但 Meta 限定了 Llama 3 可以生成的内容类型。因此, Llama 3 也不算真正的开源了。


然而 ,Meta 对 OSI 非黑即白的「二元论」提出了反对,他们认为开发大模型的成本很高,过程也很复杂。因此,对于开源的标准,应该有一个从完全开放到部分开放的范围,而不是只有完全开源或完全闭源两种极端状态,并且被 OSI 列入第一批「白名单」的开源模型中,都没有达到 Sota 的水准。


Meta 这么刚,知名杂志《经济学人》对此点评道:Meta 被指控正在「霸凌」开源社区。



在今年的 SIGGRAPH 大会上,扎克伯格曾在和黄仁勋的对谈中提及,Meta 做开源并非纯纯做慈善,而是一种明智的经营策略。在开源计算系统后,Meta 成为了行业标准,供应链主动对齐 Meta 的设计,这种为行业打造整套生态的经验,实际为 Meta 节省了数十亿美元。


同时,Meta 开源的决策也要拜苹果所赐,在以手机为代表的智能移动设备崛起后,苹果的闭源生态太过垄断,以至于扎克伯格放弃了很多想要开发的功能。为此,扎克伯格甚至当场爆粗。



但在 OSI 看来,Meta 现在的做法似乎让他们变成了「另一个苹果」。发出「Meta 正在霸凌开源社区」指控的正是 OSI 的执行董事 Stefano Maffulli:「扎克伯格真的在强迫整个行业跟随他的步伐」。


OSI 计划在今年 10 月正式揭晓对「开源 AI」定义的最终修订版。他们期望通过一个清晰而严格的标准,赋予开发者们信心:他们可以自由地使用、复制和修改像 Llama 这样的开源模型,而不必「受扎克伯格善意的摆布」。


文章来源“机器之心”,作者“佳琪”


关键词: Llama , AI , 大模型 , meta , 开源大模型
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner