新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜
6969点击    2024-12-07 15:29

OpenAI“双12”刚进行到第二天,就把大模型圈搅得好不热闹!


一边是Meta没预告就发布了Llama 3.3,70B版本就能实现以前405B的性能。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


另一边谷歌的Gemini也上线了新的实验版模型,再一次登上大模型竞技场榜首。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


有网友感叹,o1、Llama 3.3和新版Gemini接连发布,马斯克的Grok3也要来,还有GPT-4.5初露端倪……这简直是最棒的一个圣诞季。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


Llama 3.3:70B实现405B效果


Llama 3.3目前只有70B一个型号。


但在指令遵循(IFEval)、数学(MATH)、推理(GPQA Diamond)等领域,水平都超过了七月份发布的Llama 3.1 405B。


在语言(MMLU)、代码(HumanEval)、长文本和多语种能力上,成绩也和Llama 3.1 405B比较接近。


而在工具使用(BFCL)上,和405B的差距则显得稍大一些。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


不过,Llama 3.3的使用成本要比Llama 3.1 405B低得多


虽然Llama本身是免费的,但是各个大模型平台的服务价格也可以作为衡量成本的一个参考。


在Meta合作的平台当中,Llama 3.3最便宜的价格是0.1/0.4美元每百万输入/输出Token。


而Llama 3.1 405B,则是1美元每百万输入token,是Llama 3.3的10倍,输出token为1.8美元,是Llama 3.3的4.5倍。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


Meta生成式AI团队领导者Ahmad Al-Dahle表示,Llama 3.3能用70B实现405B的效果,主要是“运用了后训练技术的最新进展”,并点名其中包括在线偏好优化(online preference optimization)


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


Meta AI官方账号也提到,Llama 3.3的进步归功于新的对齐过程和在线强化学习技术的进步。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


目前,Llama 3.3的模型权重已在官网和Hugging Face上开放下载。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


Gemini迎来周岁生日


Gemini 1206上线的这天,刚好是Gemini的一周岁生日。


不过,从节奏和以日期命名的方式来看,Gemini更像是一次例行更新(上一个版本是1121)


当然成绩还是很不错的,直接登上了lmsys大模型竞技场的榜首


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


而且不只是总成绩夺冠,困难提示词、代码、数学、创意写作等各个单项排名也都是第一


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


实际上,Gemini此前有个1114版本,也当了一周的“榜一大哥”,后来被更新的GPT-4o给比了下去。


现在的最新版本,又让Gemini重新回到了榜单上的王座。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


此外,谷歌AI Studio产品负责人(原OpenAI开发者社区主管)Logan介绍,Gemini 1206拥有2百万token的上下文窗口,目前可通过谷歌AI Studio和Gemini API免费使用。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


谷歌首席科学家Jeff Dean表示,取得这样的成绩是对Gemini生日最好的庆祝方式。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


不过也有网友给谷歌泼了盆冷水,表示o1还没出现在这个榜单上,而且GPT-4.5就要来了,谷歌第一的位置恐怕很快又会被OpenAI夺走。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


One More Thing


除了谷歌和Meta,马斯克xAI也被盛传即将发布Grok 3。


有网友发现,正在测试的Grok 2 mini消失了,认为这是要发Grok 3的征兆。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


除了对Grok 3的猜测,还有一条更确定的消息——此前要充会员才能用的Grok,现在可以免费用了


不过免费用户用量比较有限,每两小时只能处理10条消息,而图片分析一天只能处理三张。


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


有意思的是,我们试了试询问Grok自己,它也表示Grok 3计划在这个月上线。


但抓马的是,点进后面引用的消息源,发现这名博主也是问Grok之后发的帖子……


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜


那么,在这个发布密集的十二月,你最钟意或者最期待哪一款产品呢?


参考链接:


[1]https://x.com/AIatMeta/status/1865079067390956006


[2]https://x.com/Ahmad_Al_Dahle/status/1865071436630778109


[3]https://x.com/lmarena_ai/status/1865080944455225547


文章来自于微信公众号“量子位”,作者“克雷西”


新版Llama 3 70B反超405B!Meta开卷后训练,谷歌马斯克都来抢镜

关键词: AI , Llama 3 , Gemini , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0