AI资讯新闻榜单内容搜索-MMLU

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: MMLU

最强开源大模型Llama 3来了，4000亿参数狙击GPT-4，训练数据达Llama 2七倍

最强开源大模型Llama 3来了，4000亿参数狙击GPT-4，训练数据达Llama 2七倍

最强开源大模型Llama 3来了，4000亿参数狙击GPT-4，训练数据达Llama 2七倍

智东西4月19日消息，Meta推出迄今为止能力最强的开源大模型Llama 3系列，发布8B和70B两个版本。 Llama 3在一众榜单中取得开源SOTA（当前最优效果）。Llama 3 8B在MMLU、GPQA、HumanEval、GSM-8K等多项基准上超过谷歌Gemma 7B和Mistral 7B Instruct。

来自主题: AI技术研报

9433 点击 2024-04-20 12:10

实测“超越GPT-4”的百川超千亿参数模型：医疗问答业内最强？

实测“超越GPT-4”的百川超千亿参数模型：医疗问答业内最强？

实测“超越GPT-4”的百川超千亿参数模型：医疗问答业内最强？

百川智能又对产品进行了一次大更新，发布了Baichuan 3模型。这次更新后，在多个权威通用能力评测CMMLU、GAOKAO和AGI-Eval中，其英文能力已经逼近 GPT-4，在中文任务表现上甚至超越了GPT-4：

来自主题: AI资讯

9864 点击 2024-01-30 11:27

谷歌Gemini刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

谷歌Gemini刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

谷歌Gemini刚发就惹质疑：测试标准有失偏颇，效果视频疑似剪辑

谷歌憋了许久的大招，双子座Gemini大模型终于发布！其中一图一视频最引人注目：一图，MMLU多任务语言理解数据集测试，Gemini Ultra不光超越GPT-4，甚至超越了人类专家。

来自主题: AI资讯

8140 点击 2023-12-07 16:44

一言不合就跑分，国内AI大模型为何沉迷于“刷榜”

一言不合就跑分，国内AI大模型为何沉迷于“刷榜”

一言不合就跑分，国内AI大模型为何沉迷于“刷榜”

商业利益的加入，就必然会驱使AI大模型厂商争先恐后去刷榜了。“不服跑个分”这句话，相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件，由于能够在一定程度上反映手机的性能，因此备受玩家的关注。

来自主题: AI资讯

7324 点击 2023-12-03 15:31

上一页当前第2页,共2页下一页