AI资讯新闻榜单内容搜索-模型竞技场

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型竞技场
GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

GPT-4.5智商测试94,登上LLM竞技场榜首!网友质疑黑幕,实测结果惊人

在知名AI排行榜LM Arena中,曾全班垫底的GPT-4.5竟一度拿下第一?甚至在数学、编程等领域表现优异,这反常的表现让网友们一度质疑:大模型竞技场莫非被LLM操纵了?不过网友们在实测后却惊讶发现,GPT-4.5的确情商爆表,不用推理就能理解人类的深层意图!

来自主题: AI资讯
6238 点击    2025-03-05 13:31
GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

GPT-4.5登顶6小时即失守!Grok-3上演1分逆袭

基础模型竞争又紧张刺激起来了!GPT-4.5刚登顶竞技场且全任务分类第一名,6小时后总榜就被马斯克的新版Grok-3反超。两者都是获得3000+票数,总分1412:1411只差一分。

来自主题: AI资讯
6238 点击    2025-03-04 13:11
杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

杭州超越杭州:阿里Qwen2.5-Max反超DeepSeek-V3!网友:中国AI正在快速缩小差距

刚刚,大模型竞技场榜单上再添一款国产模型——来自阿里,Qwen2.5-Max,超越了DeepSeek-V3,以总分1332的成绩位列总榜第七。同时还一举超越Claude 3.5 Sonnet、Llama 3.1 405B等模型。

来自主题: AI资讯
6940 点击    2025-02-05 11:19
一觉醒来,在逆水寒里被AI娘包围了?豆包Kimi通义现身搅动江湖

一觉醒来,在逆水寒里被AI娘包围了?豆包Kimi通义现身搅动江湖

一觉醒来,在逆水寒里被AI娘包围了?豆包Kimi通义现身搅动江湖

前两天,在游戏论坛闲逛时,看见一个帖子说《逆水寒》手游更新了。这个 AI 浓度超高的游戏最近多了几位各有特色的「AI 娘」,还多了一种名叫「AI 大模型竞技场」的新玩法。

来自主题: AI资讯
8313 点击    2025-01-18 11:27
李开复回应一切:竞技场排名“让我们有信心继续做预训练”

李开复回应一切:竞技场排名“让我们有信心继续做预训练”

李开复回应一切:竞技场排名“让我们有信心继续做预训练”

国产大模型首次在国际最具挑战的“大模型竞技场”榜单上超过GPT-4o(5月版本),当零一万物的名字紧跟在OpenAI、Google之后,李开复却如是坦言。

来自主题: AI资讯
3595 点击    2024-11-01 10:41
又来?神秘红熊猫模型Red_panda登顶竞技场!超过FLUX1.1Pro~

又来?神秘红熊猫模型Red_panda登顶竞技场!超过FLUX1.1Pro~

又来?神秘红熊猫模型Red_panda登顶竞技场!超过FLUX1.1Pro~

最近,在全球人工智能模型竞技场(Artificial Analysis)文生图模型排行榜中,一个名叫Red_panda的新模型突然杀出重围,以9%的胜率超越了原榜一大哥Flux1.1Pro成为新王!

来自主题: AI资讯
6030 点击    2024-10-29 11:49
国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

国产大模型竞技场首超GPT-4o!零一万物GLM共同跻身Top10

国产大模型首次在公开榜单上超过GPT-4o! 就在刚刚,“大模型六小强”之一的零一万物正式对外发布新旗舰模型——Yi-Lightning(闪电)。

来自主题: AI资讯
3610 点击    2024-10-16 14:12
“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?

“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?

“偷”X数据,用特斯拉显卡,马斯克把AI炼成啥样了?

有个怪事儿,前段时间,大模型竞技场上,一位代码为sus-column-r的匿名模型横空出世

来自主题: AI资讯
7160 点击    2024-08-16 10:45