AI资讯新闻榜单内容搜索-Arena

谷歌新版Gemini马甲被扒! LMArena实测：唯一能看懂表的AI, GPT-5乱答

谷歌的Gemini 3.0疑似上线LMArena！众多实测提前曝光，但效果嘛，很难评。Gemini 3.0传了这么久，终于还是露出「马脚」了。依然还是LMAreana竞技场，Gemini 3.0的两个「马甲」被扒了出来。

来自主题: AI资讯

9457 点击 2025-10-20 12:40

最近，两条消息同时刷屏：先是 9 月 23 日快手宣布其可灵 2.5 Turbo 图生/文生视频模型，推出 10 天后，即在 Artificial Analysis 上成为世界第一；紧接着，腾讯也宣布混元图像 3.0 模型在 LMArena 上成为世界第一。

来自主题: AI资讯

10658 点击 2025-10-11 12:11

全球文生图大模型王座，易主了。就在刚刚，LMArena竞技场发布了最新的文生图榜单，第一名来自中国，属于腾讯混元图像3.0！不仅超越了谷歌的Nano Banana，也超越了字节的Seedream和OpenAI的gpt-Image，在全球26个大模型中稳居第一。

来自主题: AI资讯

10555 点击 2025-10-05 21:36

8月，nano‑banana登顶LMArena文生图像榜单，带动LMArena社区流量暴增10倍，月活用户300万+。nano‑banana在LMArena启动盲测后，短短两周便吸引了超过500万次总投票，并单独赢得了250万+直接投票，创下历史最高参与度。

来自主题: AI资讯

6986 点击 2025-09-05 11:47

Gemini 2.5 Flash Image是谷歌最新发布的顶级图像生成与编辑模型，被网友誉为「最强图像模型」。其化身nano-banana在LMArena盲测中以历史最大优势夺冠，凭借角色一致性、提示编辑、原生世界知识和多图像融合四大能力，引发广泛关注。

来自主题: AI资讯

9118 点击 2025-08-27 13:18

近日，随着新一代大语言模型（LLM）的一波更新，开源大模型再次成为了热门讨论话题。软件工程师、自媒体 Rohan Paul 发现了一个惊人的现象：Design Arena 排行榜上排名前十几位开源 AI 模型全部来自中国。

来自主题: AI资讯

8940 点击 2025-08-26 12:20

数据在AI时代的重要性已经不言而喻，但悬而未决的是—— 如何精确量化这些数据的价值、辨别其优劣？为此，上海人工智能实验室OpenDataLab团队在数据领域持续深耕，正式推出了开放数据竞技场OpenDataArena。

来自主题: AI资讯

9543 点击 2025-08-25 11:04

继Kaggle Game Arena的淘汰赛后，国际象棋积分赛成果出炉！OpenAI o3以人类等效Elo 1685分傲视群雄，而Grok 4和Gemini 2.5 Pro紧随其后。DeepSeek R1和GPT-4.1、Claude Sonnet-4、Claude Opus-4并列第五。

来自主题: AI资讯

8451 点击 2025-08-23 13:17

AI能像科幻电影中的先知一样预测未来吗？一个名为「Prophet Arena」的全新基准测试，正通过预测真实世界事件来评估AI的「预言」能力。

来自主题: AI资讯

8622 点击 2025-08-18 19:05

AI模型排行榜分两类：以高考式标准化测试衡量特定能力的客观基准测试（如AAII、MMLU-Pro），以及用户匿名盲测、根据偏好对答案投票排名的人类偏好竞技场（如LMArena）。两者各有优劣和局限性，且排行榜本质是门生意。用户应基于实际需求而非榜单名次选择模型，实用性至上。

来自主题: AI资讯

10953 点击 2025-08-07 10:45