AI资讯新闻榜单内容搜索-LMArena

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: LMArena
「纳米香蕉」LMArena两周500万投票,引爆10倍流量!谷歌、OpenAI扎堆打擂台

「纳米香蕉」LMArena两周500万投票,引爆10倍流量!谷歌、OpenAI扎堆打擂台

「纳米香蕉」LMArena两周500万投票,引爆10倍流量!谷歌、OpenAI扎堆打擂台

8月,nano‑banana登顶LMArena文生图像榜单,带动LMArena社区流量暴增10倍,月活用户300万+。nano‑banana在LMArena启动盲测后,短短两周便吸引了超过500万次总投票,并单独赢得了250万+直接投票,创下历史最高参与度。

来自主题: AI资讯
4280 点击    2025-09-05 11:47
谷歌「最强图像模型」横扫一切!Gemini 2.5 Flash Image正式上线!PS不存在了

谷歌「最强图像模型」横扫一切!Gemini 2.5 Flash Image正式上线!PS不存在了

谷歌「最强图像模型」横扫一切!Gemini 2.5 Flash Image正式上线!PS不存在了

Gemini 2.5 Flash Image是谷歌最新发布的顶级图像生成与编辑模型,被网友誉为「最强图像模型」。其化身nano-banana在LMArena盲测中以历史最大优势夺冠,凭借角色一致性、提示编辑、原生世界知识和多图像融合四大能力,引发广泛关注。

来自主题: AI资讯
6241 点击    2025-08-27 13:18
AI竞技场,归根到底只是一门生意

AI竞技场,归根到底只是一门生意

AI竞技场,归根到底只是一门生意

AI模型排行榜分两类:以高考式标准化测试衡量特定能力的客观基准测试(如AAII、MMLU-Pro),以及用户匿名盲测、根据偏好对答案投票排名的人类偏好竞技场(如LMArena)。两者各有优劣和局限性,且排行榜本质是门生意。用户应基于实际需求而非榜单名次选择模型,实用性至上。

来自主题: AI资讯
8315 点击    2025-08-07 10:45
GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

GPT-5「全家桶」爆出本周上线!惊艳首测秒出网页,编程彻底起飞

GPT-5发布节点又要提前了!在LMArena上,已悄然上线了「超大杯」GPT-5-pro,内部代号zenith。一些抽卡成功的网友,开启了惊艳实测。

来自主题: AI资讯
7412 点击    2025-07-28 14:55
刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

刚刚,Gemini 2.5 Pro升级,成编程模型新王

你的默认编程模型是什么?或许可以换一换了。刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)。其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸

来自主题: AI资讯
9242 点击    2025-05-07 09:22
AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

AI圈惊天丑闻,Meta作弊刷分实锤?顶级榜单曝黑幕,斯坦福MIT痛斥

刚刚,LMArena陷入了巨大争议,斯坦福MIT和Ai2等的研究者联手发论文痛斥,这个排行榜已经被Meta等公司利用暗中操作排名!Karpathy也下场帮忙锤了一把。而LMArena官方立马回应:论文存在多处错误,指控不实。

来自主题: AI资讯
8024 点击    2025-05-01 14:07
马斯克“地表最强”Grok 3炸场,竞技场首超1400分

马斯克“地表最强”Grok 3炸场,竞技场首超1400分

马斯克“地表最强”Grok 3炸场,竞技场首超1400分

刚刚,马斯克xAI的Grok 3终于亮相(超300万人次围观)!一出道即巅峰,竞技场(lmarena.ai)官方给出了这样的评价:Grok 3是首个突破1400分的模型,并且在所有类别中排名第一。

来自主题: AI资讯
8185 点击    2025-02-18 15:03