AI资讯新闻榜单内容搜索-Arena

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: Arena

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

1M长上下文，满血版Gemini 2.0又一次登上Chatbot Arena榜首

就在国内各家大模型厂商趁年底疯狂卷的时候，太平洋的另一端也没闲着。就在今天，谷歌发布了 Gemini 2.0 Flash Thinking 推理模型的加强版，并再次登顶 Chatbot Arena 排行榜。

来自主题: AI资讯

10831 点击 2025-01-22 18:40

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

自动化、可复现，基于大语言模型群体智能的多维评估基准Decentralized Arena来了

Maitrix.org 是由 UC San Diego, John Hopkins University, CMU， MBZUAI 等学术机构学者组成的开源组织，致力于发展大语言模型 (LLM)、世界模型 (World Model)、智能体模型 (Agent Model) 的技术以构建 AI 驱动的现实。

来自主题: AI技术研报

6929 点击 2024-10-22 14:38

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

谷歌开源最强端侧小模型：2B参数越级跑赢GPT-3.5-Turbo，苹果15Pro运行飞快

今年 6 月底，谷歌开源了 9B、27B 版 Gemma 2 模型系列，并且自亮相以来，27B 版本迅速成为了大模型竞技场 LMSYS Chatbot Arena 中排名最高的开放模型之一，在真实对话任务中比其两倍规模以上的模型表现还要好。

来自主题: AI技术研报

7357 点击 2024-08-01 15:41

贾扬清点赞：3K star量的SGLang上新，加速Llama 405B推理秒杀vLLM、TensorRT-LLM

贾扬清点赞：3K star量的SGLang上新，加速Llama 405B推理秒杀vLLM、TensorRT-LLM

贾扬清点赞：3K star量的SGLang上新，加速Llama 405B推理秒杀vLLM、TensorRT-LLM

用来运行 Llama 3 405B 优势明显。

来自主题: AI技术研报

10369 点击 2024-07-27 19:22

大模型常用评测基准汇总

大模型常用评测基准汇总

大模型常用评测基准汇总

基于评测维度，考虑到各评测集关注的评测维度，可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯

14371 点击 2024-07-23 19:24

力压70B Llama 3，Gemma 2成最强开源模型！大佬质疑用榜单prompt微调引全网热议

力压70B Llama 3，Gemma 2成最强开源模型！大佬质疑用榜单prompt微调引全网热议

力压70B Llama 3，Gemma 2成最强开源模型！大佬质疑用榜单prompt微调引全网热议

导读：时隔4个月上新的Gemma 2模型在LMSYS Chatbot Arena的排行上，以27B的参数击败了许多更大规模的模型，甚至超过了70B的Llama-3-Instruct，成为开源模型的性能第一！

来自主题: AI资讯

10660 点击 2024-07-02 11:20

3D生成竞技场来了！比拼360°环绕视频，最强模型由你pick 关注前沿科技量子位 2024-05-28 12:29 北京

3D生成竞技场来了！比拼360°环绕视频，最强模型由你pick 关注前沿科技量子位 2024-05-28 12:29 北京

3D生成竞技场来了！比拼360°环绕视频，最强模型由你pick 关注前沿科技量子位 2024-05-28 12:29 北京

3D生成也有自个儿的人工评测竞技场了～来自复旦大学和上海AI lab的研究人员搞了个3DGen-Arena，和大语言模型的Chatbot-Arena、GenAI-Arena等一脉相承，要让大伙儿对3D生成模型来一场公开、匿名的评测

来自主题: AI资讯

10835 点击 2024-05-28 20:50

中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一

中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一

中国大模型头名易主：全球盲测榜单上，Yi-Large与GPT-4o中文并列第一

上周，一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena

来自主题: AI资讯

11724 点击 2024-05-21 15:53

众包新玩法！LLM竞技场诞生基准测试，严格分离学渣学霸

众包新玩法！LLM竞技场诞生基准测试，严格分离学渣学霸

众包新玩法！LLM竞技场诞生基准测试，严格分离学渣学霸

最公平的大模型基准测试诞生了！来自LLM竞技场，最接近人类偏好，数据新鲜、速度快、成本低，严格分离学渣和学霸。

来自主题: AI技术研报

12041 点击 2024-05-20 16:20

新测试基准发布，最强开源Llama 3尴尬了

新测试基准发布，最强开源Llama 3尴尬了

新测试基准发布，最强开源Llama 3尴尬了

随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布，业界急需一款更难、更有区分度的基准测试。

来自主题: AI资讯

4892 点击 2024-04-22 20:58

上一页当前第8页,共9页下一页