AI TNT— 让一部分先用AI实现商业化

11项指标击败GPT-4o！360攒局让16家大模型联手作战，组成最强“六边形战士”

终于，国产大模型能在综合能力上也能与GPT-4o一决雌雄了。

来自主题: AI资讯

7850 点击 2024-08-05 14:25

大模型常用评测基准汇总

基于评测维度，考虑到各评测集关注的评测维度，可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯

9107 点击 2024-07-23 19:24

大模型一对一战斗75万轮，GPT-4夺冠，Llama 3位列第五

关于Llama 3，又有测试结果新鲜出炉—— 大模型评测社区LMSYS发布了一份大模型排行榜单，Llama 3位列第五，英文单项与GPT-4并列第一。

来自主题: AI资讯

7881 点击 2024-04-23 14:20

新测试基准发布，最强开源Llama 3尴尬了

随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布，业界急需一款更难、更有区分度的基准测试。

来自主题: AI资讯

2488 点击 2024-04-22 20:58

能力与可信度可以兼得？GPT-4、Gemini等多模态大模型评测报告来了

2023 年我们正见证着多模态大模型的跨越式发展，多模态大语言模型（MLLM）已经在文本、代码、图像、视频等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。以 Llama 2，Mixtral 为代表的大语言模型（LLM），以 GPT-4、Gemini、LLaVA 为代表的多模态大语言模型跨越式发展。

来自主题: AI资讯

7427 点击 2024-03-01 13:47