AI TNT— 让一部分先用AI实现商业化

国产大模型，多模态能力都开始超越GPT-4-Turbo了？？

来自主题: AI资讯

8982 点击 2024-08-08 14:51

基于评测维度，考虑到各评测集关注的评测维度，可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯

9108 点击 2024-07-23 19:24

OpenAI长期霸榜的SuperCLUE（中文大模型测评基准），终于被国产大模型反将一军。

来自主题: AI资讯

6349 点击 2024-05-22 18:17

商业利益的加入，就必然会驱使AI大模型厂商争先恐后去刷榜了。“不服跑个分”这句话，相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件，由于能够在一定程度上反映手机的性能，因此备受玩家的关注。

来自主题: AI资讯

4838 点击 2023-12-03 15:31

新华社研究院发布了《人工智能大模型体验报告2.0》，对国内主流大模型进行使用体验的横向测评。该榜单用500道题目评测了国内8款主流AI大模型，最终讯飞星火排名第一，百度文心一言排名第二，阿里通义千问排在倒数第二。

来自主题: AI资讯

8834 点击 2023-09-24 12:43