# 热门搜索 #
搜索
搜索: C-Eval
大模型常用评测基准汇总

基于评测维度,考虑到各评测集关注的评测维度,可以将其划分为通用评测基准和具体评测基准。

来自主题: AI资讯
9108 点击    2024-07-23 19:24
一言不合就跑分,国内AI大模型为何沉迷于“刷榜”

商业利益的加入,就必然会驱使AI大模型厂商争先恐后去刷榜了。“不服跑个分”这句话,相信关注手机圈的朋友一定不会感到陌生。诸如安兔兔、GeekBench等理论性能测试软件,由于能够在一定程度上反映手机的性能,因此备受玩家的关注。

来自主题: AI资讯
4838 点击    2023-12-03 15:31