# 热门搜索 #
搜索
搜索: Arena-Hard
新测试基准发布,最强开源Llama 3尴尬了

随着Claude 3、Llama 3甚至之后GPT-5等更强模型发布,业界急需一款更难、更有区分度的基准测试。

来自主题: AI资讯
2488 点击    2024-04-22 20:58