一招分辨刷榜作弊大模型,博士小哥开源AI数学“照妖镜”
一招分辨刷榜作弊大模型,博士小哥开源AI数学“照妖镜”如今很多大模型都声称擅长数学,谁有真才实学?谁是靠背测试题“作弊”的?有人在今年刚刚公布题目的匈牙利全国数学期末考试上做了一把全面测试。很多模型一下子就“现原形”了。
来自主题: AI技术研报
2823 点击 2023-11-16 14:20
如今很多大模型都声称擅长数学,谁有真才实学?谁是靠背测试题“作弊”的?有人在今年刚刚公布题目的匈牙利全国数学期末考试上做了一把全面测试。很多模型一下子就“现原形”了。