打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度 打脸!GPT-4o输出长度8k都勉强,陈丹琦团队新基准测试:所有模型输出都低于标称长度 关键词: AI,模型训练,LONGPROC,人工智能 很多大模型的官方参数都声称自己可以输出长达32K tokens的内容,但这数字实际上是存在水分的?? 来自主题: AI技术研报 9205 点击 2025-01-16 10:30