清华耶鲁推理模型新范式:动态推理实现高效测试时扩展,大大节省Token消耗 清华耶鲁推理模型新范式:动态推理实现高效测试时扩展,大大节省Token消耗 关键词: AI,模型训练,测试时扩展,test-time scaling 推理性能提升的同时,还大大减少Token消耗! 来自主题: AI技术研报 6793 点击 2025-04-08 09:25
小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law 小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law 关键词: Scaling Law,AI,Test-Time,大模型,DeepMind 不必增加模型参数,计算资源相同,小模型性能超过比它大14倍的模型! 来自主题: AI技术研报 4897 点击 2024-09-11 13:27