北大伯克利联手“拷问”大模型:最强Agent也才40分!新基准专治“不听话”的AI分析师 北大伯克利联手“拷问”大模型:最强Agent也才40分!新基准专治“不听话”的AI分析师 关键词: AI,模型训练,IDA-Bench,AI基准 给大模型当老师,让它一步步按你的想法做数据分析,有多难? 来自主题: AI技术研报 6177 点击 2025-06-10 16:25