AI科学家太多,谁靠谱一试便知!普林斯顿新基准CORE-Bench:最强模型仅有21%准确率 关键词: AI,AI科学家,CORE-Bench,人工智能 大模型的能力越来越强,用户在一些重要的任务中也可以依赖大模型,比如说辅助做科研。 不过现有科研辅助相关的基准测试都太简单,跟现实世界的任务差距还是比较大的。 来自主题: AI资讯 3764 点击 2024-09-25 17:15