多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学 多模态大模型事实正确性评估:o1最强,模型普遍过于自信,最擅长现代建筑/工程技术/科学 关键词: AI,模型训练,ChineseSimpleVQA,中文视觉问答基准 OpenAI o1视觉能力还是最强,模型们普遍“过于自信”! 来自主题: AI技术研报 7828 点击 2025-02-23 16:23