GPT-4o差点没及格!首个多任务长视频评测基准,它有亿点难 GPT-4o差点没及格!首个多任务长视频评测基准,它有亿点难 关键词: GPT-4o,AI,AI视频,大模型 难度大升级的多任务长视频理解评测基准MLVU来了! 来自主题: AI技术研报 9929 点击 2024-06-21 20:21
大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench 大模型鲁棒不鲁棒,PromptBench测一测: 首个大语言模型提示鲁棒性的评测基准PromptBench 关键词: PromptBench,提示词测试,Prompt 作为连接人类与大模型的桥梁,大模型对 「Prompt (提示词)」 究竟有多敏感?同样的prompt,可能写错个单词、写法不一样,都会出现不一样的结果。 来自主题: AI技术研报 8714 点击 2023-12-27 14:30