
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升
英伟达开源NVLM 1.0屠榜多模态!纯文本性能不降反升NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。
来自主题: AI技术研报
7508 点击 2024-09-24 12:27
NVLM 1.0系列多模态大型语言模型在视觉语言任务上达到了与GPT-4o和其他开源模型相媲美的水平,其在纯文本性能甚至超过了LLM骨干模型,特别是在文本数学和编码基准测试中,平均准确率提高了4.3个百分点。
性能超越 Llama-3,主要用于合成数据。