AI资讯新闻榜单内容搜索-MoE-LLaVA

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: MoE-LLaVA

3B模型不输7B LLaVA！北大多模态MoE模型登GitHub热榜

混合专家（MoE）架构已支持多模态大模型，开发者终于不用卷参数量了！北大联合中山大学、腾讯等机构推出的新模型MoE-LLaVA，登上了GitHub热榜。

来自主题: AI技术研报

5873 点击 2024-02-09 13:54

对于大型视觉语言模型（LVLM）而言，扩展模型可以有效提高模型性能。然而，扩大参数规模会显著增加训练和推理成本，因为计算中每个 token 都会激活所有模型参数。

来自主题: AI技术研报

8828 点击 2024-01-31 16:23