ECCV2024 Oral | 第一视角下的动作图像生成,Meta等提出LEGO模型 关键词: AI,LEGO,模型训练,人工智能 如何基于用户的问题和当前场景的照片,生成同一场景下的第一视角的动作图像,从而更准确地指导用户执行下一步行动? 来自主题: AI资讯 3350 点击 2024-10-02 11:22
精确指出特定事件发生时间!字节&复旦大学多模态大模型解读视频太香了 关键词: 多模态大模型,LLM,grounding,LEGO 字节&复旦大学多模态理解大模型来了:可以精确定位到视频中特定事件的发生时间。 来自主题: AI资讯 6636 点击 2024-01-14 13:44