字节多模态大模型PixelLM:高效像素级推理,无需依赖SAM 关键词: PixelLM,字节AI,多模态PixelLM 目前大多数模型的能力还是局限于生成对整体图像或特定区域的文本描述,在像素级理解方面的能力(例如物体分割)相对有限。 来自主题: AI技术研报 8863 点击 2023-12-28 17:37