AI资讯新闻榜单内容搜索-多粒度视觉生成模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多粒度视觉生成模型

PUMA：商汤科技迈向多模态任务统一框架的多粒度视觉生成模型

PUMA（emPowering Unified MLLM with Multi-grAnular visual generation）是一项创新的多模态大型语言模型（MLLM），由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示，巧妙地平衡了视觉生成任务中的多样性与可控性。

来自主题: AI技术研报

5959 点击 2024-10-29 14:32