AI资讯新闻榜单内容搜索-X2SAM

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: X2SAM

从图像到视频的任意分割：X2SAM让MLLM 真正看懂像素级时空世界

为了解决这一问题，来自中山大学和美团的研究团队提出了 X2SAM，一个统一的图像与视频分割多模态大模型框架。它希望让模型不仅能「看懂」图像和视频，还能进一步「指出」目标在每个像素上的准确位置。

来自主题: AI技术研报

7936 点击 2026-05-16 10:50