AI资讯新闻榜单内容搜索-多模态模型

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态模型

多模态长文本理解测评首发：46款模型无一攻克128K难关

多模态长文本理解测评首发：46款模型无一攻克128K难关

多模态长文本理解测评首发：46款模型无一攻克128K难关

来自香港科技大学、腾讯西雅图AI Lab、爱丁堡大学、Miniml.AI、英伟达的研究者联合提出了MMLongBench，旨在全面评估多模态模型的长文本理解能力。

来自主题: AI技术研报

9336 点击 2025-05-23 14:52

自回归+扩散！Salesforce开源统一多模态模型BLIP3-o，图像理解与生成全拿下

自回归+扩散！Salesforce开源统一多模态模型BLIP3-o，图像理解与生成全拿下

自回归+扩散！Salesforce开源统一多模态模型BLIP3-o，图像理解与生成全拿下

OpenAI 的 GPT-4o 在图像理解、生成和编辑任务上展现了顶级性能。流行的架构猜想是：

来自主题: AI技术研报

11286 点击 2025-05-23 11:42

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

颜水成领衔，给AI分段位！超100款多模态模型，无人达到L5

理想中的多模态大模型应该是什么样？十所顶尖高校联合发布General-Level评估框架和General-Bench基准数据集，用五级分类制明确了多模态通才模型的能力标准。当前多模态大语言模型在任务支持、模态覆盖等方面存在不足，且多数通用模型未能超越专家模型，真正的通用人工智能需要实现模态间的协同效应。

来自主题: AI技术研报

10907 点击 2025-05-19 17:08

谢赛宁等推出统一多模态模型！替代VAE实现图像理解/生成双SOTA，代码权重数据集全开源

谢赛宁等推出统一多模态模型！替代VAE实现图像理解/生成双SOTA，代码权重数据集全开源

谢赛宁等推出统一多模态模型！替代VAE实现图像理解/生成双SOTA，代码权重数据集全开源

统一图像理解和生成，还实现了新SOTA。

来自主题: AI技术研报

10344 点击 2025-05-17 16:35

字节最强多模态模型登陆火山引擎！Seed1.5-VL靠20B激活参数狂揽38项SOTA

字节最强多模态模型登陆火山引擎！Seed1.5-VL靠20B激活参数狂揽38项SOTA

字节最强多模态模型登陆火山引擎！Seed1.5-VL靠20B激活参数狂揽38项SOTA

字节拿出了国际顶尖水平的视觉–语言多模态大模型。

来自主题: AI资讯

12347 点击 2025-05-14 16:23

互联网大厂，不再需要AI Lab

互联网大厂，不再需要AI Lab

互联网大厂，不再需要AI Lab

4月29日，腾讯TEG进行架构调整，新成立大语言和多模态模型部，并对数据平台和机器学习平台职责进行调整。

来自主题: AI资讯

8972 点击 2025-05-09 14:28

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

苹果提出原生多模态Scaling Law！早融合+MoE，性能飙升秘密武器

研究揭示早融合架构在低计算预算下表现更优，训练效率更高。混合专家（MoE）技术让模型动态适应不同模态，显著提升性能，堪称多模态模型的秘密武器。

来自主题: AI技术研报

11110 点击 2025-05-06 14:41

英伟达华人硬核AI神器，「描述一切」秒变细节狂魔！仅3B逆袭GPT-4o

英伟达华人硬核AI神器，「描述一切」秒变细节狂魔！仅3B逆袭GPT-4o

英伟达华人硬核AI神器，「描述一切」秒变细节狂魔！仅3B逆袭GPT-4o

视觉AI终极突破来了！英伟达等机构推出超强多模态模型DAM，仅3B参数，就能精准描述图像和视频中的任何细节。刚刚，英伟达联手UC伯克利、UCSF团队祭出首个神级多模态模型——Describe Anything Model（DAM），仅3B参数。

来自主题: AI资讯

11499 点击 2025-04-27 10:47

图片模型最具创意实践指南 - 创意人的春天已来！

图片模型最具创意实践指南 - 创意人的春天已来！

图片模型最具创意实践指南 - 创意人的春天已来！

GPT-4o更新的端到端多模态模型，让创意端获得前所未有的自由度。

来自主题: AI资讯

9163 点击 2025-04-21 15:14

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

让大模型进入多模态模式，从而能够有效感知世界，是最近 AI 领域里人们一直的探索目标。

来自主题: AI技术研报

8035 点击 2025-04-16 14:01

上一页当前第7页,共17页下一页