AI资讯新闻榜单内容搜索-GPT4V

用LLaVA解读数万神经元，大模型竟然自己打开了多模态智能黑盒

以 GPT4V 为代表的多模态大模型（LMMs）在大语言模型（LLMs）上增加如同视觉的多感官技能，以实现更强的通用智能。虽然 LMMs 让人类更加接近创造智慧，但迄今为止，我们并不能理解自然与人工的多模态智能是如何产生的。

来自主题: AI技术研报

8325 点击 2024-12-07 15:02

国产多模态大模型，也开始卷上下文长度。

来自主题: AI资讯

12449 点击 2024-07-31 17:24

中科大、上海AI实验室等组成的ShareGPT4V团队，推出了新的视频数据集，登顶HuggingFace排行榜！

来自主题: AI技术研报

12423 点击 2024-06-23 16:10

继Sora官宣之后，多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来，LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力，文生视频、图生视频的新前沿不断被扩展令大家惊喜不已，抱有期待。

来自主题: AI资讯

8937 点击 2024-06-21 13:34

最新版本大模型，6 分钱 100 万 Token。

来自主题: AI资讯

9515 点击 2024-06-05 22:42

2023-2024年，以 GPT-4V、Gemini、Claude、LLaVA 为代表的多模态大模型（Multimodal LLMs）已经在文本和图像等多模态内容处理方面表现出了空前的能力，成为技术新浪潮。

来自主题: AI技术研报

10190 点击 2024-05-10 23:32

近期，多模态大模型 (MLLM) 在文本中心的 VQA 领域取得了显著进展，尤其是多个闭源模型，例如：GPT4V 和 Gemini，甚至在某些方面展现了超越人类能力的表现。

来自主题: AI技术研报

11141 点击 2024-04-25 19:32

一句话Siri就能帮忙打开美团外卖下订单的日子看来不远啦！

来自主题: AI资讯

8967 点击 2024-04-11 16:56

研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V，并在此基础上训练了一个7B模型，在多项多模态榜单上超越了其他同级模型。

来自主题: AI技术研报

11746 点击 2023-11-29 15:05