AI TNT— 让一部分先用AI实现商业化

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: MLLM

港大字节提出多模态大模型新范式，模拟人类先感知后认知，精确定位图中物体

港大字节提出多模态大模型新范式，模拟人类先感知后认知，精确定位图中物体

当前，多模态大模型（MLLM）在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解，难以将理解的内容映射回图像上。比如，模型能轻易说出图中有哪些物体，但无法将物体在图中准确标识出来。定位能力的缺失直接限制了多模态大模型在图像编辑，自动驾驶，机器人控制等下游领域的应用。针对这一问题，港大和字节跳动商业化团队的研究人员提出了一种新范式Groma

来自主题: AI资讯

7637 点击 2024-05-27 16:31

让大模型理解手机屏幕，苹果多模态Ferret-UI用自然语言操控手机

让大模型理解手机屏幕，苹果多模态Ferret-UI用自然语言操控手机

此次，苹果提出的多模态大语言模型（MLLM） Ferret-UI ，专门针对移动用户界面（UI）屏幕的理解进行了优化，其具备引用、定位和推理能力。

来自主题: AI技术研报

4349 点击 2024-05-20 18:56

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

首个基于Mamba的MLLM来了！模型权重、训练代码等已全部开源

近年来，多模态大型语言模型（MLLM）在各个领域的应用取得了显著的成功。然而，作为许多下游任务的基础模型，当前的 MLLM 由众所周知的 Transformer 网络构成，这种网络具有较低效的二次计算复杂度。

来自主题: AI技术研报

6578 点击 2024-04-22 17:42

MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

MLLM真能看懂数学吗？MathVerse来了次摸底测评，放出当天登热榜

在大算力的数字化时代下，大语言模型（LLM）以其令人瞩目的发展速度，正引领着技术的潮流

来自主题: AI资讯

1313 点击 2024-04-19 21:47

文生图新SOTA！Pika北大斯坦福联合推出RPG，多模态助力解决文生图两大难题

文生图新SOTA！Pika北大斯坦福联合推出RPG，多模态助力解决文生图两大难题

近日，北大、斯坦福、以及Pika Labs发布了新的开源文生图框架，利用多模态LLM的能力成功解决文生图两大难题，表现超越SDXL和DALL·E 3

来自主题: AI技术研报

3126 点击 2024-02-17 11:00

一句指令自动玩手机，网上冲浪神器Mobile-Agent来了

一句指令自动玩手机，网上冲浪神器Mobile-Agent来了

随着多模态大语言模型（Multimodal Large Language Model，MLLM）的快速发展，以 MLLM 为基础的多模态 agent 逐渐应用于各种实际应用场景中，这使得借助多模态 agent 实现手机操作助手成为了可能。

来自主题: AI资讯

6657 点击 2024-02-04 13:39

准确率不足20%，GPT-4V/Gemini竟看不懂漫画！首个图像序列基准测试开源

准确率不足20%，GPT-4V/Gemini竟看不懂漫画！首个图像序列基准测试开源

马里兰大学联合北卡教堂山发布首个专为多模态大语言模型（MLLM）设计的图像序列的基准测试Mementos，涵盖了真实世界图像序列、机器人图像序列，以及动漫图像序列，用4761个多样化图像序列的集合，全面测试MLLM对碎散图像序列的推理能力！

来自主题: AI技术研报

1304 点击 2024-01-31 11:19

阿里mPLUG-Owl新升级，鱼与熊掌兼得，模态协同实现MLLM新SOTA

阿里mPLUG-Owl新升级，鱼与熊掌兼得，模态协同实现MLLM新SOTA

OpenAI GPT-4V 和 Google Gemini 都展现了非常强的多模态理解能力，推动了多模态大模型（MLLM）快速发展，MLLM 成为了现在业界最热的研究方向。

来自主题: AI资讯

2479 点击 2023-12-23 16:09

面壁智能联合清华发布最新多模态对齐框架RLHF-V，减少“过泛化”幻觉达业内最佳水平

面壁智能联合清华发布最新多模态对齐框架RLHF-V，减少“过泛化”幻觉达业内最佳水平

多模态技术是 AI 多样化场景应用的重要基础，多模态大模型（MLLM）展现出了优秀的多模态信息理解和推理能力，正成为人工智能研究的前沿热点。上周，谷歌发布 AI 大模型 Gemini，据称其性能在多模态任务上已全面超越 OpenAI 的 GPT-4V，再次引发行业的广泛关注和热议。

来自主题: AI资讯

2184 点击 2023-12-18 14:21

上一页当前第1页,共1页下一页