AI资讯新闻榜单内容搜索-多模态

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态

GPT-4结合SAM2：免训练多模态分割的全新解决方案！| 已开源

GPT-4结合SAM2：免训练多模态分割的全新解决方案！| 已开源

GPT-4结合SAM2：免训练多模态分割的全新解决方案！| 已开源

免训练多模态分割领域有了新突破！

来自主题: AI技术研报

6613 点击 2024-09-07 17:22

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。

来自主题: AI技术研报

10284 点击 2024-09-07 11:04

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

视频理解仍然是计算机视觉和人工智能领域的一个主要挑战。最近在视频理解上的许多进展都是通过端到端地训练多模态大语言模型实现的[1,2,3]。然而，当这些模型处理较长的视频时，内存消耗可能会显著增加，甚至变得难以承受，并且自注意力机制有时可能难以捕捉长程关系 [4]。这些问题阻碍了将端到端模型进一步应用于视频理解。

来自主题: AI技术研报

10297 点击 2024-09-06 11:59

北大领衔，多智能体强化学习研究登上Nature子刊

北大领衔，多智能体强化学习研究登上Nature子刊

北大领衔，多智能体强化学习研究登上Nature子刊

近日，由北京大学人工智能研究院杨耀东课题组牵头完成的研究成果 ——「大规模多智能体系统的高效强化学习」在人工智能顶级学术期刊 Nature Machine Intelligence 上发表。

来自主题: AI技术研报

9278 点击 2024-09-06 11:55

LLM 进化分岔口：多模态、成本、代码推理

LLM 进化分岔口：多模态、成本、代码推理

LLM 进化分岔口：多模态、成本、代码推理

头部模型的新一代模型的是市场观测、理解 LLM 走向的风向标。即将发布的 OpenAI GPT-Next 和 Anthropic Claude 3.5 Opus 无疑是 AGI 下半场最关键的事件。

来自主题: AI资讯

9849 点击 2024-09-06 11:44

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

大模型走向物理世界，TeleAI 发布大模型驱动的具身智能综述，覆盖300篇文献

近年来，大模型在人工智能领域掀起了一场革命，各种文本、图像、多模态大模型层出不穷，已经深深地改变了人们的工作和生活方式。

来自主题: AI技术研报

9533 点击 2024-09-04 23:24

防AI换脸视频诈骗，中电金信联合复旦提出多模态鉴伪法，还入选顶会ACM MM

防AI换脸视频诈骗，中电金信联合复旦提出多模态鉴伪法，还入选顶会ACM MM

防AI换脸视频诈骗，中电金信联合复旦提出多模态鉴伪法，还入选顶会ACM MM

该论文作者来自复旦大学、中电金信及上海智能视觉计算协同创新中心团队，论文已被多媒体领域顶级国际会议 ACM MultiMedia 2024 接收，并将在该大会上进行口头报告（Oral 接收率仅 3.97%）。

来自主题: AI技术研报

8930 点击 2024-09-01 15:33

情感分析的终极形态：全景式细粒度多模态对话情感分析基准PanoSent

情感分析的终极形态：全景式细粒度多模态对话情感分析基准PanoSent

情感分析的终极形态：全景式细粒度多模态对话情感分析基准PanoSent

罗盟，本工作的第一作者。新加坡国立大学（NUS）人工智能专业准博士生，本科毕业于武汉大学。主要研究方向为多模态大语言模型和 Social AI、Human-eccentric AI。

来自主题: AI技术研报

7551 点击 2024-08-31 10:14

让AI更懂物理世界！人大北邮上海AI Lab等提出多模态分割新方法 | ECCV2024

让AI更懂物理世界！人大北邮上海AI Lab等提出多模态分割新方法 | ECCV2024

让AI更懂物理世界！人大北邮上海AI Lab等提出多模态分割新方法 | ECCV2024

让AI像人类一样借助多模态线索定位感兴趣的物体，有新招了！

来自主题: AI技术研报

8637 点击 2024-08-30 15:30

超越GPT-4o！阿里发布最强开源多模态模型Qwen2-VL，支持实时视频对话

超越GPT-4o！阿里发布最强开源多模态模型Qwen2-VL，支持实时视频对话

超越GPT-4o！阿里发布最强开源多模态模型Qwen2-VL，支持实时视频对话

新的最强开源多模态大模型来了！

来自主题: AI技术研报

10395 点击 2024-08-30 15:24

上一页当前第78页,共108页下一页