AI资讯新闻榜单内容搜索-多模态大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态大模型
多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

多模态大模型不够灵活,谷歌DeepMind创新架构Zipper:分开训练再「压缩」

最近的一系列研究表明,纯解码器生成模型可以通过训练利用下一个 token 预测生成有用的表征,从而成功地生成多种模态(如音频、图像或状态 - 动作序列)的新序列,从文本、蛋白质、音频到图像,甚至是状态序列。

来自主题: AI技术研报
8553 点击    2024-06-02 14:38
多语言大模型新SOTA!Cohere最新开源Aya-23:支持23种语言,8B/35B可选

多语言大模型新SOTA!Cohere最新开源Aya-23:支持23种语言,8B/35B可选

多语言大模型新SOTA!Cohere最新开源Aya-23:支持23种语言,8B/35B可选

Aya23在模型性能和语言种类覆盖度上达到了平衡,其中最大的35B参数量模型在所有评估任务和涵盖的语言中取得了最好成绩。

来自主题: AI技术研报
8605 点击    2024-05-31 18:18
多模态CoT思维链架构来了,现已开源|来自厦大&腾讯优图

多模态CoT思维链架构来了,现已开源|来自厦大&腾讯优图

多模态CoT思维链架构来了,现已开源|来自厦大&腾讯优图

多模态大模型,也有自己的CoT思维链了! 厦门大学&腾讯优图团队提出一种名为“领唱员(Cantor)”的决策感知多模态思维链架构,无需额外训练,性能大幅提升。

来自主题: AI技术研报
10137 点击    2024-05-28 20:56
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。 然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。 比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。 定位能力的缺失直接限制了多模态大模型在图像编辑,自动驾驶,机器人控制等下游领域的应用。针对这一问题,港大和字节跳动商业化团队的研究人员提出了一种新范式Groma

来自主题: AI资讯
8225 点击    2024-05-27 16:31
中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o

中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o

中国移动千亿多模态大模型发布,「九天-九九」风趣畅聊堪比GPT-4o

央企通信巨头再次奏响大模型舞台的超强音!刚刚结束的中国移动人工智能生态大会主旨论坛上,中国移动发布了全自研「九天」千亿多模态基座大模型,一举成为国内最值得信赖、最懂行业的全栈大模型。

来自主题: AI资讯
9360 点击    2024-05-26 11:56