# 热门搜索 #
搜索
搜索: VLM
让视觉语言模型搞空间推理,谷歌又整新活了

视觉语言模型虽然强大,但缺乏空间推理能力,最近 Google 的新论文说它的 SpatialVLM 可以做,看看他们是怎么做的。

来自主题: AI技术研报
7512 点击    2024-02-18 15:10
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务

训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了一种构建统一的图片和视频表征的框架。利用这种框架,可以大大减少VLM(视觉语言大模型)在训练和推理过程中的开销。

来自主题: AI资讯
5606 点击    2023-11-29 15:32
2023 年改变人工智能的最强大 7 种语言(LLM)和视觉语言模型(VLM)

在快速发展的人工智能领域,自然语言处理已成为研究人员和开发人员关注的焦点。近年来,在Transformer 架构和BERT 双向升级的基础上,出现了几种突破性的语言模型,突破了机器理解和生成的界限。

来自主题: AI技术研报
3513 点击    2023-08-31 22:43
现代人工智能是一种驯化

随着互联网规模的人工智能模型从粗糙的研究演示迅速成熟为面向用户的生产型系统,人们的期望越来越高,目标也发生了巨大变化。在短短几个月内,人工智能界已经从对概念验证的 "零敲碎打 "能力留下深刻印象,集体转向解决提高微调能力的质量和可靠性这一相对具有挑战性的 "最后一公里 "问题。

来自主题: AI技术研报
405 点击    2023-08-28 16:39