AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
36氪研究院|2024年AIGC行业研究:多模态大模型与商业应用

36氪研究院|2024年AIGC行业研究:多模态大模型与商业应用

36氪研究院|2024年AIGC行业研究:多模态大模型与商业应用

2024年2月,OpenAI发布其首款视频生成模型Sora,用户仅需输入一段文字即可生成长达一分钟场景切换流畅、细节呈现清晰、情感表达准确的高清视频,与一年前的AI生成视频相比,在各维度均实现了质的提升。

来自主题: AI资讯
8519 点击    2024-03-27 12:31
剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late-interaction Multi-modal Retriever (FLMR) 并进行了模型改进和 M2KR 上的大规模预训练。

来自主题: AI资讯
10921 点击    2024-03-25 17:01
通用文档理解新SOTA,多模态大模型TextMonkey来了

通用文档理解新SOTA,多模态大模型TextMonkey来了

通用文档理解新SOTA,多模态大模型TextMonkey来了

最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。

来自主题: AI资讯
3376 点击    2024-03-25 16:55
阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

阶跃星辰发布 Step 通用大模型:多模态、MoE、万亿模型参数

3 月 23 日,国内通用大模型创业公司阶跃星辰在 2024 全球开发者先锋大会上发布了公司的通用大模型产品。阶跃星辰创始人、CEO 姜大昕博士在大会开幕式上对外发布了 Step 系列通用大模型,包括 Step-1 千亿参数语言大模型、Step-1V 千亿参数多模态大模型以及 Step-2 万亿参数 MoE 语言大模型预览版。

来自主题: AI技术研报
8641 点击    2024-03-25 12:48
闭关一年创业大模型,姜大昕站在AGI呼啸的风中

闭关一年创业大模型,姜大昕站在AGI呼啸的风中

闭关一年创业大模型,姜大昕站在AGI呼啸的风中

我们就是奔着AGI去的,不然这群人聚在一起干嘛?2024年2月,在准备一场分享会的PPT中,前微软全球副总裁、如今的阶跃星辰CEO姜大昕,把他看到的一句评论放进了自我介绍: 在微软混得风生水起,怎么想不开创业?

来自主题: AI资讯
7451 点击    2024-03-25 10:15
界面财联社入局AI 国内首个千亿参数多模态金融大模型面市

界面财联社入局AI 国内首个千亿参数多模态金融大模型面市

界面财联社入局AI 国内首个千亿参数多模态金融大模型面市

"财跃F1":千亿参数金融大模型首发。国内首个千亿参数多模态金融大模型——“财跃F1金融大模型”今天(3月23日)在2024全球开发者先锋大会(GDC)上首发。

来自主题: AI资讯
5856 点击    2024-03-23 21:25
3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑

3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑

3D版Sora来了?UMass、MIT等提出3D世界模型,具身智能机器人实现新里程碑

具身基础模型突破2D,全新生成式视觉-语言-行动模型3D-VLA,在多项任务中显著提高了推理、多模态生成和规划的能力。

来自主题: AI资讯
4396 点击    2024-03-23 13:42
吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

吴恩达:AI智能体工作流今年将有巨大进展,可能超过下一代基础模型

下一步是智能体?随着 ChatGPT、GPT-4、Sora 的陆续问世,人工智能的发展趋势引起了广泛关注,特别是 Sora 让生成式 AI 模型在多模态方面取得显著进展。人们不禁会问:人工智能领域下一个突破方向将会是什么?

来自主题: AI资讯
7622 点击    2024-03-22 17:09
一口气读完《沙丘》 ,零一万物宝藏API正式开箱!酷炫Demo实测,多模态中文图表体验超越GPT-4V

一口气读完《沙丘》 ,零一万物宝藏API正式开箱!酷炫Demo实测,多模态中文图表体验超越GPT-4V

一口气读完《沙丘》 ,零一万物宝藏API正式开箱!酷炫Demo实测,多模态中文图表体验超越GPT-4V

国产大模型独角兽送福利来了,千万token免费用!最近,零一万物API正式开放,三款模型都非常能打,开发者们赶快来开箱吧。零一万物API开放平台,正式向开发者开放了!

来自主题: AI资讯
3925 点击    2024-03-22 16:46
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。

来自主题: AI技术研报
9768 点击    2024-03-21 18:35