AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

用AI短视频「反哺」长视频理解,腾讯MovieLLM框架瞄准电影级连续帧生成

在视频理解这一领域,尽管多模态模型在短视频分析上取得了突破性进展,展现出了较强的理解能力,但当它们面对电影级别的长视频时,却显得力不从心。因而,长视频的分析与理解,特别是对于长达数小时电影内容的理解,成为了当前的一个巨大挑战。

来自主题: AI技术研报
9756 点击    2024-03-10 16:19
ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

ICLR 2024 Oral:长视频中噪声关联学习,单卡训练仅需1天

在 2024 世界经济论坛的一次会谈中,图灵奖得主 Yann LeCun 提出用来处理视频的模型应该学会在抽象的表征空间中进行预测,而不是具体的像素空间 [1]。借助文本信息的多模态视频表征学习可抽取利于视频理解或内容生成的特征,

来自主题: AI技术研报
10617 点击    2024-03-05 14:36
0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR

0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR

0.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR

最近,文生视频模型 Sora 掀起了新一轮生成式 AI 模型浪潮,模型的多模态能力引起广泛关注。

来自主题: AI技术研报
6187 点击    2024-03-05 14:30
全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

Ideogram凭借不输Midjourney的生图能力和遥遥领先的图片中文字渲染能力,获得了包括Jeff Dean和Karpathy在内一众大佬的8000万美元融资,文生图这条离钱最近的AI赛道又加入了一名重量级选手。

来自主题: AI资讯
6552 点击    2024-03-01 17:28
OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure

OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure

OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure

人形机器人已然成为科技和投资界的新宠!刚刚,OpenAI官宣将与独角兽Figure合作,专为机器人打造下一代AI大模型,具身AGI真的要来了。

来自主题: AI资讯
8858 点击    2024-03-01 17:16
能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了

能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了

能力与可信度可以兼得?GPT-4、Gemini等多模态大模型评测报告来了

2023 年我们正见证着多模态大模型的跨越式发展,多模态大语言模型(MLLM)已经在文本、代码、图像、视频等多模态内容处理方面表现出了空前的能力,成为技术新浪潮。以 Llama 2,Mixtral 为代表的大语言模型(LLM),以 GPT-4、Gemini、LLaVA 为代表的多模态大语言模型跨越式发展。

来自主题: AI资讯
8806 点击    2024-03-01 13:47
“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资

“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资

“国家队”入局,多模态大模型企业联汇科技宣布完成新一轮数亿元战略融资

近日,杭州联汇科技股份有限公司(以下简称 “联汇科技”)宣布完成新一轮数亿元战略融资,投资方由中国移动产业链发展基金中移和创投资、前海方舟(前海母基金管理机构)旗下中原前海基金和齐鲁前海基金等多家头部国资与市场化机构组成。

来自主题: AI资讯
5077 点击    2024-03-01 13:41