AI资讯新闻榜单内容搜索-ViT

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: ViT
Sora V2 即将发布,AI Creativity 赛道有哪些机会?

Sora V2 即将发布,AI Creativity 赛道有哪些机会?

Sora V2 即将发布,AI Creativity 赛道有哪些机会?

OpenAI 连续 12 天 “Shipmas”发布活动终于要发布让大家期待已久的视频生成模型 Sora,这再一次激起人们对图片生成、视频生成的关注。而AI Creativity 一直是我们非常关注的 GenAI 落地方向,图像生成和视频生成模型快速迭代,离商业可用越来越近。

来自主题: AI技术研报
7009 点击    2024-12-10 14:38
刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础

刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础

刚刚,谷歌ViT核心骨干集体投奔OpenAI:他们为Sora打下基础

爆炸消息—— ViT三大核心作者集体离职谷歌DeepMind。下一站:OpenAI! 他们分别是翟晓华(Xiaohua Zhai)、卢卡斯·拜尔(Lucas Beyer)、亚历山大·科列斯尼科夫(Alexander Kolesnikov)。

来自主题: AI资讯
5817 点击    2024-12-04 20:31
AI金融投资公司Reflexivity,获得B轮2.1亿融资

AI金融投资公司Reflexivity,获得B轮2.1亿融资

AI金融投资公司Reflexivity,获得B轮2.1亿融资

凭借在华尔街利用AI分析市场,Reflexivity吸引融资高达3000万美元,折合人民币高达2.1个亿。盈透证券和Greycroft领投了本轮融资,亿万富翁投资者Stanley Druckenmiller和澳大利亚对冲基金Kirkoswald创始人Greg Coffey参与其中。

来自主题: AI资讯
3646 点击    2024-10-29 17:56
长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx

长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx

长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx

视觉数据的种类极其多样,囊括像素级别的图标到数小时的视频。现有的多模态大语言模型(MLLM)通常将视觉输入进行分辨率的标准化或进行动态切分等操作,以便视觉编码器处理。然而,这些方法对多模态理解并不理想,在处理不同长度的视觉输入时效率较低。

来自主题: AI资讯
2673 点击    2024-09-29 14:44
没有等来OpenAI开源GPT-4o,等来了开源版VITA

没有等来OpenAI开源GPT-4o,等来了开源版VITA

没有等来OpenAI开源GPT-4o,等来了开源版VITA

大语言模型 (LLM) 经历了重大的演变,最近,我们也目睹了多模态大语言模型 (MLLM) 的蓬勃发展,它们表现出令人惊讶的多模态能力。 特别是,GPT-4o 的出现显著推动了 MLLM 领域的发展。然而,与这些模型相对应的开源模型却明显不足。开源社区迫切需要进一步促进该领域的发展,这一点怎么强调也不为过。

来自主题: AI资讯
7209 点击    2024-08-14 17:38