AI资讯新闻榜单内容搜索-多模态

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

刚刚，OpenAI图像生成模型API发布，Token计价，一张图花掉1.4元

上个月，OpenAI 在 ChatGPT 中引入了图像生成功能，广受欢迎：仅在第一周，全球就有超过 1.3 亿用户创建了超过 7 亿张图片。就在刚刚，OpenAI 又宣布了一个好消息：他们正式在 API 中推出驱动 ChatGPT 多模态体验的原生模型 ——gpt-image-1，让开发者和企业能够轻松将高质量、专业级的图像生成功能直接集成到自己的工具和平台中。

来自主题: AI资讯

10904 点击 2025-04-24 09:44

喝点VC｜a16z重磅预测：AI虚拟人将孕育众多市值达数十亿美元的行业巨头

喝点VC｜a16z重磅预测：AI虚拟人将孕育众多市值达数十亿美元的行业巨头

喝点VC｜a16z重磅预测：AI虚拟人将孕育众多市值达数十亿美元的行业巨头

AI虚拟人模型架构从CNN、GANs演进至Transformer+扩散模型，实现从单一面部驱动到半身/全身动态生成的跨越，口型同步与多模态协同表现显著提升。

来自主题: AI资讯

10420 点击 2025-04-23 15:17

图片模型最具创意实践指南 - 创意人的春天已来！

图片模型最具创意实践指南 - 创意人的春天已来！

图片模型最具创意实践指南 - 创意人的春天已来！

GPT-4o更新的端到端多模态模型，让创意端获得前所未有的自由度。

来自主题: AI资讯

9319 点击 2025-04-21 15:14

突破AI视觉“选择性失明”，哈工大首次实现指令驱动的全景式感知

突破AI视觉“选择性失明”，哈工大首次实现指令驱动的全景式感知

突破AI视觉“选择性失明”，哈工大首次实现指令驱动的全景式感知

对于AI视觉多模态大模型只关注显著信息这一根本性缺陷，哈工大GiVE实现突破！

来自主题: AI技术研报

8036 点击 2025-04-18 15:13

Cohere推出新一代多模态搜索模型Embed 4，在数据处理长文本建模和跨模态能力显著提升

Cohere推出新一代多模态搜索模型Embed 4，在数据处理长文本建模和跨模态能力显著提升

Cohere推出新一代多模态搜索模型Embed 4，在数据处理长文本建模和跨模态能力显著提升

2025年4月16日，Cohere 发布了其最新一代多模态搜索模型 Embed 4，在多模态数据处理、长文本建模和跨模态检索能力上实现了显著提升，进一步巩固了其在企业级 AI 搜索领域的领先地位。

来自主题: AI资讯

6958 点击 2025-04-18 10:16

生数科技副总裁：多模态技术定将催生全新内容平台，实现完全个性化、实时可控、可交互｜中国AIGC产业峰会

生数科技副总裁：多模态技术定将催生全新内容平台，实现完全个性化、实时可控、可交互｜中国AIGC产业峰会

生数科技副总裁：多模态技术定将催生全新内容平台，实现完全个性化、实时可控、可交互｜中国AIGC产业峰会

多模态生成技术持续突破内容创作的边界。

来自主题: AI资讯

11779 点击 2025-04-18 09:30

4K分辨率视觉预训练首次实现！伯克利&英伟达多模态新SOTA，更准且3倍加速处理

4K分辨率视觉预训练首次实现！伯克利&英伟达多模态新SOTA，更准且3倍加速处理

4K分辨率视觉预训练首次实现！伯克利&英伟达多模态新SOTA，更准且3倍加速处理

当前，所有主流的视觉基础模型（如 SigLIP、DINOv2 等）都仍然在低分辨率（如 384 * 384 分辨率）下进行预训练。对比人类视觉系统可以轻松达到 10K 等效分辨率，这种低分辨率预训练极大地限制了视觉模型对于高清细节的理解能力。

来自主题: AI技术研报

8136 点击 2025-04-17 13:54

多模态生成框架新SOTA：文本+空间+图像随意组合，20W+数据开源，复旦腾讯优图出品

多模态生成框架新SOTA：文本+空间+图像随意组合，20W+数据开源，复旦腾讯优图出品

多模态生成框架新SOTA：文本+空间+图像随意组合，20W+数据开源，复旦腾讯优图出品

能处理任意条件组合的新生成框架来了！

来自主题: AI技术研报

8506 点击 2025-04-16 14:34

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

苹果发现原生多模态模型Scaling Laws：早融合优于后融合，MoE优于密集模型

让大模型进入多模态模式，从而能够有效感知世界，是最近 AI 领域里人们一直的探索目标。

来自主题: AI技术研报

8261 点击 2025-04-16 14:01

视觉自回归生成理解编辑大一统！北大团队多模态新突破，VARGPT-v1.1训练数据代码全面开源

视觉自回归生成理解编辑大一统！北大团队多模态新突破，VARGPT-v1.1训练数据代码全面开源

视觉自回归生成理解编辑大一统！北大团队多模态新突破，VARGPT-v1.1训练数据代码全面开源

北京大学团队继VARGPT实现视觉理解与生成任务统一之后，再度推出了VARGPT-v1.1版本。该版本进一步提升了视觉自回归模型的能力，不仅在在视觉理解方面有所加强，还在图像生成和编辑任务中达到新的性能高度

来自主题: AI技术研报

8679 点击 2025-04-16 09:44

上一页当前第52页,共108页下一页