AI资讯新闻榜单内容搜索-多模态推理

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态推理

视频生成作为多模态推理新范式 | CVPR 2026

视频生成作为多模态推理新范式 | CVPR 2026

视频生成作为多模态推理新范式 | CVPR 2026

被CVPR 2026收录！

来自主题: AI技术研报

10145 点击 2026-06-15 09:47

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达于昨日正式推出全新多模态推理模型Nemotron 3 Nano Omni，将文本、视觉、语音三大模态能力深度融合至单一模型体系，目前可免费使用。

来自主题: AI资讯

9743 点击 2026-04-29 19:52

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

ICLR 2026｜原生多模态推理新范式ThinkMorph ，让文字与图像在统一架构中共同演化

NUS、ZJU、UW、Stanford、CUHK 联合提出「ThinkMorph」，主张让文字与图像在统一架构里「原生协作」、「共同演化」，而不是像当下大多数多模态模型那样，看完图像就闭上眼睛，后续完全靠文字链条推进。仅用 2.4 万条数据微调 7B 统一模型，视觉推理平均提升 34.74%，多项任务比肩甚至超越 GPT-4o 和 Gemini 2.5 Flash。

来自主题: AI技术研报

8037 点击 2026-03-11 09:22

开源新王炸！10B多模态小模型屠榜，性能媲美20倍巨无霸

开源新王炸！10B多模态小模型屠榜，性能媲美20倍巨无霸

开源新王炸！10B多模态小模型屠榜，性能媲美20倍巨无霸

10B参数拥有媲美千亿级模型的多模态推理实力。

来自主题: AI技术研报

8515 点击 2026-01-21 12:02

DeepMind发布SIMA 2！打通「感知-推理-行动-反思」闭环

DeepMind发布SIMA 2！打通「感知-推理-行动-反思」闭环

DeepMind发布SIMA 2！打通「感知-推理-行动-反思」闭环

Deepmind推出的SIMA 2，让智能体能在虚拟环境（商业游戏）中，边聊天边进行复杂的多模态推理。作为具身通用智能的原型，SIMA 2已从静态数据集迈向无限程序化生成的训练场。

来自主题: AI技术研报

8759 点击 2026-01-12 10:00

多模态推理新范式！DiffThinker：用扩散模型「画」出推理和答案

多模态推理新范式！DiffThinker：用扩散模型「画」出推理和答案

多模态推理新范式！DiffThinker：用扩散模型「画」出推理和答案

在多模态大模型（MLLMs）领域，思维链（CoT）一直被视为提升推理能力的核心技术。然而，面对复杂的长程、视觉中心任务，这种基于文本生成的推理方式正面临瓶颈：文本难以精确追踪视觉信息的变化。形象地说，模型不知道自己想到哪一步了，对应图像是什么状态。

来自主题: AI技术研报

7814 点击 2026-01-08 15:20

必须得让AI明白，有些不该碰的东西别碰（doge）

必须得让AI明白，有些不该碰的东西别碰（doge）

必须得让AI明白，有些不该碰的东西别碰（doge）

近期，以DeepEyes、Thymes为代表的类o3模型通过调用视觉工具，突破了传统纯文本CoT的限制，在视觉推理任务中取得了优异表现。

来自主题: AI技术研报

9168 点击 2025-12-31 08:29

让大模型“吃一堑长一智”，南理工百度等提出模型记忆新方法

让大模型“吃一堑长一智”，南理工百度等提出模型记忆新方法

让大模型“吃一堑长一智”，南理工百度等提出模型记忆新方法

多模态推理又有新招，大模型“记不住教训”的毛病有治了。

来自主题: AI技术研报

10494 点击 2025-12-18 09:44

HumanSense：探索多模态推理边界，打造「察言观色会共情」的全模态交互伙伴

HumanSense：探索多模态推理边界，打造「察言观色会共情」的全模态交互伙伴

HumanSense：探索多模态推理边界，打造「察言观色会共情」的全模态交互伙伴

在科幻作品描绘的未来，人工智能不仅仅是完成任务的工具，更是为人类提供情感陪伴与生活支持的伙伴。在实现这一愿景的探索中，多模态大模型已展现出一定潜力，可以接受视觉、语音等多模态的信息输入，结合上下文做出反馈。

来自主题: AI技术研报

8524 点击 2025-10-24 10:51

多模态推理最高加速3.2倍！华为诺亚新算法入选NeurIPS 2025

多模态推理最高加速3.2倍！华为诺亚新算法入选NeurIPS 2025

多模态推理最高加速3.2倍！华为诺亚新算法入选NeurIPS 2025

不牺牲任何生成质量，将多模态大模型推理最高加速3.2倍！华为诺亚方舟实验室最新研究已入选NeurIPS 2025。

来自主题: AI技术研报

8823 点击 2025-09-27 11:19

上一页当前第1页,共4页下一页