AI资讯新闻榜单内容搜索-多模态

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

Discrete Tokenization：多模态大模型的关键基石，首个系统化综述发布

近年来，大语言模型（LLM）在语言理解、生成和泛化方面取得了突破性进展，并广泛应用于各种文本任务。随着研究的深入，人们开始关注将 LLM 的能力扩展至非文本模态，例如图像、音频、视频、图结构、推荐系统等。

来自主题: AI技术研报

7094 点击 2025-08-06 12:18

全球首个人形机器人通用视觉感知系统，Humanoid Occupancy建立多模态环境理解新范式

全球首个人形机器人通用视觉感知系统，Humanoid Occupancy建立多模态环境理解新范式

全球首个人形机器人通用视觉感知系统，Humanoid Occupancy建立多模态环境理解新范式

凭借类人化的结构设计与运动模式，人形机器人被公认为最具潜力融入人类环境的通用型机器人。其核心任务涵盖操作 (manipulation)、移动 (locomotion) 与导航 (navigation) 三大领域，而这些任务的高效完成，均以机器人对自身所处环境的全面精准理解为前提。

来自主题: AI技术研报

7039 点击 2025-08-05 16:14

面向6G环境感知通信！西电开源3Dx3D无线电地图数据集与生成式基准框架

面向6G环境感知通信！西电开源3Dx3D无线电地图数据集与生成式基准框架

面向6G环境感知通信！西电开源3Dx3D无线电地图数据集与生成式基准框架

当前环境感知通信正逐步成为第六代移动通信系统（6G）的核心使能技术之一。为支撑其在复杂三维环境下的部署需求，西安电子科技大学、香港中文大学（深圳）和加拿大滑铁卢大学的研究团队联合提出了一个面向6G的高分辨率多模态三维无线电图谱数据集UrbanRadio3D，并构建了基于扩散模型的三维无线电图生成框架RadioDiff-3D。

来自主题: AI技术研报

7626 点击 2025-08-05 16:07

GUI定位还在玩「非黑即白」？浙大团队提出GUI-G²，显著提升GUI智能体定位性能

GUI定位还在玩「非黑即白」？浙大团队提出GUI-G²，显著提升GUI智能体定位性能

GUI定位还在玩「非黑即白」？浙大团队提出GUI-G²，显著提升GUI智能体定位性能

本文第一作者唐飞，浙江大学硕士生，研究方向是 GUI Agent、多模态推理等。

来自主题: AI技术研报

8866 点击 2025-08-04 13:59

多模态后训练反常识：长思维链SFT和RL的协同困境

多模态后训练反常识：长思维链SFT和RL的协同困境

多模态后训练反常识：长思维链SFT和RL的协同困境

在语言模型领域，长思维链监督微调（Long-CoT SFT）与强化学习（RL）的组合堪称黄金搭档 —— 先让模型学习思考模式，再用奖励机制优化输出，性能通常能实现叠加提升。

来自主题: AI技术研报

7753 点击 2025-08-02 12:49

思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型

近期，随着OpenAI-o1/o3和Deepseek-R1的成功，基于强化学习的微调方法（R1-Style）在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现，但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报

8227 点击 2025-08-01 16:08

又一SOTA级开源模型！阶跃Step-3多模态推理登顶，百万token解码成本不到4毛钱

又一SOTA级开源模型！阶跃Step-3多模态推理登顶，百万token解码成本不到4毛钱

又一SOTA级开源模型！阶跃Step-3多模态推理登顶，百万token解码成本不到4毛钱

又一个SOTA基础模型开源，而且依然是国产。刚刚，阶跃星辰兑现了WAIC上的承诺，将最新多模态推理模型Step-3正式开源！在MMMU等多个多模态榜单上，它一现身就取得了开源多模态推理模型新SOTA的成绩。

来自主题: AI技术研报

7862 点击 2025-08-01 12:52

1.5B参数撬动“吉卜力级”全能体验，国产开源之光多模态统一模型，来了

1.5B参数撬动“吉卜力级”全能体验，国产开源之光多模态统一模型，来了

1.5B参数撬动“吉卜力级”全能体验，国产开源之光多模态统一模型，来了

听说了吗，GPT-5这两天那叫一个疯狂造势，奥特曼怕不是真有些急了（doge）。

来自主题: AI资讯

9351 点击 2025-07-30 15:24

WAIC 2025大黑马，一个「谢耳朵AI」如何用分子式超越Grok-4

WAIC 2025大黑马，一个「谢耳朵AI」如何用分子式超越Grok-4

WAIC 2025大黑马，一个「谢耳朵AI」如何用分子式超越Grok-4

当马斯克的 Grok-4 还在用 “幽默模式” 讲冷笑话时，中国的科学家已经在用书生 Intern-S1 默默破解癌症药物靶点的密码 —— 谁说搞科研不能又酷又免费？

来自主题: AI资讯

8843 点击 2025-07-30 11:01

科学能力太强，这个多模态推理「六边形战士」被严重低估！Intern-S1开源登顶

科学能力太强，这个多模态推理「六边形战士」被严重低估！Intern-S1开源登顶

科学能力太强，这个多模态推理「六边形战士」被严重低估！Intern-S1开源登顶

在WAIC 2025大会上，上海AI实验室首席科学周伯文和Hinton教授的尖峰对话轰动全场。而在科学探索上，实验室更是独辟蹊径开创「通专融合」大模型创新路线，全新一代科学大模型拿下多模态能力全球第一。

来自主题: AI资讯

5494 点击 2025-07-29 16:38

上一页当前第15页,共87页下一页