AI资讯新闻榜单内容搜索-多模态大模型

企业级OpenClaw最强拍档来了！万亿参数的国产多模态大模型，刚刚开源发布

刚刚，YuanLab.ai团队正式开源发布源Yuan3.0 Ultra多模态基础大模型。

来自主题: AI技术研报

10434 点击 2026-03-06 10:08

给GUI Agent装上「世界模型」：阿里通义用混合数据+统一思维链，让模型学会预判屏幕变化

伴随多模态大模型的发展，GUI Agent正成为人机交互的新范式。

来自主题: AI技术研报

9432 点击 2026-03-04 13:43

数据邪修大法好：仅用文本数据就能预训练多模态大模型

没有图片，也能预训练多模态大模型?在多模态大模型（MLLM）的研发中，行业内长期遵循着一个昂贵的共识：没有图文对（Image-Text Pairs），就没有多模态能力。

来自主题: AI技术研报

8906 点击 2026-03-03 14:25

第一次，多模态大模型学会边看边听，Meta新作性能暴涨113%

Meta联合多所高校发布首个可规模化自动生成第一视角音视频理解数据的引擎EgoAVU ，让多模态大模型首次真正「听懂世界」。

来自主题: AI技术研报

9301 点击 2026-02-28 15:26

大模型真听懂了吗？最全综合性口语感知与推理基准 | ICLR'26

随着多模态大模型能力不断扩展，语音大模型(SpeechLLMs) 已从语音识别走向复杂语音交互。然而，当模型逐渐进入真实口语交互场景，一个更基础的问题浮现出来：我们是否真正定义清楚了「语音理解」的能力边界？

来自主题: AI技术研报

10937 点击 2026-02-24 15:35

国产医疗大模型登顶权威榜单！核心秘籍：PB级训练数据、模拟医生真实会诊过程

2月7日，中文医疗大模型评测平台MedBench公布最新多模态大模型评测榜单，数坤科技的数坤坤多模态医学大模型V3以63.6分拿下第一。在榜单中，V3的表现超过微医、云知声旗下医疗行业大模型，以及OpenAI、谷歌、阿里千问旗下通用大模型。

来自主题: AI资讯

8216 点击 2026-02-14 10:38

顶尖模型离“科学家”还差得远？AI4S亟待迈向2.0时代

周伯文还详细介绍了上海 AI 实验室近年来开展的前沿探索与实践，包括驱动 “通专融合” 发展的技术架构 ——“智者”SAGE（Synergistic Architecture for Generalizable Experts），其包含基础、融合与进化三个层次，并可双向循环实现全栈进化；支撑 AGI4S 探索的两大基础设施“书生”科学多模态大模型 Intern-S1、“

来自主题: AI资讯

10472 点击 2026-01-30 19:13