AI资讯新闻榜单内容搜索-多模态

让大模型“吃一堑长一智”，南理工百度等提出模型记忆新方法

多模态推理又有新招，大模型“记不住教训”的毛病有治了。

来自主题: AI技术研报

10504 点击 2025-12-18 09:44

给Agent装上“海马体”！上海AILab开源MemVerse，定义多模态记忆新范式

一页纯文本的记忆是看不清世界的。

来自主题: AI技术研报

8164 点击 2025-12-17 14:59

阿里妈妈发布MUSE：用多模态搞定十万级超长行为序列，并开源Taobao-MM数据集

如果把用户在互联网上留下的每一个足迹都看作一段记忆，那么现在的推荐系统大多患有 “短期健忘症”。

来自主题: AI技术研报

10242 点击 2025-12-16 14:38

独家｜玄华智能完成数千万元天使轮融资，百度“三驾马车”创始人打造交互式AI知识伙伴

全球首个多模态交互式知识智能体服务商「玄华智能 Ember AI」已完成数千万元人民币天使轮融资，本轮由云时资本独家投资，逐浪资本担任长期独家财务顾问。「玄华智能」由一支兼具深厚互联网产品背景、顶尖AI技术实力和大规模商业化运营经验的团队创立。

来自主题: AI资讯

10610 点击 2025-12-16 10:59

AAAI 2026｜视频大语言模型到底可不可信？23款主流模型全面测评来了

近年来，视频大语言模型在理解动态视觉信息方面展现出强大能力，成为处理真实世界多模态数据的重要基础模型。然而，它们在真实性、安全性、公平性、鲁棒性和隐私保护等方面仍面临严峻挑战。

来自主题: AI技术研报

7262 点击 2025-12-16 09:19

GPT-5准确率不足40%！北大发布多模态、高难度化学基准SUPERChem

北大团队发布化学大模型基准SUPERChem，这是一个多模态、高难度的化学推理基准。它针对现有化学评测的不足，系统构建了评估大语言模型化学推理能力的新体系。

来自主题: AI技术研报

10230 点击 2025-12-15 15:16

统一视觉多模态与多任务！快手可灵与港科大团队发布视频生成模型，加速真实世界理解

不仅能“听懂”物体的颜色纹理，还能“理解”深度图、人体姿态、运动轨迹……

来自主题: AI技术研报

8782 点击 2025-12-15 10:42

NeurIPS 2025 | 告别全量扫描！浙大提出COIDO：破解多模态数据选择「高耗」难题

在深入技术细节之前，我们先用一张漫画来直观理解 COIDO (Coupled Importance-Diversity Optimization) 解决的核心问题与方案：正如钟离在漫画中所言，面对海量视觉指令数据的选择任务，传统方法需要遍历全部数据才能进行筛选造成大量「磨损」（高昂计算成本）。同时在面对数据重要性和多样性问题时，传统方法往往顾此失彼。

来自主题: AI技术研报

7994 点击 2025-12-14 10:46

前百川智能合伙人邓江创业，想走一条不同的AI医疗路

在AI医疗的技术路线和商业模式上，双方走向了不同的方向：百川押注语言模型和ToC，邓江拥抱多模态和ToB。

来自主题: AI资讯

7316 点击 2025-12-11 16:05

5天连更5次，可灵AI年末“狂飙式”升级

12月伊始，可灵AI接连放出大招。全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型、可灵数字人2.0功能……5天内5次“上新”，直接让生成式AI领域的竞争“卷”出新高度。

来自主题: AI资讯

8643 点击 2025-12-10 14:32