AI资讯新闻榜单内容搜索-多模态模型

多模态大模型首次实现像素级推理！3B参数超越72B传统模型，NeurIPS 2025收录

多模态大模型首次实现像素级推理，指代、分割、推理三大任务一网打尽！

来自主题: AI技术研报

9904 点击 2025-10-17 10:01

抖音&LV-NUS开源多模态新模，以小博大刷新SOTA，8B推理比肩GPT-4o

2B模型在多个基准位列4B参数以下开源第一。抖音SAIL团队与LV-NUS Lab联合推出的多模态大模型SAIL-VL2。

来自主题: AI技术研报

8363 点击 2025-10-13 15:58

深度｜“长眼睛”的奇多多AI学伴，凭什么能爆卖10000台？

奇多多AI学伴机是由无界方舟发布的国内首款基于「端到端实时多模态互动模型」的AI互动机器人，于本月2025外滩大会首次亮相。京东预售仅上线一周，销量便突破了10000台，在看似红海的儿童早教市场掀起波澜。在功能体验方面，它带来了三大突破：能“看”世界的眼睛、堪比真人的低延迟反馈速度、能“成长”的个性化陪伴感。

来自主题: AI资讯

11027 点击 2025-09-25 11:05

8B硬刚72B！MiniCPM-V 4.5技术报告正式出炉

行业首个具备“高刷”视频理解能力的多模态模型MiniCPM-V 4.5的技术报告正式发布！报告提出统一的3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR和知识学习范式、可控混合快速/深度思考的多模态强化学习三大技术。

来自主题: AI技术研报

9157 点击 2025-09-24 10:52

理解帮助生成？RecA自监督训练让统一多模态模型直升SOTA

谢集，浙江大学竺可桢学院大四学生，于加州大学伯克利分校（BAIR）进行访问，研究方向为统一多模态理解生成大模型。第二作者为加州大学伯克利分校的 Trevor Darrell，第三作者为华盛顿大学的 Luke Zettlemoyer，通讯作者是 XuDong Wang, Meta GenAl Research Scientist、

来自主题: AI技术研报

6969 点击 2025-09-21 10:42