AI资讯新闻榜单内容搜索-多模态

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 多模态

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

过去几年，多模态模型在理解任务上快速演进，图像问答、OCR、视觉推理、跨模态对话等能力不断提升；与此同时，图像生成模型也在视觉质量、指令遵循和细节表达上持续突破。下一步一个自然的问题是：能否用同一个模型，同时做好理解与生成？这正是统一多模态模型（Unified Multimodal Models, UMMs）正在回答的问题。

来自主题: AI技术研报

6956 点击 2026-03-26 14:45

MemoryLake让你养虾省91%词元！AI记忆公司质变科技用1亿个多模态文件验证了！

MemoryLake让你养虾省91%词元！AI记忆公司质变科技用1亿个多模态文件验证了！

MemoryLake让你养虾省91%词元！AI记忆公司质变科技用1亿个多模态文件验证了！

一家企业花了七周时间部署 AI：第 1 周精准回答行业分析问题，团队欢呼；第 3 周反复回答相同的错误结论，因为它“忘了”上周的修正；第 5 周在董事会汇报中引用了已被否定的数据，造成决策偏差；第 7 周项目暂停，“AI 不可信”成为共识。问题不在于 AI 不够聪明，而在于它每次醒来都是一张白纸。

来自主题: AI资讯

8066 点击 2026-03-25 14:18

珀乐互动完成天使轮融资，以AI+IP重塑数字内容生态 | 首发

珀乐互动完成天使轮融资，以AI+IP重塑数字内容生态 | 首发

珀乐互动完成天使轮融资，以AI+IP重塑数字内容生态 | 首发

36氪获悉，以AI为核心的数字内容公司珀乐互动科技（下称“珀乐互动”）已完成天使轮融资，金额为数千万元人民币。本轮投资由星连资本领投、春华创投跟投，资金将重点用于技术研发、团队扩充与IP商业化开发，全面加速公司多模态泛娱乐生态的战略布局。

来自主题: AI资讯

5425 点击 2026-03-25 10:41

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

随着多模态大语言模型（MLLM）支持更长上下文，高分辨率图像和长视频会产生远多于文本的视觉 Token，在自注意力二次复杂度下迅速成为效率瓶颈。

来自主题: AI技术研报

9078 点击 2026-03-24 10:13

创智刘鹏飞、Sand.ai曹越，两大AI青年学者团队联手，开源音视频基座模型

创智刘鹏飞、Sand.ai曹越，两大AI青年学者团队联手，开源音视频基座模型

创智刘鹏飞、Sand.ai曹越，两大AI青年学者团队联手，开源音视频基座模型

开源多模态生成领域，迎来架构级的底层突破。

来自主题: AI技术研报

10067 点击 2026-03-23 14:11

精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题

精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题

精准识别「界门纲目科属种」！北大彭宇新团队用细粒度树先验提升泛化，破解生物类别分层识别难题

一张蓝锥嘴雀的图片，你能认出它是“鸟”，但能认出它是“鸟纲-雀形目-唐纳雀科-锥嘴雀属-蓝锥嘴雀”吗？

来自主题: AI技术研报

6388 点击 2026-03-23 09:52

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力丨CVPR'26

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力丨CVPR'26

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力丨CVPR'26

多模态大模型，到底有多“嘴硬”？浙江大学联合阿里巴巴、香港城市大

来自主题: AI技术研报

7172 点击 2026-03-23 09:51

突发！腾讯AI Lab撤销，部分人员并入混元

突发！腾讯AI Lab撤销，部分人员并入混元

突发！腾讯AI Lab撤销，部分人员并入混元

今天，机器之心获悉，腾讯 TEG 技术工程事业群组织架构发生了部分调整，AI Lab 被撤销，蒋杰不再担任 AI Lab 主任，但其他管理职责不变。此次调整过后，原 AI Lab 部分人员调整至混元团队向姚顺雨汇报。产学研合作中心保留。多模态部负责人向 TEG 总裁卢山汇报。

来自主题: AI资讯

8466 点击 2026-03-21 09:32

腾讯纯文本LLM训视觉encoder，拿捏图表长视频，达到开源小模型SOTA！

腾讯纯文本LLM训视觉encoder，拿捏图表长视频，达到开源小模型SOTA！

腾讯纯文本LLM训视觉encoder，拿捏图表长视频，达到开源小模型SOTA！

打破多模态视觉+语言拼接套路！

来自主题: AI技术研报

6714 点击 2026-03-19 10:22

5B参数+4060Ti，10秒出图，全流程开源可复现！补齐统一多模态生成编辑的开源版图，让高质量图像生成真正变得更轻量、更普及

5B参数+4060Ti，10秒出图，全流程开源可复现！补齐统一多模态生成编辑的开源版图，让高质量图像生成真正变得更轻量、更普及

5B参数+4060Ti，10秒出图，全流程开源可复现！补齐统一多模态生成编辑的开源版图，让高质量图像生成真正变得更轻量、更普及

统一多模态生成编辑模型，正在走向“重器化”

来自主题: AI技术研报

10002 点击 2026-03-18 16:15

上一页当前第2页,共98页下一页