AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

清华、西交联合开源发布了Cheers : 一条更简洁、更高效的统一多模态路线

过去几年,多模态模型在理解任务上快速演进,图像问答、OCR、视觉推理、跨模态对话等能力不断提升;与此同时,图像生成模型也在视觉质量、指令遵循和细节表达上持续突破。下一步一个自然的问题是:能否用同一个模型,同时做好理解与生成?这正是统一多模态模型(Unified Multimodal Models, UMMs)正在回答的问题。

来自主题: AI技术研报
6956 点击    2026-03-26 14:45
MemoryLake让你养虾省91%词元!AI记忆公司质变科技用1亿个多模态文件验证了!

MemoryLake让你养虾省91%词元!AI记忆公司质变科技用1亿个多模态文件验证了!

MemoryLake让你养虾省91%词元!AI记忆公司质变科技用1亿个多模态文件验证了!

一家企业花了七周时间部署 AI:第 1 周精准回答行业分析问题,团队欢呼;第 3 周反复回答相同的错误结论,因为它“忘了”上周的修正;第 5 周在董事会汇报中引用了已被否定的数据,造成决策偏差;第 7 周项目暂停,“AI 不可信”成为共识。问题不在于 AI 不够聪明,而在于它每次醒来都是一张白纸。

来自主题: AI资讯
8066 点击    2026-03-25 14:18
珀乐互动完成天使轮融资,以AI+IP重塑数字内容生态 | 首发

珀乐互动完成天使轮融资,以AI+IP重塑数字内容生态 | 首发

珀乐互动完成天使轮融资,以AI+IP重塑数字内容生态 | 首发

36氪获悉,以AI为核心的数字内容公司珀乐互动科技(下称“珀乐互动”)已完成天使轮融资,金额为数千万元人民币。本轮投资由星连资本领投、春华创投跟投,资金将重点用于技术研发、团队扩充与IP商业化开发,全面加速公司多模态泛娱乐生态的战略布局。

来自主题: AI资讯
5425 点击    2026-03-25 10:41
东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop:重构MLLM计算路径,压缩90%视觉Token实现2.2倍加速

随着多模态大语言模型(MLLM)支持更长上下文,高分辨率图像和长视频会产生远多于文本的视觉 Token,在自注意力二次复杂度下迅速成为效率瓶颈。

来自主题: AI技术研报
9078 点击    2026-03-24 10:13
精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

精准识别「界门纲目科属种」!北大彭宇新团队用细粒度树先验提升泛化,破解生物类别分层识别难题

一张蓝锥嘴雀的图片,你能认出它是“鸟”,但能认出它是“鸟纲-雀形目-唐纳雀科-锥嘴雀属-蓝锥嘴雀”吗?

来自主题: AI技术研报
6388 点击    2026-03-23 09:52
突发!腾讯AI Lab撤销,部分人员并入混元

突发!腾讯AI Lab撤销,部分人员并入混元

突发!腾讯AI Lab撤销,部分人员并入混元

今天,机器之心获悉,腾讯 TEG 技术工程事业群组织架构发生了部分调整,AI Lab 被撤销,蒋杰不再担任 AI Lab 主任,但其他管理职责不变。此次调整过后,原 AI Lab 部分人员调整至混元团队向姚顺雨汇报。产学研合作中心保留。多模态部负责人向 TEG 总裁卢山汇报。

来自主题: AI资讯
8466 点击    2026-03-21 09:32
5B参数+4060Ti,10秒出图,全流程开源可复现!补齐统一多模态生成编辑的开源版图,让高质量图像生成真正变得更轻量、更普及

5B参数+4060Ti,10秒出图,全流程开源可复现!补齐统一多模态生成编辑的开源版图,让高质量图像生成真正变得更轻量、更普及

5B参数+4060Ti,10秒出图,全流程开源可复现!补齐统一多模态生成编辑的开源版图,让高质量图像生成真正变得更轻量、更普及

统一多模态生成编辑模型,正在走向“重器化”

来自主题: AI技术研报
10002 点击    2026-03-18 16:15