AI资讯新闻榜单内容搜索-多模态大模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 多模态大模型
前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

前微软亚研院视觉专家胡瀚加入腾讯,负责混元多模态大模型

1 月 18 日,北京,聊聊 2025 如何加入技术开发? AI 科技评论消息称,前微软亚洲研究院视觉计算组首席研究员胡瀚,不久前加入腾讯,接替已离职的前腾讯混元大模型技术负责人之一的刘威,负责多模态大模型的研发工作。

来自主题: AI资讯
7332 点击    2025-01-09 10:22
支付宝推出新一代AI视觉搜索产品“探一下”:用AI之眼探索万物

支付宝推出新一代AI视觉搜索产品“探一下”:用AI之眼探索万物

支付宝推出新一代AI视觉搜索产品“探一下”:用AI之眼探索万物

12月30日,支付宝推出新一代AI视觉搜索产品“探一下”,基于自研的多模态大模型技术,可“用AI之眼探索万物”,提供更快速、有用、趣味的生成式搜索服务。

来自主题: AI资讯
2799 点击    2024-12-30 14:05
统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

统一视觉理解与生成,MetaMorph模型问世,LeCun、谢赛宁、刘壮等参与

如今,多模态大模型(MLLM)已经在视觉理解领域取得了长足进步,其中视觉指令调整方法已被广泛应用。该方法是具有数据和计算效率方面的优势,其有效性表明大语言模型(LLM)拥有了大量固有的视觉知识,使得它们能够在指令调整过程中有效地学习和发展视觉理解。

来自主题: AI技术研报
6832 点击    2024-12-21 11:12
Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福全新多模态Apollo,60分钟视频轻松理解!7B性能超越30B

Meta斯坦福大学联合团队全面研究多模态大模型(LMM)中驱动视频理解的机制,扩展了视频多模态大模型的设计空间,提出新的训练调度和数据混合方法,并通过语言先验或单帧输入解决了已有的评价基准中的低效问题。

来自主题: AI技术研报
6812 点击    2024-12-20 15:59
微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

微信正式发布多模态大模型POINTS1.5

距离 POINT1.0 的发布已经过去两个月时间来,在这段时间业界不断涌现出一系列优秀的模型。我们通过不断紧跟前沿技术,并结合过去开发多模态模型沉淀下来的经验,对 POINTS1.0 进行了一系列更新,推出了 POINTS1.5。

来自主题: AI技术研报
8471 点击    2024-12-17 10:52
我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

我扒出了Gemini 2.0超实时多模态幕后的黑科技,第六代TPU芯片Trillium!

OpenAI 放出了 o1 Pro、GPT-4o 高级语音、GPTCanavas,就跟孔雀开屏一样 ~ 谷歌最近的大动作是发布了 Gemini 2.0 嘛!2.0 比 1.5 版本快一倍,而且是原生的多模态大模型,能输入和生成语言、声音、图片、视频等。

来自主题: AI资讯
6865 点击    2024-12-13 17:12