AI资讯新闻榜单内容搜索-全模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 全模态
AI不再「炫技」,淘宝要让技术解决用户每一个具体问题

AI不再「炫技」,淘宝要让技术解决用户每一个具体问题

AI不再「炫技」,淘宝要让技术解决用户每一个具体问题

近日,在 CNCC2025 大会上,郑波首次公开了淘宝全模态大模型的最新进展,并系统介绍了多模态智能在淘宝 AIGX 技术体系的研究应用。另外,结合 AI 模型技术在淘宝应用中的实践,他认为,「狭义 AGI 很可能在 5-10 年内到来。」

来自主题: AI资讯
7011 点击    2025-10-28 13:31
HumanSense:探索多模态推理边界,打造「察言观色会共情」的全模态交互伙伴

HumanSense:探索多模态推理边界,打造「察言观色会共情」的全模态交互伙伴

HumanSense:探索多模态推理边界,打造「察言观色会共情」的全模态交互伙伴

在科幻作品描绘的未来,人工智能不仅仅是完成任务的工具,更是为人类提供情感陪伴与生活支持的伙伴。在实现这一愿景的探索中,多模态大模型已展现出一定潜力,可以接受视觉、语音等多模态的信息输入,结合上下文做出反馈。

来自主题: AI技术研报
6779 点击    2025-10-24 10:51
刚刚,阿里CEO吴泳铭发布「ASI宣言」:超级智能才是终局!

刚刚,阿里CEO吴泳铭发布「ASI宣言」:超级智能才是终局!

刚刚,阿里CEO吴泳铭发布「ASI宣言」:超级智能才是终局!

AGI解放80%日常工作,ASI创造超级科学家——阿里巴巴首次公开ASI蓝图,通义千问家族模型性能飙升,超越GPT-5,开启全模态智能时代。

来自主题: AI资讯
7936 点击    2025-09-25 15:43
阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

阿里一夜扔出三个开源王炸!猛刷32项开源SOTA

深夜,阿里通义大模型团队连放三个大招:开源原生全模态大模型Qwen3-Omni、语音生成模型Qwen3-TTS、图像编辑模型Qwen-Image-Edit-2509更新。Qwen3-Omni能无缝处理文本、图像、音频和视频等多种输入形式,并通过实时流式响应同时生成文本与自然语音输出。

来自主题: AI资讯
7709 点击    2025-09-23 16:33
突破全模态AI理解边界:HumanOmniV2引入上下文强化学习,赋能全模态模型“意图”推理新高度

突破全模态AI理解边界:HumanOmniV2引入上下文强化学习,赋能全模态模型“意图”推理新高度

突破全模态AI理解边界:HumanOmniV2引入上下文强化学习,赋能全模态模型“意图”推理新高度

在多模态大语言模型(MLLMs)应用日益多元化的今天,对模型深度理解和分析人类意图的需求愈发迫切。尽管强化学习(RL)在增强大语言模型(LLMs)的推理能力方面已展现出巨大潜力,但将其有效应用于复杂的多模态数据和格式仍面临诸多挑战。

来自主题: AI技术研报
8177 点击    2025-07-09 10:59
全模态RAG突破文本局限,港大构建跨模态一体化系统

全模态RAG突破文本局限,港大构建跨模态一体化系统

全模态RAG突破文本局限,港大构建跨模态一体化系统

突破传统检索增强生成(RAG)技术的单一文本局限,实现对文档中文字、图表、表格、公式等复杂内容的统一智能理解。

来自主题: AI技术研报
8617 点击    2025-06-26 15:18
截胡OpenAI,谷歌全模态模型首次解禁!Gemini 2.0中文唠嗑式P图,动漫游戏圈沸腾

截胡OpenAI,谷歌全模态模型首次解禁!Gemini 2.0中文唠嗑式P图,动漫游戏圈沸腾

截胡OpenAI,谷歌全模态模型首次解禁!Gemini 2.0中文唠嗑式P图,动漫游戏圈沸腾

OpenAI的全模态模型没来,谷歌的全模态图像生成器倒是抢先上线了!Gemini 2.0 Flash中上线的原生图像生成功能,动动嘴就能PS,还能轻松制作海报和表情包,动漫和漫画圈已经沸腾了。

来自主题: AI资讯
9688 点击    2025-03-13 18:22