AI资讯新闻榜单内容搜索-多模态

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 多模态
“计算机视觉被GPT-4o终结了”(狗头)

“计算机视觉被GPT-4o终结了”(狗头)

“计算机视觉被GPT-4o终结了”(狗头)

一夜之间,CV被大模型“解决”了(狗头)。万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。万物皆可吉卜力之后,GPT-4o原生多模态图像生成更多玩法被开发出来。

来自主题: AI资讯
6731 点击    2025-03-30 10:43
GPT-4o的多模态生图,让整个设计圈都开始emo了。

GPT-4o的多模态生图,让整个设计圈都开始emo了。

GPT-4o的多模态生图,让整个设计圈都开始emo了。

GPT4o的多模态生图前天上线之后。经过两天的发酵,含金量还在不断提升。

来自主题: AI资讯
8034 点击    2025-03-28 15:28
DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”

DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”

DeepSeek逼出谷歌新推理模型:40分优势超GPT4.5登顶竞技场,支持原生多模态,但依然败给了“竹竿问题”

又双叒,抢在OpenAI直播之前,谷歌Gemini 2.5系列来了。首个版本Pro Experimental一登场就抢下大模型竞技场第一名,并且整整比GPT-4.5高出40分Gemini 2.5同样是推理模型,用Jeff Dean的说法是:

来自主题: AI资讯
6846 点击    2025-03-26 08:40
GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

GPT-4o多模态生图正式上线 - 用嘴改图,此为王道。

在ChatGPT上,当你画图的选项变成这个的时候,就说明用的不是Dalle3了,而是4o。目前,有两个渠道可以使用4o Image Generation。一个事ChatGPT,一个是单独的那个Sora的网站。

来自主题: AI资讯
9077 点击    2025-03-26 08:10
DeepSeek解封“算力智子”后,数据成AI未来发展关键

DeepSeek解封“算力智子”后,数据成AI未来发展关键

DeepSeek解封“算力智子”后,数据成AI未来发展关键

在引发全球关注的同时,全球资本对中国科技资产的重新评估与 AI 投资的底层逻辑也悄然发生转变。尤其是在大模型领域,过去巨额投入却屡次推迟的ChatGPT5和本就步入下半场的国内六小龙,将直面 DeepSeek这匹黑马的强劲冲击。中国AI企业在DeepSeek突破了“算力禁运”之后,正面临高质量数据稀缺的挑战,尤其是高质量、低成本、多种类、多模态的数据,将成为未来 AI 产业发展的核心关键。

来自主题: AI技术研报
7021 点击    2025-03-25 15:02
一文看懂多模态思维链

一文看懂多模态思维链

一文看懂多模态思维链

多模态思维链(MCoT)系统综述来了!

来自主题: AI技术研报
5685 点击    2025-03-25 10:17
多模态RAG实战:复杂的PPT文档如何处理?一文掌握关键技巧。

多模态RAG实战:复杂的PPT文档如何处理?一文掌握关键技巧。

多模态RAG实战:复杂的PPT文档如何处理?一文掌握关键技巧。

RAG应用的一大复杂性体现在其多样的原始知识结构与表示。特别在企业场景下,混合多种媒体形式且具有复杂布局的文档随处可见,比如一份PPT:

来自主题: AI技术研报
5175 点击    2025-03-24 16:23
实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐

实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐

实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐

国产厨电龙头老板电器出品的全球首个烹饪大模型「食神」升级,不光接入了DeepSeek,还拓展了多模态。像推荐菜谱、指导烹饪已经是常规操作。在此基础上,它还能一眼看出你的健康状况——通过面部识别、分析体检报告,生成长期的健康膳食计划。

来自主题: AI资讯
7770 点击    2025-03-22 19:43