AI资讯新闻榜单内容搜索-多模态模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: 多模态模型
8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare

8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare

8B文字多模态大模型指标逼近GPT4V,字节、华师、华科联合提出TextSquare

近期,多模态大模型 (MLLM) 在文本中心的 VQA 领域取得了显著进展,尤其是多个闭源模型,例如:GPT4V 和 Gemini,甚至在某些方面展现了超越人类能力的表现。

来自主题: AI技术研报
8675 点击    2024-04-25 19:32
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便

轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便

轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便

一个可以自动分析PDF、网页、海报、Excel图表内容的大模型,对于打工人来说简直不要太方便。

来自主题: AI技术研报
5538 点击    2024-04-21 23:05
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人科学家程博文官宣即将入职OpenAI,加入后训练团队参与多模态模型研究。值得一提的是,他还是著名华人计算机泰斗Thomas Huang的学生。

来自主题: AI技术研报
4193 点击    2024-03-11 17:44
OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure

OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure

OpenAI把GPT塞进机器人大脑,具身AGI奇点迫近!英伟达微软参投26亿美金独角兽Figure

人形机器人已然成为科技和投资界的新宠!刚刚,OpenAI官宣将与独角兽Figure合作,专为机器人打造下一代AI大模型,具身AGI真的要来了。

来自主题: AI资讯
7977 点击    2024-03-01 17:16
谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

去年年底,谷歌 Gemini 震撼了业界,它是谷歌「最大、最有能力和最通用」的 AI 系统,号称第一个原生多模态大模型,能力超越 GPT-4,也被认为是谷歌反击微软和 OpenAI 的强大工具。

来自主题: AI资讯
4937 点击    2024-02-24 14:48
文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E 3

来自主题: AI技术研报
3407 点击    2024-02-17 11:00
最强开源多模态生成模型MM-Interleaved:首创特征同步器

最强开源多模态生成模型MM-Interleaved:首创特征同步器

最强开源多模态生成模型MM-Interleaved:首创特征同步器

过去几个月中,随着 GPT-4V、DALL-E 3、Gemini 等重磅工作的相继推出,「AGI 的下一步」—— 多模态生成大模型迅速成为全球学者瞩目的焦点。

来自主题: AI技术研报
6853 点击    2024-02-02 11:39