AI资讯新闻榜单内容搜索-io

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: io
语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

语言图像模型大一统!Meta将Transformer和Diffusion融合,多模态AI王者登场

就在刚刚,Meta最新发布的Transfusion,能够训练生成文本和图像的统一模型了!完美融合Transformer和扩散领域之后,语言模型和图像大一统,又近了一步。也就是说,真正的多模态AI模型,可能很快就要来了!

来自主题: AI技术研报
10608 点击    2024-08-24 16:04
Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

Transformer核心作者重返谷歌,任Gemini联合技术负责人!联手Jeff Dean追赶竞敌

被谷歌买下的AI独角兽Character.AI,已与团队深度融合。Transformer核心作者、创始人之一Noam Shazeer将担任Gemini联合技术负责人,与Jeff Dean和Oriol Vinyals平起平坐。

来自主题: AI技术研报
10228 点击    2024-08-24 10:50
谷歌搜索引擎全面揭秘!近百份文档泄露,博主爆肝数周逆向工程

谷歌搜索引擎全面揭秘!近百份文档泄露,博主爆肝数周逆向工程

谷歌搜索引擎全面揭秘!近百份文档泄露,博主爆肝数周逆向工程

继5月的文件泄露事件后,谷歌的搜索引擎又被掀了个底朝天。不仅DeepMind发论文解释了Vizier系统的机制,博客作者Mario Fischer还对近百份文档做了彻底的调研分析,为我们还原了这个互联网巨兽的全貌。

来自主题: AI资讯
6952 点击    2024-08-23 18:30
浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余

作为基础的视觉语言任务,指代表达理解(referring expression comprehension, REC)根据自然语言描述来定位图中被指代的目标。REC 模型通常由三部分组成:视觉编码器、文本编码器和跨模态交互,分别用于提取视觉特征、文本特征和跨模态特征特征交互与增强。

来自主题: AI技术研报
6417 点击    2024-08-20 14:36
AI加持、男人的“美图秀秀”,登顶iOS总榜

AI加持、男人的“美图秀秀”,登顶iOS总榜

AI加持、男人的“美图秀秀”,登顶iOS总榜

自然一败涂地,科技展现魅力。

来自主题: AI资讯
7773 点击    2024-08-20 10:10
机器人策略学习的Game Changer?伯克利提出Body Transformer

机器人策略学习的Game Changer?伯克利提出Body Transformer

机器人策略学习的Game Changer?伯克利提出Body Transformer

过去几年间,Transformer 架构已经取得了巨大的成功,同时其也衍生出了大量变体,比如擅长处理视觉任务的 Vision Transformer(ViT)。本文要介绍的 Body Transformer(BoT) 则是非常适合机器人策略学习的 Transformer 变体。

来自主题: AI技术研报
9197 点击    2024-08-19 14:08