AI资讯新闻榜单内容搜索-Image

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Image
耗资数百万,六年磨一剑!上交开源首创图像合成神器libcom,下载量破万

耗资数百万,六年磨一剑!上交开源首创图像合成神器libcom,下载量破万

耗资数百万,六年磨一剑!上交开源首创图像合成神器libcom,下载量破万

在AIGC 的浪潮中,对已有图片做编辑的图像编辑(image editing)技术受到了越来越多的关注。图像编辑(image editing)的原子操作包括增、删、改。

来自主题: AI资讯
3811 点击    2024-10-12 14:35
深度|李飞飞:AI十年,公众看到的是一些离散事件,而我们则看到一个连续过程

深度|李飞飞:AI十年,公众看到的是一些离散事件,而我们则看到一个连续过程

深度|李飞飞:AI十年,公众看到的是一些离散事件,而我们则看到一个连续过程

Alexnet对人工智能世界具有象征意义,因为现代人工智能的三个基本要素第一次汇聚在一起,第一个要素是神经网络,第二个要素是大数据,即使用ImageNet,第三个要素是GPU计算......

来自主题: AI资讯
6867 点击    2024-10-09 12:20
DeepMind又损大将,AI总监Nando de Freitas离职,曾领导开发Gato、Genie

DeepMind又损大将,AI总监Nando de Freitas离职,曾领导开发Gato、Genie

DeepMind又损大将,AI总监Nando de Freitas离职,曾领导开发Gato、Genie

作为谷歌 DeepMind 机器学习团队的重量级人物,Nando de Freitas 曾共同领导开发出了 Imagen 2、Gato、Genie、Griffin、Lyria 等名噪一时的大模型产品。

来自主题: AI资讯
6811 点击    2024-09-15 14:37
李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光

李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光

李飞飞任CEO,空间智能公司World Labs亮相,全明星阵容曝光

World Labs 的创始团队中,有 ImageNet、NeRF、Style Transfer 和 Gaussian Splats 作者在列。

来自主题: AI资讯
5520 点击    2024-09-14 15:56
Imagen 3支持人物生成,人人可用!谷歌Gemini AI重大升级来了

Imagen 3支持人物生成,人人可用!谷歌Gemini AI重大升级来了

Imagen 3支持人物生成,人人可用!谷歌Gemini AI重大升级来了

时隔5个月,Imagen 3终于可以人人可用了,而且还能支持是生成人物图像。与此同时,谷歌宣布了Gemini AI的重大升级,全新AI定制助手Gems已经面向150多个国家推出。

来自主题: AI资讯
8323 点击    2024-08-30 20:59
一款值得收藏的实用 AI 工具:本地运行,免费无广告,支持 Win、Mac

一款值得收藏的实用 AI 工具:本地运行,免费无广告,支持 Win、Mac

一款值得收藏的实用 AI 工具:本地运行,免费无广告,支持 Win、Mac

Image-Matting(小宾AI抠图)是来自 GitHub 的一款免费、开源、无广告的,本地运行的基于 AI 的抠图应用。它简单好用,抠图效果好,目前支持 Windows、MacOS 等平台。

来自主题: AI资讯
9261 点击    2024-08-27 14:31
豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性

当前的视觉语言模型(VLM)主要通过 QA 问答形式进行性能评测,而缺乏对模型基础理解能力的评测,例如 detail image caption 性能的可靠评测手段。

来自主题: AI技术研报
10057 点击    2024-07-13 20:01
将图像自动文本化,图像描述质量更高、更准确了

将图像自动文本化,图像描述质量更高、更准确了

将图像自动文本化,图像描述质量更高、更准确了

在当今的多模态大模型的发展中,模型的性能和训练数据的质量关系十分紧密,可以说是 “数据赋予了模型的绝大多数能力”。

来自主题: AI技术研报
5862 点击    2024-06-28 11:28
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍

在生成式模型的迅速发展中,Image Tokenization 扮演着一个很重要的角色,例如Diffusion依赖的VAE或者是Transformer依赖的VQGAN。这些Tokenizers会将图像编码至一个更为紧凑的隐空间(latent space),使得生成高分辨率图像更有效率。

来自主题: AI技术研报
10182 点击    2024-06-22 23:00