AI资讯新闻榜单内容搜索-生图

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生图
全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了

Ideogram凭借不输Midjourney的生图能力和遥遥领先的图片中文字渲染能力,获得了包括Jeff Dean和Karpathy在内一众大佬的8000万美元融资,文生图这条离钱最近的AI赛道又加入了一名重量级选手。

来自主题: AI资讯
6893 点击    2024-03-01 17:28
字节跳动正秘密研发多个AI产品

字节跳动正秘密研发多个AI产品

字节跳动正秘密研发多个AI产品

2月28日,界面新闻从多个知情人士处获悉,字节跳动正在AI大模型领域秘密研发多个产品,其中包括多模态数字人产品以及AI生图、AI生视频产品等。

来自主题: AI资讯
5846 点击    2024-03-01 10:10
谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

谷歌Gemini生图功能紧急关闭,口碑一夜塌房,Yann LeCun:我早就知道

去年年底,谷歌 Gemini 震撼了业界,它是谷歌「最大、最有能力和最通用」的 AI 系统,号称第一个原生多模态大模型,能力超越 GPT-4,也被认为是谷歌反击微软和 OpenAI 的强大工具。

来自主题: AI资讯
5976 点击    2024-02-24 14:48
GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

从文本生成模型 GPT、文生图模型 DALL·E,到文生视频模型 Sora,OpenAI 可以说成功跑通了 AGI 的所有技术栈,为什么是 OpenAI 而不是谷歌、Meta?

来自主题: AI资讯
7774 点击    2024-02-20 10:50
文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E 3

来自主题: AI技术研报
4710 点击    2024-02-17 11:00
商汤全球首发的这个功能,就连OpenAI都还没做到

商汤全球首发的这个功能,就连OpenAI都还没做到

商汤全球首发的这个功能,就连OpenAI都还没做到

就在刚刚,全新升级4.0的日日新大模型发布!不仅如此,商汤还抢先OpenAI首发了支持不同模态工具调用的Assistants API!现在,超千万的中文开发者可以轻松玩转「文生图」和「图生文」了。

来自主题: AI资讯
7552 点击    2024-02-02 18:03
字节推出最新偷懒大法,AI绘画连prompt都不用学了

字节推出最新偷懒大法,AI绘画连prompt都不用学了

字节推出最新偷懒大法,AI绘画连prompt都不用学了

绝大多数AI生图模型在训练的时候侧重的是文本和图形之间的关联,并不擅长语义分析和复杂元素处理。

来自主题: AI资讯
6530 点击    2024-01-24 11:12
一张照片,为深度学习巨头们定制人像图片

一张照片,为深度学习巨头们定制人像图片

一张照片,为深度学习巨头们定制人像图片

主题驱动的文本到图像生成,通常需要在多张包含该主题(如人物、风格)的数据集上进行训练,这类方法中的代表工作包括 DreamBooth、Textual Inversion、LoRAs 等,但这类方案因为需要更新整个网络或较长时间的定制化训练,往往无法很有效地兼容社区已有的模型,并无法在真实场景中快速且低成本应用。

来自主题: AI技术研报
10326 点击    2024-01-20 14:53