AI资讯新闻榜单内容搜索-文生图

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 文生图
GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

GPT、DALL·E、Sora,为什么 OpenAI 可以跑通所有 AGI 技术栈?

从文本生成模型 GPT、文生图模型 DALL·E,到文生视频模型 Sora,OpenAI 可以说成功跑通了 AGI 的所有技术栈,为什么是 OpenAI 而不是谷歌、Meta?

来自主题: AI资讯
7146 点击    2024-02-20 10:50
文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题

近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SDXL和DALL·E 3

来自主题: AI技术研报
4087 点击    2024-02-17 11:00
商汤全球首发的这个功能,就连OpenAI都还没做到

商汤全球首发的这个功能,就连OpenAI都还没做到

商汤全球首发的这个功能,就连OpenAI都还没做到

就在刚刚,全新升级4.0的日日新大模型发布!不仅如此,商汤还抢先OpenAI首发了支持不同模态工具调用的Assistants API!现在,超千万的中文开发者可以轻松玩转「文生图」和「图生文」了。

来自主题: AI资讯
6826 点击    2024-02-02 18:03
一张照片,为深度学习巨头们定制人像图片

一张照片,为深度学习巨头们定制人像图片

一张照片,为深度学习巨头们定制人像图片

主题驱动的文本到图像生成,通常需要在多张包含该主题(如人物、风格)的数据集上进行训练,这类方法中的代表工作包括 DreamBooth、Textual Inversion、LoRAs 等,但这类方案因为需要更新整个网络或较长时间的定制化训练,往往无法很有效地兼容社区已有的模型,并无法在真实场景中快速且低成本应用。

来自主题: AI技术研报
9660 点击    2024-01-20 14:53
20%的杨幂+80%的泰勒长什么样?小红书风格化AI来了,可兼容SD和ControlNet

20%的杨幂+80%的泰勒长什么样?小红书风格化AI来了,可兼容SD和ControlNet

20%的杨幂+80%的泰勒长什么样?小红书风格化AI来了,可兼容SD和ControlNet

不得不说,现在拍写真真是“简单到放肆”了。真人不用出镜,不用费心凹姿势、搞发型,只需一张本人图像,等待几秒钟,就能获得7种完全不同风格:

来自主题: AI资讯
9648 点击    2024-01-18 18:11
阿里版“马良神笔”来了,轻轻一抹让蒙娜丽莎对你微笑

阿里版“马良神笔”来了,轻轻一抹让蒙娜丽莎对你微笑

阿里版“马良神笔”来了,轻轻一抹让蒙娜丽莎对你微笑

近半年来,文生视频、图生视频类的工具层出不穷,让人眼花缭乱。但不少实际体验过的用户一定会感受到,脑中的想法转化为语言尚且不易,而人类的语言复杂而精妙,想要再找到准确的提示词,让AI正确理解我们的意图,继而转换为图片和视频,实在是太难了。

来自主题: AI资讯
7383 点击    2024-01-13 20:15
专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能

专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能

专访 VideoPoet 作者:视频模型技术会收敛,LLM 将取代diffusion带来真正的视觉智能

在 AI 领域,近年来各个子领域都逐渐向 transformer 架构靠拢,只有文生图和文生视频一直以 diffusion + u-net 结构作为主流方向。diffusion 有更公开可用的开源模型,消耗的计算资源也更少。

来自主题: AI资讯
6736 点击    2024-01-06 12:27