
看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令
看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比 PS 大神抓着你的手助你 P 图。
谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比 PS 大神抓着你的手助你 P 图。
最近,来自NUS、斯坦福、谷歌DeepMind等机构的研究人员,尝试开发了一个评估人类和AI的创造力的框架。而当人类用尽所有手段来逼迫AI把创造力发挥到极限,发现GPT-4几乎对于所有事物认知的极限都是无尽的宇宙空间。
Perplexity AI做的是全球首个AI加持的对话式应答引擎,公司成立一年半,月活用户已达1000万。
几乎是和斯坦福“炒虾洗碗”机器人同一时间,谷歌DeepMind也发布了最新具身智能成果。
自从一年多之前,OpenAI推出ChatGPT之后,科技行业掀起了一股生成式AI热潮,谷歌、微软、Meta等诸多巨头快速跟进,纷纷推出了各自的大模型和具体应用:加入生成式AI功能,带来全新的产品体验。
全球范围都掀起了一轮新的 AI 创业潮,以及各种 AI 原生应用的爆发,除了 ChatGPT、Claude、谷歌 Bard 和百度文心一言等聊天机器人,我们还能看到从 Perplexity AI 原生搜索引擎到妙鸭相机,再到 HeyGen 和 Pika。
谷歌放出的Gemini,在对标GPT的道路上似乎一直处于劣势,Gemini真的比GPT-4弱吗?最近,斯坦福和Meta的学者发文为Gemini正名。
一年前,ChatGPT 横空出世,“大模型”成为全球科技赛道绝对的“C位”。 这一年,国外微软OpenAI和谷歌DeepMind等“众神”打架,国内百模大战。这一年,文生图以及文生视频赛道都出现了很强的玩家和令人惊艳的产品,如 Midjourney、Runway Gen-2、Pika 1.0等。
在 OpenAI 首个开发者日召开后,就有不少企业纷纷被判「死刑」。GPT 的自定义功能让不少刚拿到「赛季」参加资格的初创团队心如死灰。
自 OpenAI 发布让全世界瞩目的 ChatGPT 以来,时间已经过去一年有余。