ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
Imagen 3支持人物生成,人人可用!谷歌Gemini AI重大升级来了
7447点击    2024-08-30 20:59

Gemini AI平台又双叒升级了。


这次,谷歌直接给配上了Gems助手,还有最新图像生成模型Imagen 3!



这当中,最让人兴奋的便是,Imagen 3可以人人用上了。


网友们早已急不可耐,纷纷上手开启了测试。



Imagen 3支持人物生成了


5月的I/O开发者大会上,谷歌首次对外亮相了Imagen 3图像生成的能力。



此后几个月时间,这个AI生图工具一直在测试中。


正如当时博文所述,Imagen 3可以根据文本提示,创建出更高质量的图像。



另外,Imagen 3设定了图像质量的新标准,只需几个单词就能生成图像。


你甚至可以要求Gemini 创作各种风格的图像,比如照片上的写实风景画、纹理油画,或者是异想天开的泥土场景。



值得注意的是,谷歌再次引入了生成人类图像的照片。此前,因AI生图人物带上了有色眼镜,谷歌便被全网攻击。


为了解决人们对深度造假、错误信息的担忧,谷歌已采取了安全措施,比如水印SynthID。



升级后的模型,外媒Ars测试后发现,当让AI生成拜登打篮球的图像时,会被拒绝请求。


而当你请求「美国总统打篮球」,便可以得到更多的请求选择。


另外,在一些快速测试中,Imagen 3还避免了生成「历史上不准确」的种族陷阱。


比如,让它生成一副英国国王肖像,AI会生成穿着一袭红色长袍,留着胡须的白人,而不是以往种族多元化战士的组合。


如下是生成教皇的照片,可以看出整体非常稳定。



以往的生图效果是下面这样的,左右性别不一致,而且样貌多样。



现在,当你再让Imagen 3去描绘历史场景,便会违反谷歌的人工智能的规则。


然而,谷歌Gemini此前毫不避讳地生成出了,穿着纳粹风格衣服的亚洲人、黑人。


有人测试后,感觉Imagen 3整体效果不错,不过仍有很长的路要走。



定制AI助手Gems


专门化的人工智能助手Gems支持Gemini Advanced,企业、以及商业用户,面向150多个国家。


现在,任何一个人可以通过Gems,为特定任务训练一个「数字专家」。



它可以是编码导师,也可以是营销策略师等等。


谷歌希望,这类面向定特任务的AI助手,能够解决像GPT-4o这样通用语言模型的局限性。


因为通过专门数据训练/定制的专业助手,能够提供更加实用、更高效的解决方案。



AI巨头激战正酣,谷歌毫不示弱


过去一年里,包括OpenAI、微软、Meta、Anthropic、HuggingFace等在内的公司,都推出了可定制的AI聊天机器人平台。


这标志着整个行业,向个性化AI体验转变。


OpenAI的GPT Store于1月推出之后,开发者们可以创建和分享ChatGPT的定制版本。


微软的Copilot Studio,可以让企业能够开发定制的AI助手,而Meta的AI Studio是为了创建定制聊天机器人。


Anthropic展示了Claude自动化任务的能力,HuggingFace为定制GPT提供了一个开源的解决方案。


此时,Gems和Imagen 3的发布,似乎是谷歌试图追赶,甚至赶超竞争对手的一次尝试。


一直以来,谷歌是AI研究领域的先驱,但在面向消费者的AI产品推向市场方面,有时会落后于对手。


特别是,在别家早已发布自定义助手之后,谷歌才有所行动。


从科幻到现实:AI重塑世界


话又说回来,不论是谁家发布,这一新功能可能会对整个行业,产生深远的影响。


在教育领域,AI导师可能会提供个性化学习体验;在医疗保健中,专门的AI助手能诊断和治疗规划。


在企业中,可以使用定制AI工具简化运营。


另一方面,AI的进步也引发了关于数据隐私、工作替代、潜在滥用的问题。


尽管谷歌采取了一些强有力的安保措施,但AI发展的步伐已经超过了监管框架。


随着AI继续深入日常生活,谷歌Gemini AI可能会激发出这项技术的变革潜力。


文章来源于“新智元”,作者“新智元


关键词: Imagen 3 , Gemini , 谷歌AI , Gems , AI助手
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/