提示(prompt)是有效使用生成式 AI 图像模型的关键技巧。提示的结构直接影响生成的图像的质量、创造力和准确性。
今日凌晨,Stability AI 发布了 Stable Diffusion 3.5 的提示指南。该指南提供了 Stable Diffusion 3.5 的实用提示技巧,让使用者能够快速准确地完善图像概念,更好地使用 Stable Diffusion 3.5 这一在可定制性、高效性能、多样化输出和多功能风格方面均表现出色的模型。
指南中指出,可以将 Stable Diffusion 3.5 模型视为创意合作伙伴,在使用过程中通过用自然语言清晰地表达想法,从而为帮助模型生成符合期望的图像。
为了有效地构建提示,首先要确定关键要素:
在构建提示时需要明确审美方向,例如插画风格、绘画媒介、数字艺术风格或摄影。尝试并融合线条艺术、水彩画、油画、超现实主义、表现主义和产品摄影等风格。
如果想要生成的图片具有主题,则提示应首先强调主题的存在感,然后强调主题随后采取的任何动作。可以参考下面的图片和对应的提示。
可以通过指定特写镜头或广角视图来描述图像所需的构图和取景。
可使用“背光”、“硬边缘光”和“动态阴影”等术语描述场景中的灯光或阴影。
可使用电影术语指定技术参数,以指导所需的视角和取景。“鸟瞰图”、“特写”、“起重机镜头”和“广角镜头”等术语有助于有效地指导构图。可以考虑使用“鱼眼镜头”等术语来实现弯曲的外观,以实现独特的视觉效果。
Stable Diffusion 3.5 型号可以将文本合并到图像中。为了获得最佳效果,需要将文本括在“双引号”中,并保持所需的单词或短语简短。
负面提示可以精确控制颜色和内容。虽然主提示塑造了整体图像,但负面提示通过过滤掉不需要的元素、纹理或色调来完善图像,从而帮助实现重点突出、精致的效果。这可以更好地控制最终图像,确保干扰最小化,并确保输出与预期愿景紧密一致。
下面是利用所提供的提示来展示 Stable Diffusion 3.5 所涵盖的每种风格的例子。
文章来自于微信公众号“学术头条”