刚开始时,人们可能会认为只输入一个词就会生成一幅很酷的图像。尽管人工智能模型越来越能理解我们想要什么,但它们还不能读懂我们的想法。
所以,如果你想生成一个看起来像你所想的图像,你需要编写正确的提示。
空提示
训练后,BoostPixels 中的空提示会生成一张与您为训练上传的照片非常相似的图像。
训练模型的默认词是“ ftpdnx ”。该词会自动包含在提示的开头,因此您无需在每次编写提示时手动输入。
字重
单词的权重是指单词对正在生成的图像的影响程度。重要的词应该放在第一位,因为它们的影响力更大,后面的每个词的权重都小一些。
如果你想让一个词更重要,把它放在括号“()”中。这有助于 AI 专注于您真正想要的图像。
当你对一个词使用太多权重时,模型将只关注那个词,通常会生成奇怪的图像。
并非所有单词都具有相同的起始权重。有些词更强大,因为它们在训练数据集中出现得更频繁。您需要在说明中平衡不同词的重要性,考虑每个词的影响有多大。
如果生成的图像看起来不像您,请尝试将“(ftpdnx person)”添加到您的提示中。这有助于 AI 理解它应该使用训练模型的照片。
媒介和风格
指定您想要的样式和媒介,因为这些因素会极大地影响最终结果。如果您不提供此信息,AI 将简单地使用输入图像的样式。
一些流行的风格包括超现实主义、超现实主义、卡通、水彩、素描和概念艺术。
媒介的范围从摄影和插图到绘画和 3D 渲染。
添加艺术家
通过在您的提示中包含艺术家的名字,例如“伦勃朗的画作”,您可以生成具有特定艺术风格的图像。
质量属性
您可以定义不同的属性,如分辨率、质量和光照。
包括 1080 HD、4K UHD 和 8K UHD 等词来表示所需的分辨率可以提高清晰度,而“锐利”和“聚焦”等词有助于增强细节。
自然光、荧光灯、LED 灯和白炽灯等照明营造出一定的氛围。
语境
使用 AI 创建有趣或有趣的图像通常涉及将主题置于不同的环境中。例如,您可以生成以威尼斯或巴黎的主题为背景的图像。
“as”结构可用于将主题转换为其他事物,例如圣诞老人。这可以创建有趣且独特的图像。通过尝试不同的概念,您可以创作出酷炫有趣的图片。
人工智能模型不像人类那样理解逻辑。因此,如果你给他们一个提示,比如“a person riding a horse under an elephant”,他们不会按照你期望的方式解释它。
颜色
您可以编写颜色以生成包含它的图像。请小心,因为很难仅更改图像一部分的颜色。
((秃头))穿着红色夹克照片超写实 4K UHD Sharp Focus LED 灯 | |
((秃头))穿着黄色夹克照片超写实 4K UHD Sharp Focus LED 灯 |
情绪
情感词可以帮助在 AI 生成的图像中营造情绪或氛围。使用不同的词可以使图像给人以积极(如快乐、开朗)或消极(如恐怖、怪异)的感觉。
((秃头))可怕的怪异恐怖照片超逼真 4K UHD Sharp Focus LED 灯 | |
((光头)欢乐照片超逼真 4K UHD Sharp Focus LED 灯 |
透视和距离
提供有关生成的图像中事物应该有多近或多远的明确说明。否则,AI 可能会生成与训练图像过于相似的图像。
要生成一个人的全身图像,请包含“夹克”、“腰带”和“鞋子”等词,以确保捕捉到整个人物。您还可以使用与您想要的图像类型相关联的词,例如以特定距离和视角拍摄照片而闻名的摄影师的名字。
面孔
在远处人物的图像中生成准确的人脸是一项艰巨的挑战。改善这一点的一种方法是创建更高分辨率的图像并选择“增强面部”选项。
图像和面部变得更清晰、更细致。但是,此过程需要更多的时间和资源,因此成本更高。高分辨率图像(1024 像素)大约需要 8 秒和 4 个学分,而低分辨率图像(512 像素)只需要 2 秒和 1 个学分。
1024像素+增强面部 | |
512像素 |
额外的努力和成本有助于使面部在最终图像中看起来更好、更准确。
负面提示
BoostPixels 有一个默认设置,它使用负面提示“卡通 3d 手变形丑陋”来帮助生成更好的图像。但是,用户可以选择不同的选项或创建自己的选项。
否定词不会使事物从图像中消失;相反,它们降低了某些词的重要性。
重复的力量
使用人工智能创建图像时,第一次尝试无法获得完美图像是正常的。如果需要多次尝试才能获得预期结果,请不要气馁,因为 AI 模型中存在随机噪声,这是正常现象。
与其完善提示,不如使用相同的提示生成大量图像以增加获得所需结果的机会。
提示长度
提示限制为 256 个字符。编写长提示并不一定会产生更好的结果。在简洁和为人工智能提供足够的信息以产生预期结果之间找到正确的平衡很重要。
标点
改变文本提示中的标点符号会影响 AI 生成的结果,因为每个字符,甚至逗号或句号都很重要。因此,仅更改逗号或句号可能会产生完全不同的图像。
字符集和不区分大小写
用英语写你的提示,因为大部分模型的训练数据都来自英语。
您是否全部使用小写字母或大写字母都没有关系,因为模型不会区分它们。
无分类器指导量表
当你增加 Classifier-free guidance scale 时,生成的图像看起来更像输入提示,但生成的图像种类可能会更少。
种子
种子是一个数值,用作模型创建随机噪声的起点。默认情况下,种子值设置为 -1。这意味着每次生成图像时,您都会得到一个全新的图像,即使您使用相同的提示和设置也是如此。但是如果你想重现相同的图像,你可以设置一个特定的种子值。
限制
无法创建文本,因为它由遵循特定顺序和结构的单个符号组成。文本的这种离散和结构化性质与图像的性质截然不同。
手经常畸形或看起来不自然,因为它们具有许多细节。很难正确捕捉手指和关节的形状、大小和位置。
即使使用相同的提示,AI 也可以产生不同的结果。这可能会让人们相信某些因素在他们不重要的时候很重要,就像相信穿上幸运衬衫可以帮助你的球队赢得比赛一样。
via https://boostpixels.com/short-guide
文章评论