二次元大叔控吧 关注:61,602贴子:590,515

回复:教程:AI绘画入门,实现Daddy自由

只看楼主收藏回复



IP属地:重庆来自Android客户端84楼2023-08-09 07:47
回复
    继续更新(楼主这两周事情很多,但是突然想到再不更新就开学了,要是在宿舍里更新这个不就被迫出柜了嘛还是赶紧趁着暑假更完吧。)


    IP属地:四川85楼2023-08-16 23:18
    回复
      2026-01-30 09:15:42
      广告
      不感兴趣
      开通SVIP免广告
      接下来的内容是一次性发的,涉及到很多图片和文字,百度很可能会吞楼,如果你发现有内容缺失或者不连贯请稍等几个小时,我会向百度申请恢复帖子。


      IP属地:四川86楼2023-08-16 23:20
      回复
        经过了繁琐的准备工作后,我们终于可以开始进行文生图了
        以下演示使用的模型为 Anymen,截至发帖,最新版本为3.0。这是我后来发现的一个绘画风格的模型,这个模型效果我个人觉得很满意,当然我也把他上传到了网盘里。
        转到文生图界面,选择我们的绘画模型并调整Clip终止层数(也被翻译为Clip跳过层)

        注意,当你手动切换大模型或者VAE模型时,一定要等待模型切换和加载完毕,再进行下一步操作,否则可能会导致模型读取出错,生成的图像会很扭曲。比如我要切换模型,展开下拉菜单,点击想要的模型

        然后就会出现等待提示,请耐心等待模型切换完毕。


        IP属地:四川87楼2023-08-16 23:23
        收起回复
          选择好模型,接下来就该写提示词啦
          提示词分为正面和负面提示词,这个之前有讲过。它们的输入框在这里:

          目前的Stable Diffusion大模型暂时只能使用英文书写提示词,不要使用其他语言。如果你不会英文,可以自行使用翻译软件。
          我在这里推荐一款翻译工具:DeepL。直接Bing一下就能找到。


          这个翻译器也是采用人工智能技术辅助翻译,注册后基本免费使用,无需魔法,实测下来短语和长句的中译英效果确实比主流的百度或者有道翻译好很多,缺点是站点不是非常稳定,有时候翻译速度很慢或者连接出错,刷新一下即可。


          IP属地:四川88楼2023-08-16 23:26
          回复
            如果直接展开介绍提示词,可能有点枯燥,那我们就以一个具体的案例来讲吧。
            ————————————————————————————————
            写提示词的前提是你必须构想一个画面。这个画面可以详细可以模糊,但你应该大体想象出来画面的主体和背景是什么。
            假如我灵光一闪,想要这样一张图像:
            一个男人,留着大胡子,戴着棒球帽,穿着外套和工装裤,坐在某个具有机械感的物件上,背景是城市的高楼群,最好有点景深效果,时间是白天,最好是侧脸对着镜头
            有点类似这张图片:

            (这个是照片哈,不是AI生成的,只是举个例子)
            那么我们该怎么写提示词呢?


            IP属地:四川89楼2023-08-16 23:30
            回复
              首先来讲正向提示词。这个很好理解,AI会尽可能画出正向提示词所描述的东西
              ————————————————————————
              这里首先需要明确三个非常重要的知识点
              >
              1.提示词有一定的语法规则,既可以用符合英语语法的自然语言书写,也可以写拆分成多个短句、短语甚至是单词。
              ----
              比如,“一个健壮的留大胡子的40岁男人坐在钢架上”,这个描述
              既可以写成:
              A sturdy, bearded man of forty sits on steelwork,
              也可以写成:
              1 man,beard, sturdy, forty years old, sitting on steelwork,
              (一个男人,胡子,健壮的,40岁,坐在钢架上)
              ----
              通常情况下,用拆分的短语或单词书写提示词,AI模型更能理解你的意思。
              但不同的模型也有不同的特点,某些模型对自然句子的理解能力又可能会更好,所以多数时候,你可以将句子和单词组合写进提示词里,这样的效果也很不错,比如这张HomosexualDiffusion 2.0模型所生成的图像:(原作者为C站用户blu3bug)

              这张图片的正向提示词为:
              photo by Pat Lee,skinny blond twink wearing black shirt, red background
              其中就出现了比较长的提示词“skinnyblond twink wearing black shirt”
              ----
              再比如这张由 Muses Erato V2模型生成的图像:(原作者为C站用户Krika0)

              这张图片的正向提示词为:

              (有些微妙词汇,怕吞楼
              其中也有“brothers embracingon a cruise ship”这样的长提示词。这里涉及的符号下面会讲。


              IP属地:四川90楼2023-08-16 23:38
              回复
                2.无论使用单词还是短语抑或是句子来书写提示词,都是用英文半角逗号“,"后加一个空格进行分隔,比如上面的

                提示词里不可以出现中文的全角标点符号!在键入提示词时请一定注意你处于英文输入模式下。


                IP属地:四川91楼2023-08-16 23:41
                回复
                  2026-01-30 09:09:42
                  广告
                  不感兴趣
                  开通SVIP免广告
                  90楼被吞了,看的时候注意一下


                  IP属地:四川92楼2023-08-16 23:44
                  回复
                    3.有一些基本的语法可以更改提示词的权重。每个提示词的默认权重都是1,假如我们要控制“hairy”(多毛的)这个词的权重,就可以这么写:(以下的符号如无特殊说明,均为英文半角符号)
                    (hairy) 将权重提高1.1倍
                    ((hairy)) 将权重提高1.1*1.1=1.21倍,再叠加括号也是这么计算
                    [hairy] 将权重减少至0.9倍
                    [[hairy]] 将权重减少至0.9*0.9=0.81倍,再叠加大括号也是这么计算
                    (hairy:1.2) 将权重指定为1.2倍
                    (hairy:0.8) 将权重指定为0.8倍
                    相应的,短句和句子的权重控制也是类似的方法,比如下面这张由MusesErato V2生成的图像(原作者为C站的mirrorsphere433)

                    其正向提示词为(不包含Lora):

                    你可以自行看看哪些提示词和短句被调整了权重。


                    IP属地:四川93楼2023-08-16 23:48
                    收起回复
                      解了提示词的基本写法,我们就可以来写自己图像的提示词了。
                      还记得我们刚才构想的画面吗?
                      ----
                      ”一个男人,留着大胡子,戴着棒球帽,穿着外套和工装裤,坐在某个具有机械感的物件上,背景是城市的高楼群,最好有点景深效果,时间是白天,最好是侧脸对着镜头”
                      ----
                      根据这个想象,我写了这么一段正向提示词:
                      1man, mature, handsome,beard, sturdy, forty years old, sitting on steelwork,
                      jacket, cargo pants,baseball cap, sideface, fullbody, city, skyscraper, depth of field,
                      outdoors, daytime,
                      (对应的中文:
                      一个男人,成熟,英俊,有胡子,健壮,四十岁,坐在钢架上,夹克,工装裤,棒球帽,侧脸,全身,城市,摩天大楼,景深,在户外, 白天,)
                      ----
                      然后我们配置好采样方法,图像的尺寸,高清修复和After Detailer插件,这些操作在之前已经讲过。

                      一般来说,每个大模型都有推荐的原始尺寸设置和采样方法,所以请多读模型介绍!!
                      我也将模型的介绍文本加进了网盘里。
                      这里我设置了一个横屏的尺寸和1.75倍的放大倍数,0.5的重绘幅度,其他的诸如“迭代步数”“提示词引导系数”保持默认。
                      这里的随机数种子默认是-1,意思是随机取一个种子进行作图,之后我们会讲到固定种子的相关内容。
                      ----
                      一切配置完毕,点击生成:duang!用时37秒,你的第一张AI生成的图像就完成啦!


                      似乎效果还可以。不过我们仔细看可以发现这张图的背景似乎有些单调,人物姿势有点诡异,整张图像也不是很出彩。那我们该怎么改进呢?


                      IP属地:四川94楼2023-08-16 23:53
                      回复
                        这个时候我们可以同时对正向和反向提示词进行修改,优化画面效果。
                        ----
                        首先我们就可以添加一些增强画面效果和细节的正向提示词,比如:
                        masterpiece(杰作)
                        high quality(高质量)
                        high-res(高分辨率)
                        best quality(最好的质量)
                        ultra detailed(细节丰富)
                        这些词汇其实类似于一个模板,你在以后生成的每张图像里都可以加上这些词,它们对画面质量有很好的帮助。
                        ----
                        我们试着将这些提示词加进正向提示词里。并且再修改和润色一下我们之前写的正向提示词。
                        这时我们的正向提示词已经有些多了,看起来有点乱,所以我们可以简单将正向提示词分个类,这不仅是为了你好辨认,也会影响AI生成图像的质量。你的提示词越有条理,AI就越容易读懂。

                        根据我的经验,正向提示词的先后顺序有概率会影响整体画面,所以你也可以把自己觉得重要的一类提示词放在最前面。


                        IP属地:四川95楼2023-08-16 23:57
                        回复
                          然后!不要忘记了负面(反向)提示词。AI会尽可能避免画出反向提示词里的内容
                          ----
                          还记得我们之前讲过的embeddings模型吗?我们之前安装过3个embeddings模型,分别是:
                          >
                          EasyNegative 截至发帖最新版本为1.0
                          FastNegative 截至发帖最新版本为2.0
                          DeepNegative 截至发帖最新版本为1.75
                          >
                          只要在负面提示词里填写这些模型的触发词,就可以激活他们改善面部和手部结构的功能。
                          我们点击生成按钮下的这个图标。

                          然后按照图中的提示操作。
                          之后这3个embeddings的触发词就被添加进了反向提示词框里了。
                          注意不要将触发词填进正向提示词的框框里了。
                          当然,反向提示词也需要遵守提示词语法规则,所以我们手动给它们加上英文逗号分隔

                          如果你觉得麻烦,可以记下这几个触发词,以后直接敲键盘填写进反向提示词框中,效果是一样的。
                          ----
                          除了这几个embeddings模型,我们还可以添加一些反向提示词,来尽可能避免AI画出错误的人体结构和一些我们不想要的东西,比如:
                          >
                          Lowres(低分辨率)
                          blurry(模糊不清的)
                          bad anatomy(不好的人体结构)
                          bad hands(不好的手)
                          error(错误)
                          missing fingers(手指缺失)
                          extra digit(指头多余)
                          fewer digits(指头缺失)
                          cropped(画面裁切不正确)
                          worst quality(最糟的质量)
                          low quality(低质量)
                          signature(署名)(某些用于训练AI的图像可能包含作者的署名或水印,AI在生成图像时有概率一并生成这些东西)
                          watermark(水印)
                          text(文字)
                          >


                          IP属地:四川97楼2023-08-17 00:02
                          回复
                            我们将修改后的正向和反向提示词一并整理好,大概就是这样:

                            之后再生成一次图像,duang!

                            画面和人物细节确实好了很多,但是——
                            我不是要侧脸吗?怎么给我生成的是正脸照?


                            IP属地:四川98楼2023-08-17 00:04
                            回复
                              2026-01-30 09:03:42
                              广告
                              不感兴趣
                              开通SVIP免广告
                              别着急!我们刚刚不是讲了提示词的权重吗?让我试着增加side face(侧脸)(注意,之前的示范图里这个短语打错了,应该是side face而不是sideface,请自行纠正)的权重吧,

                              调整完权重之后再生成一次,duang!


                              IP属地:四川99楼2023-08-17 00:06
                              收起回复