stablediffusion吧 关注:48,711贴子:205,479
  • 16回复贴,共1

大家觉得还要几年AI会比较听话

只看楼主收藏回复

现在AI画面效果其实已经很不错了。最烦的是不听话,比如做视频你让她抓住个什么东西,结果她在那里扣脸,你让她翻个身,结果她扭了半天瞬间以不科学的方式完成翻身。如果遵从指令能达到85%,那别的真的没什么好玩的了。不过顶级闭源SD2也是一样,让开门走进去,结果开门了自己回头走了,就这一幕都抽卡好几次,如果要控制好需要多图和严谨的提示词,很累,真希望2年内AI能真正做到马虎听话


IP属地:云南1楼2026-04-01 10:29回复
    不会,只会越来越严限制越来越多


    IP属地:浙江来自Android客户端2楼2026-04-01 11:04
    回复
      2026-04-21 04:19:46
      广告
      不感兴趣
      开通SVIP免广告
      现在有个模型宣传的几乎可以实时出视频实时修改,真能做到这种程度的话已经相当于非常听话了吧


      IP属地:河南来自Android客户端3楼2026-04-01 12:14
      回复
        我倒是觉得越来越对齐了,想象力明显拉了很多


        IP属地:卢森堡来自Android客户端4楼2026-04-01 12:17
        回复
          现在限制能力的原因主要是硬件


          IP属地:广东来自Android客户端5楼2026-04-01 12:36
          回复
            不行ipadapter这种还是插件,2年应该不行


            IP属地:湖南来自Android客户端6楼2026-04-01 13:29
            回复
              底层运行逻辑不改变,再迭代也很难达到楼主的要求。换言之,哪怕是sd2这种顶级闭源,它也不可能在这种细枝末节的地方增加训练集浪费算力,毕竟它的模型体积太大了(保守估计1000b起步)。
              即便迭代了,不做专项微调训练也白搭。这还是建立在完全没有审核的情况下,加上审核,你为了规避敏感词改提示词,只会更难出满意的。


              IP属地:吉林来自iPhone客户端7楼2026-04-01 13:30
              收起回复
                从宏观理论上来说,ai黑盒是进和出两个概念,进 你只说简单的东西,他一定要补充,补充的内容就很可能不是你要的,自古以来精细化=高自由度,越简单的代码自由度越低,一个道理


                IP属地:贵州来自Android客户端8楼2026-04-01 14:09
                回复
                  2026-04-21 04:13:46
                  广告
                  不感兴趣
                  开通SVIP免广告
                  理论:模型的能力与你的能力是相关的。


                  IP属地:四川来自Android客户端9楼2026-04-01 15:54
                  回复
                    你不了解AI的逻辑,AI需要训练库有,这也就是为什么,同样一个大模型,而且提示词完全一样,加个lora就可以做到你说的动作,特别是闭源模型,为了和谐,会去除很多东西。比如不能瑟瑟。比如之前满血的即梦2就非常牛逼。现在就比较烂了。


                    IP属地:广东来自手机贴吧10楼2026-04-01 17:13
                    回复
                      避免你听不懂,如果是闭源模型,你需要的动作,如果包括瑟瑟或者版权或者其他,都有可能,一辈子不允许生成,如果是本地模型,需要时间发展或者需要lora


                      IP属地:广东来自手机贴吧11楼2026-04-01 17:28
                      收起回复
                        看政策上有没有限制,技术上应该不难突破


                        IP属地:广西来自iPhone客户端12楼2026-04-01 21:21
                        回复