stablediffusion吧 关注:39,561贴子:154,394
  • 31回复贴,共1

Comfyui牛逼!12G显存(无内存交换节点)跑1280x720视频

只看楼主收藏回复

1楼喂度娘


IP属地:广东1楼2025-10-01 01:44回复
    之前发过一个12G显存跑wan2.2视频实测的帖子(地址见楼中楼),当时也试过1280x720的视频尺寸,无论用KJ流还是官流,怎么搞内存交换节点,12G显存跑1280x720的视频尺寸都会爆显存。
    后面因为显存小,也没怎么去试wan2.2视频的东西了,就是是不是更新Comfyui版本。这两天,因为lightx2v放出了自己做的一个wan2.2的高噪视频模型,说动态效果接近官方的,就去试了下。然后,刚才无聊试了下1280x720的视频尺寸,我这台12g显存的机子竟然跑通了,整个工作流也没任何内存交换节点,牛逼了,Comfyui,看来是Comfyui的内核又做了什么优化更新,小显存的机子竟然能跑大视频尺寸了。
    我是12G显存、64G内存。
    工作流见下,高噪模型26G、低噪模型也是26G,上lightx2v给的4步加速lora,工作流无内存交换节点。

    1280x720的视频尺寸竟然跑通了……

    第一遍跑要加载两个26G的模型,用了736秒;第二遍无需加载模型了, 用了597秒。

    唉、牛逼了,Comfyui,竟然可以优化到这个地步……


    IP属地:广东2楼2025-10-01 01:51
    收起回复
      2025-10-13 04:57:58
      广告
      不感兴趣
      开通SVIP免广告
      总结,一句话:
      12G显存、64G内存,用Comfyui最新版,可以跑两个26G的视频模型,生成1280x720的视频尺寸。


      IP属地:广东3楼2025-10-01 02:07
      收起回复
        上面的测试没有重启电脑。
        我刚才重启了一下电脑,第一遍要加载两个26G的视频模型,耗时无需上面的736秒,只要639秒


        IP属地:广东4楼2025-10-01 02:44
        回复
          12G显存,跑1280x720,总帧97帧(16帧率,6秒),也跑通了。

          昨晚还试了下总帧113帧(16帧率,7秒),当时是爆掉了,下次重启机子时再试试。


          IP属地:广东5楼2025-10-01 08:35
          回复
            对比官方的模型,有啥差别


            IP属地:广东来自Android客户端6楼2025-10-01 10:34
            回复
              求教楼主,我用的官方工作流,参数完全相同情况下生成视频时,每次生成的时间基本都一样。第一遍加载模型,第二遍无需加载模型是什么意思


              IP属地:江苏来自Android客户端7楼2025-10-01 15:05
              回复
                那我要试试12G+32G内存能不能跑1280*720的视频


                IP属地:江苏8楼2025-10-01 21:34
                回复
                  2025-10-13 04:51:58
                  广告
                  不感兴趣
                  开通SVIP免广告
                  反馈一下实测结果
                  RTX3060-12G显存+32G内存,comfyui更新到最新版。
                  官方的双噪流,1280*768,5秒81帧,可以跑得动,第一次加载模型跑下来16分钟左右
                  因为内存32G,只能用Q4-GGUF的量化模型
                  为啥呢,因为32G内存不足以加载fp8的模型,只能降低标准了。
                  lora方面,可以依旧使用Wan21_T2V_14B_lightx2v_cfg_step_distill_lora_rank64,
                  也可以使用楼主说的新版Wan2.2-T2V-lightx2v-4steps-lora-250928,区别是老的lora6步,新的是4步采样。
                  最后vae解码的时候会超出12G显存一丢丢,测了多次,大约是12.2G,开共享显存解决,对总耗时影响不大。
                  -----------------------------------------------
                  kj流5s视频反而会内存不够用,应该是kj流需要加载bf16版本的clip模型(11G大小),工作流总体超出32G内存负载了,如果跑3S视频,是可以的,这样反而不如使用官方的工作流。


                  IP属地:江苏9楼2025-10-02 17:47
                  回复
                    你们是不知道有wan2.2 aio v10 吗,还在gguf...能跑有什么用,关键是听得懂人话


                    IP属地:广东10楼2025-10-02 20:38
                    收起回复
                      统一参数:1280*720分辨率,帧率16,5秒81帧,4步采样
                      统一提示词:
                      16:9, 50fps, 4K, cinematic tracking shot, dark runway, single spotlight follows model Luna in black feather wings strutting, slow-motion 40% speed, camera glides left-to-right at hip level, lace corset push-up with gold embroidery shimmering, lens flare on wing tips, color palette obsidian + gold, shallow depth 35mm f1.4
                      测试结果如下:
                      都是首次全新加载测试,(中间使用抠图节点清除内存、显存占用)
                      先从allinone-v10测试
                      模型1:wan2.2-t2v-rapid-aio-v10-nsfw
                      工作流:作者原示例工作流,仅加sage注意力机制加速
                      视频生成时间16:02

                      模型2:wan2.2_t2v_14B_Q4_K_S.gguf(高低噪声双模型)
                      工作流:官方高低噪采样+4步lora,也有sage注意力机制加速
                      视频生成时间:15:25

                      是不是很意外?
                      ----------------------------------------
                      再看出视频对比
                      模型1:wan2.2-t2v-rapid-aio-v10-nsfw

                      模型2:wan2.2_t2v_14B_Q4_K_S.gguf

                      结合提示词对比吧
                      所以我用我的gguf,你继续allinone吧


                      IP属地:江苏12楼2025-10-03 08:03
                      收起回复
                        玩腻了,出新版本之前不想玩了


                        IP属地:广东来自Android客户端13楼2025-10-03 10:05
                        回复
                          你好,看你回复了我,为什么隐藏了呢


                          IP属地:贵州来自Android客户端14楼2025-10-09 15:53
                          收起回复