p106吧 关注:31,850贴子:306,024
  • 12回复贴,共1
求助

40HX跑图慢

只看楼主收藏回复

从P104换到40HX跑图反而更慢了,请问40HX跑图参数该如何设置?


IP属地:天津来自Android客户端1楼2023-08-05 22:54回复
    我按照4tzR23大佬的设置,第一种不加参数默认启动是以半精度为主的混合精度模式(载入显存的模型是半精度fp16,计算也主要用半精度fp16),由于40hx半精度被砍,速度会非常变得慢。 一个最简单的方法是加--precision full --no-half启动参数禁用半精度,会提速5~6被,但是模型占用的显存也会翻倍(默认好像是2G,禁用后占4G)
    第二种方法就是默认不加参数,修改源码,设置以单精度为主的混合精度模式,载入显存模型是fp16,但计算以fp32为主。在modules\devices.py的最后一行,将return torch.autocast("cuda")改为torch.autocast("cuda", dtype=torch.float32, enabled=True),这样启动显存占用减半。这样也不行,还没P104快。


    IP属地:天津来自Android客户端2楼2023-08-05 23:02
    回复
      2026-05-16 16:15:46
      广告
      不感兴趣
      开通SVIP免广告
      要解决40HX跑图慢的问题,可能需要进行一些参数调整。然而,具体的设置方法可能会因游戏版本和个人硬件配置而异。因此,我建议查阅最新的和具体的相关文档或论坛讨论来获取最准确的信息。同时,请注意在修改任何系统或应用程序的默认设置之前先备份数据以防万一。


      3楼2023-08-05 23:04
      回复
        按大佬这个方法也不成,还不如P104快。


        IP属地:天津来自Android客户端4楼2023-08-05 23:19
        回复
          按别人设置的,devices.py改混合精度的参数,或者加单精度关闭半精度都不行。


          IP属地:天津来自Android客户端5楼2023-08-05 23:21
          回复
            这帖子一直在吞回复,服了。


            IP属地:天津来自Android客户端6楼2023-08-05 23:34
            回复
              跑图p102最好,40hx反而不行


              IP属地:河北来自Android客户端8楼2023-08-05 23:49
              收起回复
                所以40hx不值,有什么价值呢


                IP属地:上海来自Android客户端10楼2023-08-06 14:10
                收起回复