p106吧 关注:31,464贴子:303,362

回复:Tesla P40到手,开搞

只看楼主收藏回复

24g显存?384bit?


IP属地:安徽来自Android客户端19楼2022-11-08 20:08
回复
    老娱乐大师要把我气笑了,19W分,感情我买了一块1660Ti?


    IP属地:江苏20楼2022-11-08 22:32
    收起回复
      2026-03-05 10:50:33
      广告
      不感兴趣
      开通SVIP免广告
      time spy能跑多少


      IP属地:中国香港21楼2022-11-09 18:09
      收起回复
        楼主 求解 炼丹是什么意思啊?总是见到这个词但是我又不知道什么意思


        来自Android客户端23楼2022-11-10 11:03
        收起回复
          以前玩过一张tesla k20c 我是nvflash强刷驱动 然后打驱动再改注册表才改好的 不知道p40是不是这样 现在好像直接打grid驱动就行了


          来自Android客户端24楼2022-11-10 11:05
          回复
            一个小时过去了,生产队的驴都不敢这么休息
            催更,块


            IP属地:广东25楼2022-11-10 11:07
            回复
              cy


              IP属地:四川来自iPhone客户端26楼2022-11-10 11:11
              回复
                炼丹师是什么啊?


                IP属地:广东来自Android客户端27楼2022-11-10 13:30
                收起回复
                  2026-03-05 10:44:33
                  广告
                  不感兴趣
                  开通SVIP免广告
                  老哥我这个怎么回事


                  IP属地:安徽来自iPhone客户端28楼2022-11-12 05:35
                  收起回复
                    可以发一下驱动吗楼主


                    IP属地:广东来自Android客户端29楼2022-11-14 01:10
                    收起回复
                      ai画图测试结果:
                      参数:除了关闭半精度,啥都没设置。
                      分别跑了8轮,分别是512*512 15/20/30 步,640*640 30/25 步、768*768 25/30 步,1024*1024 20 步、最后1024*1024显存爆了。所有模型都在GPU上所以挺快。

                      小飞机曲线图,平常占用11.3G显存,512*512 20/25步的小图片16.5G,大图片20G显存。
                      注意最下 commit change已经超过了本机物理内存32G上限,所以出现了显存溢出。但是内存占用(右下)并不高。


                      IP属地:江苏31楼2022-11-16 22:33
                      回复
                        改成了 midvram,平常占用4GB,画512*512 640*640 768*768 图片分别占用 9G 11G 15G。

                        显存占用低,就得有一部分模型跑到了CPU上,结果嘛,就是比在纯GPU上面跑慢了三秒。第一个batch用于加载模型可以忽略。


                        IP属地:江苏32楼2022-11-16 23:27
                        回复
                          尝试在midvram模式下画1024*1024的图,结果嘛……内存不足,直接浏览器崩溃,驱动挤没了,妈呀,平时32G内存占用不超过一半的。
                          重新尝试,最高可以画到960*640或者1024*576。


                          IP属地:江苏来自手机贴吧33楼2022-11-17 08:53
                          收起回复
                            开关半精度的对比,看看没有TensorCore影响多少。
                            首先是关闭半精度的状态:平时占用4G,跑960*640需要16G;

                            跑了20/25/30 步(第一轮加载忽略):

                            然后是开启半精度,平时显存占用刷地降到了2.4G,跑960*640,而画图占用了8.2G(前三个波峰)。

                            跑跑960*640,25、20、30步时,时间分别短了11s、14s、17s!

                            所以是谁说要关半精度的......
                            这样终于可以尝试1024*1024啦,占用显存16.1G。


                            IP属地:江苏34楼2022-11-17 22:55
                            收起回复