來講一下挖礦以ETH來說主要是靠隨機訪存一次64個128byte的數據
所以每次hash必然需要8192byte=8Kbyte
無法被cache
控制器跑100%不代表能跑到理論帶寬 會有Bank conflict等因素影響(還有TLB miss 不過現在TLB L2 覆蓋範圍高達8GB 能掩蓋)
所以預設情形下就是看架構 沒什麼空間能改進算法和數據結構
而且效率已經極高了
預設情形下比如3060 360.8GB/s 換算為45.1Mh/s 實質上跑是41Mh/s 有些是OC上去到能跑44Mh/s
按照相同架構的計算 6700xt 實際上應該在43-44Mh/s OC後到47Mh/s(理論從384GB/s->408GB/s 約17Gbps GDDR6的超頻極限 理論約48Mh/s->51Mh/s)
所以每次hash必然需要8192byte=8Kbyte
無法被cache
控制器跑100%不代表能跑到理論帶寬 會有Bank conflict等因素影響(還有TLB miss 不過現在TLB L2 覆蓋範圍高達8GB 能掩蓋)
所以預設情形下就是看架構 沒什麼空間能改進算法和數據結構
而且效率已經極高了
預設情形下比如3060 360.8GB/s 換算為45.1Mh/s 實質上跑是41Mh/s 有些是OC上去到能跑44Mh/s
按照相同架構的計算 6700xt 實際上應該在43-44Mh/s OC後到47Mh/s(理論從384GB/s->408GB/s 約17Gbps GDDR6的超頻極限 理論約48Mh/s->51Mh/s)


