


结果看图,黑色是实测,灰色是引用
全部在ubuntu系统测试,5090和5090D的pytorch、cuda、驱动版本一致,5090是B站用户提供的平台,非常感谢
结论:
•5090和 5090D在各种深度学习模型上的性能没有显著差异
•两者在 Swin Transformer上FP32设置下的性能表现显著低于理论性能
•两者在重复调用 nn.Linear类或者 nn.Functional.linear时,性能均出现显著下降
•Pytorch工程师的5090在重复调用nn.Linear时性能显著优于我们测试的5090和5090D
不发表主观看法,大家自己判断