首先来看看按摩店的580的浮点参数

出处https://www.techpowerup.com/gpu-specs/radeon-rx-580.c2938
一个和老黄显卡一个很明显的不同就是FP16和FP32参数是完全相同的
为什么,这里做一个简单的推测就是AMD对于浮点单元的设计和CPU是一致的,
只要小于双精度的浮点数一律转换成双精度浮点数进行计算输出后再转化成输入的精度,
所以580可以认为没FP16计算单元,而是直接转化成FP32计算后再输出

出处https://www.techpowerup.com/gpu-specs/radeon-rx-580.c2938
一个和老黄显卡一个很明显的不同就是FP16和FP32参数是完全相同的
为什么,这里做一个简单的推测就是AMD对于浮点单元的设计和CPU是一致的,
只要小于双精度的浮点数一律转换成双精度浮点数进行计算输出后再转化成输入的精度,
所以580可以认为没FP16计算单元,而是直接转化成FP32计算后再输出