都很适合图形渲染,,,说实话AMD的路线除GCN变得有像NVIDIA fermi架构,以前的VLIW更加像是一颗完全为图形渲染打造的架构,而NVIDIA一直都兼顾通用计算与图形渲染,看起来都不是专为图形渲染而生,
NVIDIA从G80就采用gigathread-block-warp线程调度的纯标量架构,warp发射宽度为32,fer()mi的GF100/110的每个SM包括32个SP+4个SFU还有一些L/S等,每个SM包涵2个warp+2个dispatch,每个warp发射一条指令,宽度为32,sp是16个为一组的所谓SIMD-16(其实AMD GCN的CU单元包涵4个SIMD-16,其调度为wavefront,发射宽度为64threads,调度机制感觉也比较像fermi),GF100/110有2个warp并行发射,被NVIDIA称为dual-issue既双发射机制,2warp可以保证sm里的32个sp充分利用,,G80/GT200的架构的warp差不多,但实际sm的sp和SFU会有不同,详细讨论下来太多了。。。。
AMD GCN架构之前的VLIW架构没有灵活的"hardware scheduling",其渲染灰常不灵活,需要极强的驱动程序优化及游戏优化,,,最不理想的状态是指令间存在关键性,VLIW SIMD阵列将无法并行运算,将有大量SP闲置,,,其实NVIDIA的开普勒架构同样借鉴了此做法,开普勒的指令关联性检查和线程排列没有放在GPU里(fermi及以前的架构都是有专门的处理单元的),而放到CPU里,软件执行这同样对驱动程序提出了相当高的要求,而且没有专门的处理单元,理论上效率是有所下降的,,,至于GCN其实感觉和fermi很相似,AMD借鉴了NVIDIA的做法,,,
总之不管AMD和NVIDIA都设计了很优秀的GPU,有都在相互学习扬长避短,,,
说太多了,但这只是皮毛,俺也只懂皮毛,详细讨论还有寄存器,缓存,纹理等总之非常复杂的,不能也没有能力说清楚