最近实验室的同学总是嫌原来的X99工作站Abaqus仿真计算速度太慢,但是导师又不愿意花钱购买新设备,于是导师委托我想办法节约成本的情况下给仿真计算提提速
于是经过我多天的测试,租赁使用了包括U7-265K、双路EPYC 7532、9950X等平台进行测试,感觉其性能提升完全匹配不了价格,所以我选择E5-2697AV4对原X99平台进行升级
由于Abaqus支持GPGPU加速,最近V100降价到580元,带转接+散热总价也不超过1300,所以我额外购买了一套V100,总共花了约1600元
随后在测试过程中,E5-2697AV4搭配V100-SXM2起到了令人极其震惊的加速效果:其速度超过U7 265K,与9950X相当,而目前的各类平台里与V100最能完美适配的就是X99,可以说是黄金搭配,其加速思路如下:
1,E5-2697AV4具有双圈RingBus,每圈8个核心总共16个核心,而8核/16核/32核这种2的乘方数量核心的CPU对于有限元仿真的计算域划分具有极大的好处,更容易保证计算域平衡
2,E5-2697AV4具有4通道DDR4 2400MHz内存,对仿真计算来说等效于2通道DDR5 4800MHz内存,还比DDR5赢一手延迟
3,E5-2697AV4具有40条PCIE3.0通道,而V100的通道为PCIE3.0x8,在X99平台上不但可以跑满V100,还不影响用来显示的显卡,还可以扩展很多张M2硬盘,PCIE槽随便拆分
4,V100是目前30000元(A100)价格以下性能最好的双精度卡,没有双精度的卡就算是5090来了也别想加速仿真计算,所以就算是9950X来了也得乖乖用V100加速仿真
5,使用GPGPU加速之后主要计算由显卡完成,消耗的主要时间变成了CPU与GPU之间的通信时间。但是V100自己只有PCIE3.0x8的速率,所以9950X用V100加速也加不了多少速
6,9950X不加速就跟2697AV4加速后一个速度,加速提升10%甚至个位数,这显然是不可接受的,而一旦因为消费级主板扩展性差,让V100跑在x4通道上,反而还会减速
所以目前只要是能用GPU加速的仿真计算案例,那么E5+2697AV4+V100就是版本答案,两三千块就让你拥有一万块的性能,还可以四卡并联,简直是太厉害了


于是经过我多天的测试,租赁使用了包括U7-265K、双路EPYC 7532、9950X等平台进行测试,感觉其性能提升完全匹配不了价格,所以我选择E5-2697AV4对原X99平台进行升级
由于Abaqus支持GPGPU加速,最近V100降价到580元,带转接+散热总价也不超过1300,所以我额外购买了一套V100,总共花了约1600元
随后在测试过程中,E5-2697AV4搭配V100-SXM2起到了令人极其震惊的加速效果:其速度超过U7 265K,与9950X相当,而目前的各类平台里与V100最能完美适配的就是X99,可以说是黄金搭配,其加速思路如下:
1,E5-2697AV4具有双圈RingBus,每圈8个核心总共16个核心,而8核/16核/32核这种2的乘方数量核心的CPU对于有限元仿真的计算域划分具有极大的好处,更容易保证计算域平衡
2,E5-2697AV4具有4通道DDR4 2400MHz内存,对仿真计算来说等效于2通道DDR5 4800MHz内存,还比DDR5赢一手延迟
3,E5-2697AV4具有40条PCIE3.0通道,而V100的通道为PCIE3.0x8,在X99平台上不但可以跑满V100,还不影响用来显示的显卡,还可以扩展很多张M2硬盘,PCIE槽随便拆分
4,V100是目前30000元(A100)价格以下性能最好的双精度卡,没有双精度的卡就算是5090来了也别想加速仿真计算,所以就算是9950X来了也得乖乖用V100加速仿真
5,使用GPGPU加速之后主要计算由显卡完成,消耗的主要时间变成了CPU与GPU之间的通信时间。但是V100自己只有PCIE3.0x8的速率,所以9950X用V100加速也加不了多少速
6,9950X不加速就跟2697AV4加速后一个速度,加速提升10%甚至个位数,这显然是不可接受的,而一旦因为消费级主板扩展性差,让V100跑在x4通道上,反而还会减速
所以目前只要是能用GPU加速的仿真计算案例,那么E5+2697AV4+V100就是版本答案,两三千块就让你拥有一万块的性能,还可以四卡并联,简直是太厉害了

