spark的测试bf16浮点大约58T,100w功耗
我拿4060锁功耗大致测试,50w gpu功耗大约21.5T
所以大致估算n4的6144cuda规模ada估算100w 43T性能
那么spark强35%
但是同规模B比A同功耗大约也能强15-20%,所以这么估算工艺大致提升是不到20%
这个估算有两个问题比较模糊,timespy跑分提升15-20%不完全是浮点性能提升百分比,我没有显卡对比只能大致按这个估算;还有gddr和lpddr的问题,gddr功耗更高,但是spark应该又算上cpu功耗了
所以只是大致估算,n3e比n4在相同B系列提升15%-20%,工艺目前也就这个进步速度了,剩下看60系靠规模和架构改进吧


我拿4060锁功耗大致测试,50w gpu功耗大约21.5T
所以大致估算n4的6144cuda规模ada估算100w 43T性能
那么spark强35%
但是同规模B比A同功耗大约也能强15-20%,所以这么估算工艺大致提升是不到20%
这个估算有两个问题比较模糊,timespy跑分提升15-20%不完全是浮点性能提升百分比,我没有显卡对比只能大致按这个估算;还有gddr和lpddr的问题,gddr功耗更高,但是spark应该又算上cpu功耗了
所以只是大致估算,n3e比n4在相同B系列提升15%-20%,工艺目前也就这个进步速度了,剩下看60系靠规模和架构改进吧














