我看最近很多**说9700x还有9600x强过146kf。
其实不然。
首先说明,我的目的是建立更好的amd gaming pc环境。
上来就带节奏的死出去,找骂的我毫不客气。
原因就在于if总线带宽瓶颈以及小核。
我使用9950x的时候经常使用process lasso把后台能挂的全tm挂到ccd1,只留ccd0打游戏,实测流畅度完全爆杀默认调度,而76x和783需要我在玩cs2的时候杀完所有后台。
那么这个具体涉及什么?
首先你要明白一个点:if总线的特性就是每周期32b读16b写。
乘上2000的fclk频率(也就是if总线时钟频率)就是理论值64000b读 32000b写。
这俩我们近似看成64gb读,32gb写。
ok,经常超频的老烧肯定发现问题了!
***,amd写都90多gb每秒了现在!民科滚一边去!
别急,听我讲。aida64测的是大块数据读写。什么意思呢?
关键就在于amd三缓里面有缓冲队列xi(就是一个指令中转站)。你每次传16b是很少,但是你放多点,堆满64b再打包会怎么样?而aida64恰好测的是你多次爆发写入的速度,就是说支持你打包作弊。你只要每次打包好64b等测试间隔到了再放出去就完事了。
amd负责干这个指令缓存的模块叫xi模块,负责把你的cpu发出的读写指令暂缓,然后进行字节对齐的,而且xi指令暂缓有限制,我列一下(按ccx来排):
3000系列是64条 8核=双ccx
5000系列是192条 8核=单ccx
7000系列我约摸估计可能是256条(网上没找到数据)8核=单ccx
9000系列是320条 8核=单ccx
xi越多,对于读写负载大的程序来说越好,因为你的指令操作不会因为xi满了所以只能停下来等(你就把xi理解成火车站大小就懂了,火车站大,容纳的人多,就不容易挤慢)。
(所以你打电竞不用win10老坛酸菜这种精简系统的你牢牢实实上9000系,别再用7000系坐牢,玩吃鸡和永劫这些优化贼他妈烂,数据天天跑内存找的游戏包你怎么调都有可能卡到妈都不认得。)
如果要求连续写入,32位总线慢过16位同频怎么可能?真实的锐龙if总线,如果你真要货真价实连续读写,那就是fclk2000=64g读/32g写,没得讲。
这边我放一个外国的有趣的数据(需要魔法)网页链接 。
如果没办法看到的话,我来简单说一说怎么一回事。就是因为amd zen5架构优化之后,内存延迟需求线程和内存带宽需求线程之间做了取舍平衡,使得你在ccd1跑内存带宽要求高的程序基本不会影响到ccd0里面对内存延迟高的程序,所以理论上没有任何7000系以及之前的amd cpu在游戏直播(你哪怕不直播,后台杀完也是)方面强过9950x3d。你要做的就是只留一个三缓ccd给游戏,别的软件和系统后台全tm放ccd1给它用高频全部搞定。而且zen5架构ipc和Intel 14代同级别,同频就是能打,5.7的x3d就是猛。
你amd再怎么折腾,都是单ccd fclk 每秒64读 32写。你要帧数上去,延迟下去,就是把fclk拉高。最高2200,提升百分之10%,那就是70.2读 35.2写。内存这个时候搞6600c26,打吃鸡才够爽。之前zen4有个延迟表,fclk在整数时候延迟最低,分别2000和2200。我记得是因为省去了非整数周期的对齐修正延迟。而在我玩下来,也是2000这种最大众,最稳定。zen3不用想就是1800。别的非整数相比于较低的整数,效能肯定好看,因为带宽就是上去了,但是你实际的数据链路因为需要额外修正,延迟就是比整数高。同样,ddr5对于内存信号和imc质量要求高。
你非整数比例高帧肯定可以,但是不一定手感稳定。
2000配6000同步、8000异步
2100配8400异步
2200配8800异步
别花里胡哨整这么多33和67在末尾。能稳定是运气,不是实力。超频本质是人去摸硬件潜力而不是人去激发硬件潜力,他的潜力都被设计好了。
Intel不管是146 147 149还是129 127 126,他的读写都是实时均衡,并没有受到if总线的干扰。根据Intel官方,可达89.6gb每秒的带宽,而且Intel传输线路是对称形式,所以你89.6的读,89.6的写。而且Intel的读写指令缓存队列是分开的,读一个,写一个,完全互不干扰,不会像amd那样有读写混合,读和写会打架。(这一点我在cs2中能感受到,有时候卡操作而帧数不卡,有时候卡帧数而操作不卡)如果你超ring还能上去。而且Intel有小核心辅助你去挂载后台,防止污染游戏线程的三缓。
指令缓存并不是什么坏东西,关键是amd的if线路导致内存瞬发读写的弱势,这点就是卡顿的关键。所以,越吃内存的游戏,Intel就是越屌。
欢迎大神讨论。









其实不然。
首先说明,我的目的是建立更好的amd gaming pc环境。
上来就带节奏的死出去,找骂的我毫不客气。
原因就在于if总线带宽瓶颈以及小核。
我使用9950x的时候经常使用process lasso把后台能挂的全tm挂到ccd1,只留ccd0打游戏,实测流畅度完全爆杀默认调度,而76x和783需要我在玩cs2的时候杀完所有后台。
那么这个具体涉及什么?
首先你要明白一个点:if总线的特性就是每周期32b读16b写。
乘上2000的fclk频率(也就是if总线时钟频率)就是理论值64000b读 32000b写。
这俩我们近似看成64gb读,32gb写。
ok,经常超频的老烧肯定发现问题了!
***,amd写都90多gb每秒了现在!民科滚一边去!
别急,听我讲。aida64测的是大块数据读写。什么意思呢?
关键就在于amd三缓里面有缓冲队列xi(就是一个指令中转站)。你每次传16b是很少,但是你放多点,堆满64b再打包会怎么样?而aida64恰好测的是你多次爆发写入的速度,就是说支持你打包作弊。你只要每次打包好64b等测试间隔到了再放出去就完事了。
amd负责干这个指令缓存的模块叫xi模块,负责把你的cpu发出的读写指令暂缓,然后进行字节对齐的,而且xi指令暂缓有限制,我列一下(按ccx来排):
3000系列是64条 8核=双ccx
5000系列是192条 8核=单ccx
7000系列我约摸估计可能是256条(网上没找到数据)8核=单ccx
9000系列是320条 8核=单ccx
xi越多,对于读写负载大的程序来说越好,因为你的指令操作不会因为xi满了所以只能停下来等(你就把xi理解成火车站大小就懂了,火车站大,容纳的人多,就不容易挤慢)。
(所以你打电竞不用win10老坛酸菜这种精简系统的你牢牢实实上9000系,别再用7000系坐牢,玩吃鸡和永劫这些优化贼他妈烂,数据天天跑内存找的游戏包你怎么调都有可能卡到妈都不认得。)
如果要求连续写入,32位总线慢过16位同频怎么可能?真实的锐龙if总线,如果你真要货真价实连续读写,那就是fclk2000=64g读/32g写,没得讲。
这边我放一个外国的有趣的数据(需要魔法)网页链接 。
如果没办法看到的话,我来简单说一说怎么一回事。就是因为amd zen5架构优化之后,内存延迟需求线程和内存带宽需求线程之间做了取舍平衡,使得你在ccd1跑内存带宽要求高的程序基本不会影响到ccd0里面对内存延迟高的程序,所以理论上没有任何7000系以及之前的amd cpu在游戏直播(你哪怕不直播,后台杀完也是)方面强过9950x3d。你要做的就是只留一个三缓ccd给游戏,别的软件和系统后台全tm放ccd1给它用高频全部搞定。而且zen5架构ipc和Intel 14代同级别,同频就是能打,5.7的x3d就是猛。
你amd再怎么折腾,都是单ccd fclk 每秒64读 32写。你要帧数上去,延迟下去,就是把fclk拉高。最高2200,提升百分之10%,那就是70.2读 35.2写。内存这个时候搞6600c26,打吃鸡才够爽。之前zen4有个延迟表,fclk在整数时候延迟最低,分别2000和2200。我记得是因为省去了非整数周期的对齐修正延迟。而在我玩下来,也是2000这种最大众,最稳定。zen3不用想就是1800。别的非整数相比于较低的整数,效能肯定好看,因为带宽就是上去了,但是你实际的数据链路因为需要额外修正,延迟就是比整数高。同样,ddr5对于内存信号和imc质量要求高。
你非整数比例高帧肯定可以,但是不一定手感稳定。
2000配6000同步、8000异步
2100配8400异步
2200配8800异步
别花里胡哨整这么多33和67在末尾。能稳定是运气,不是实力。超频本质是人去摸硬件潜力而不是人去激发硬件潜力,他的潜力都被设计好了。
Intel不管是146 147 149还是129 127 126,他的读写都是实时均衡,并没有受到if总线的干扰。根据Intel官方,可达89.6gb每秒的带宽,而且Intel传输线路是对称形式,所以你89.6的读,89.6的写。而且Intel的读写指令缓存队列是分开的,读一个,写一个,完全互不干扰,不会像amd那样有读写混合,读和写会打架。(这一点我在cs2中能感受到,有时候卡操作而帧数不卡,有时候卡帧数而操作不卡)如果你超ring还能上去。而且Intel有小核心辅助你去挂载后台,防止污染游戏线程的三缓。
指令缓存并不是什么坏东西,关键是amd的if线路导致内存瞬发读写的弱势,这点就是卡顿的关键。所以,越吃内存的游戏,Intel就是越屌。
欢迎大神讨论。




















