amd吧 关注:803,179贴子:18,562,025
  • 43回复贴,共1

别瞎几把说AMD卡

只看楼主收藏回复

以当年whea18为例子,这whea是啥意思呢?WHEA(Windows Hardware Error Architecture)Event ID 18 并不是某个“单一 bug”,而是一类致命硬件错误(Machine Check Exception,MCE)的通用报告。它的目的是说明CPU 内部的错误检测机制发现了无法自行恢复的异常,并把信息交给操作系统记录下来。
那么在 AMD 平台上,常见触发点主要有三类:
1. 内存子系统和IMC(集成内存控制器)不稳定 XMP或EXPO 频率过高、时序过紧、或内存 rank/插槽拓扑导致 IMC 负担过重。 SoC电压、VDDIO等电压设置不当(过高或过低都会触发)实际上这是社区里最常见的原因。
2. 电源/供电瞬态异常
主板 VRM 设计或 PSU 瞬态响应不足,导致核心电压、SoC电压在负载切换时掉压或过冲。LoadLine 校准(LLC)设置得不好,会加剧瞬态不稳。关键周期拿不到合格电压就容易报错。
3. 单核或核心缓存/互联 Fabric 的硬件故障如果在完全 stock、稳定供电、稳定内存的条下,仍然是同一个 APIC ID/同一个核心持续报错,那就可能是 CPU 本身物理缺陷(这种情况才真的要 RMA)。
这可不是“AMD自带缺陷”,因为AMD 芯片内部if总线系统本来就有ECC和Parity检测逻辑,WHEA 18 是它在“救不了”的时候把信息扔给系统。大量玩家遇到的情况,其实是电压参数配置错误、内存超频过激、供电品质不佳,并非 CPU 天然不稳定。真正的芯片硬损坏(要 RMA)只占极少数。
以我自己的例子来说,我自己就重新试出来我的这两块amd的soc电压。比如说我7800x3d fclk2000 6000c26就给1.18v,
soc电压(实际1.19v),vddio 1.25v(换了主板平台,到时候还要继续调)
9950x fclk2133 6400c28,
soc电压1.28v(实际1.29v)、vddio 1.28v,过了run memtest 300%
实际上amd的一般进系统低负载娱乐卡顿最关键的点就在if总线、dram相容性以及wintel联盟的联合负优化三个部分。if总线的性能会受到soc电压和vddio的影响,soc电压影响对于iod的供电,vddio影响在内存控制器和if总线系统中间的桥接组件的供电。奇怪了,这if总线不就是一条线吗有啥讲究?错了!if总线不仅仅包含那条线那么简单,实际是包含那条线还有其与iod和ccd链接处的信号处理交互组件,这一套叫做GMI,意思是(Global Memory Interconnect),就是全局存储内部互联组织,就是if fabric(单纯的if总线里面的线)与if fabric与ccd互联部分的硅电路和if fabric与iod互联部分的硅电路。你电压给不对相当于那俩部分电路工作异常,所以就会卡顿,严重的甚至会报错。
amd游戏重载卡顿正常,但是日常用卡顿还是找找自己原因先。amd增加了xi缓冲队列能够让if总线纠完错再传输,但是if要是总在纠错,那爆队列可正常了。
有个厂的主板呢就有点**。他的那个内存电压和vddio电压是联动起来的,这会严重影响超频之后的稳定性。
最后,祝Intel好死。


IP属地:广东来自Android客户端1楼2025-09-16 09:25回复
    学习了~


    IP属地:湖南2楼2025-09-16 09:33
    收起回复
      2026-01-01 03:16:25
      广告
      不感兴趣
      开通SVIP免广告
      好科普


      IP属地:广东来自Android客户端3楼2025-09-16 17:36
      回复
        WHEA-18这东西zen2就有零星出现,就是系统复杂度提高导致的故障率上升,具体原因不明,
        但是发生率低也就没当一回事
        到了zen3,可以说是在工艺完全没有大的步进的前提下,大改了缓存结构顺便给cpu提了频,然后就出现了著名的L3掉速和超大面积的WHEA-18/WHEA19
        WHEA-19问题可以通过降低FCLK频率修正,因为基于zen2的IO设计,GMI的电气性能无法承受这个频率导致CPU内部纠错
        而WHEA-18,一旦发生标志着这颗U彻底报废,amd无条件提供RMA,但是自始至终没有公布过故障原因,但是你要把L3 cache掉速联想到一起的话,这东西的问题远比你想得要多得多


        IP属地:贵州来自Android客户端5楼2025-09-19 23:17
        收起回复
          再一个所谓的游戏是不存在重载的,哪怕是吃鸡,真正需要的带宽也是极低的,这东西又不是科学计算
          你还自称软工人,就不想想AU trade off了什么东西,分离式IO,用延迟换扩展性,GMI选择铜导线而不是2.5D封装,用总线性能换取高良率和低价格,选择用大缓存,是用访存系统整体延迟去换更高的缓存命中率
          难免有个别沙币游戏比如吃鸡,缓存命中率肉眼可见的低,缓存一致性开销出奇的大,哦那完蛋了
          哪怕是在主机那块小缓存版zen2上,搭配超高延迟的GDDR6,正经优化的大厂依然能做出120fps的射击游戏


          IP属地:贵州来自Android客户端6楼2025-09-19 23:28
          收起回复
            至于所谓的FCLK超频,bios都告诉你了vddg了,对,就是VDDG(MI),只是这东西在大部分主板上和VDDSOC和FCLK频率有一定的相关性,但是你要超FCLK为什么不手动去调VDDG而是去尝试VDDSOC间接来调?FCLK要上2200至少是0.95v/1.00v,而默认可能只给0.85或者0.9v,不出问题才怪


            IP属地:贵州来自Android客户端7楼2025-09-19 23:33
            收起回复
              其他都不变,c28-36-36-72改c28-38-38-86延迟和读写都变更好了,给太低了就是不行


              IP属地:山东来自Android客户端8楼2025-09-20 12:08
              收起回复
                事实就是这几年amd平台经常导致系统崩溃的原因还是内存,这个东西挺玄学的,还要看主板和内存主控兼容性,每次换平台我首先要做的事情就是调试内存时序


                IP属地:安徽9楼2025-09-21 11:48
                收起回复
                  2026-01-01 03:10:25
                  广告
                  不感兴趣
                  开通SVIP免广告
                  请问
                  soc电压是不是越低越有利于 cpu核心发挥
                  vddio是不是偏高有利于cpu核心发挥和内存稳定
                  简单来说x3d 不在乎内存时序的只求核心负压冲击高频的情况下 这2个电压越低还是越高好


                  IP属地:浙江来自Android客户端10楼2025-12-17 20:56
                  收起回复