起因是搞鼓内存超频后,发现S0睡眠会直接睡死。然后慢慢摸索发现将mclk:uclk恢复默认的1:2和将fclk eff恢复为auto救能解决,但是这样做就牺牲内存性能了,想要获得增益只能继续冲更高的频率。
但是这时候又遇到新的问题了,当我冲击5600以上的频率时,S0睡眠唤醒会直接报警,然后强制断电。我一开始是认为是参数不稳定,于是尝试加电压,放宽内存时序,都没有效果,询问了使用相同颗粒超频的吧友才知道似乎大家都是这样的,只是因为不咋用得上睡眠,所以选择性忽视这个问题了。
但是我是那种追求完美的类型,睡眠我可以不用,但是你必须得能用。(实际上因为我自身工作的原因,电脑确实很少关机,都是用睡眠确保电脑能处于低功耗状态,关机后再重新打开工作软件很费时间。)
然后我就猜想会不会是AMD对S0睡眠本身支持不完善导致上面的问题,因为在AMD发布新的芯片组之前这机器还有S0睡死的问题。
然后我就想到能否尝试去改S3传统睡眠模式来解决这个问题,正巧当时翻贴吧也确实有吧友搞出了解锁bios,里面能够改睡眠模式,于是说干就干,跟着教程修改了S3睡眠。然后紧接着做了一系列测试,包括测试在5600以上的高频内存下睡眠会不会报警以及将mclk:uclk改成1:1等等操作。结果S3睡眠顺利的解决了这一系列问题,甚至频率再加到6000都没事,但是因为6000发热相对严重了,咱没有风压,就降一档到5800稳定日用了,性能表现也比默认5200频率下的好不少,三角洲帧数高了10来帧。但是没高兴几天,新的问题又来了。
就是当系统第二次自动进入睡眠的时候,系统必定会软重启,问题很诡异,你手动让系统睡眠,不管睡几次都没问题。但是让其自动进入睡眠,第二次就必定会出问题。
没办法,只能硬着头皮去检查事件管理器中的日志记录,发现确实有相关的蓝屏日志,然后用windbg分析,不分析不知道,一分析吓一跳,错误直接指向nvlddmkm.sys,这完全就是独显的问题导致的呀,当时没仔细分析,直接看到错误指向就断定问题(现在想来确实草率)。然后结合最近狂飙模式下玩游戏确实有概率花屏,于是趁着没过保,直接报修要求换板。
等了大概一个星期左右,机器返修回来了,然后抽了两天的时间测试游戏会不会花屏以及S3睡眠问题。玩游戏确实不花屏了,这张显卡体质比我之前的那个也要好一点,小飞机超240核心1200显存稳定过测(算是4070m小雕吧,当然,没有吧友的300核心的卡雕就是了)。当我以为S3睡眠的问题也会被解决的时候,又软重启了......一看日志发现错误还是指向nvlddmkm.sys。
然后我想到会不会还是内存的问题?因为最开始改S3是因为内存超频后S0会睡死,说不定这个机器想要超频内存,就必须要舍弃睡眠呢?返修的期间也发现这两年的机器改S3睡眠似乎或多或少都会有些毛病,因为上游强推S0,S3没有做足够适配导致的。
所以我就想着要不把内存恢复默认,大不了我不要那10几帧的提升了,就图个S3睡眠的省电也好。结果还是一样,依旧会软重启。这就让我犯了难,看其他吧友改了S3能正常用。那我只能先怀疑我这个海力士的内存有问题了,我抽空拆机换回了原装的三星内存,进行了测试,情况是好了一点,但不多。在第四次系统进入睡眠状态时会稳定软重启。
既然问题的根源没有解决,那就只可能是还有其他的原因,我联想到S3睡眠是会将系统的状态写入内存,然后关闭除了内存以外的其他硬件。顺着这条思路,我又翻看了蓝屏日志,发现其中有个参数为:UNEXPECTED_DEFERRED_DESTRUCTION 表示在预期之外的时间点尝试销毁对象,既然是在预期之外的时间节点,那根据我写程序的经验来判断,很有可能是执行了某些内存操作,导致异常销毁,使得诸如显卡驱动一类的内存不完整,最终导致了软重启。
但是我把内存参数恢复到了默认,还是会软重启,虽然频次变低了,但是问题的根本并没有被解决。
之后在B站偶然刷到耀世的拆机视频,发现鸡哥自己模具的内存是分开放置的,而非蛟龙16Pro这样堆叠放置的,于是我有了一个猜想,会不会是内存堆叠引起内存高温,或者其他因素导致了不稳定。
然后我再次拆机,把两根内存取下来一根,然后进系统测试,结果发现没有任何问题了。(从晚上10点测试到了凌晨两点,因为触发的条件必须是系统自己进入睡眠,然后两根内存,两个插槽都要测,所以花了不少时间。)
所幸找到引起问题的原因了,就是因为叠叠乐导致的,我两根内存插任意一个插槽都没有问题。这就直接排除了内存插槽和内存本身带来的不稳定了。
接下来就是找具体原因了,是因为高温还是电磁干扰啥的导致的,于是简单装了下机器,打了几把游戏,发现内存温度也不算高,一个45度,一个48度,应该不至于导致不稳定。然后刷淘宝看到极客温控在卖笔记本专用的电磁吸波材料,同时想到有些厂商也会在内存上加屏蔽贴纸一类的东西,于是试着下单了两片,也不贵,就是9块钱,大不了少喝一杯蜜雪冰城。
今天到货了,然后我把两根内存插回去,贴上吸波材料,连续测试了几次,问题就没有出现了。心中的石头猛然落下去了,从研究超频到解决各项问题,陆陆续续花了差不多小两个月。后面在实际使用中继续观察,看看还会不会出问题。
写这个贴子主要目的是分享一个经验吧,帮助吧友避坑说是。
但是这时候又遇到新的问题了,当我冲击5600以上的频率时,S0睡眠唤醒会直接报警,然后强制断电。我一开始是认为是参数不稳定,于是尝试加电压,放宽内存时序,都没有效果,询问了使用相同颗粒超频的吧友才知道似乎大家都是这样的,只是因为不咋用得上睡眠,所以选择性忽视这个问题了。
但是我是那种追求完美的类型,睡眠我可以不用,但是你必须得能用。(实际上因为我自身工作的原因,电脑确实很少关机,都是用睡眠确保电脑能处于低功耗状态,关机后再重新打开工作软件很费时间。)
然后我就猜想会不会是AMD对S0睡眠本身支持不完善导致上面的问题,因为在AMD发布新的芯片组之前这机器还有S0睡死的问题。
然后我就想到能否尝试去改S3传统睡眠模式来解决这个问题,正巧当时翻贴吧也确实有吧友搞出了解锁bios,里面能够改睡眠模式,于是说干就干,跟着教程修改了S3睡眠。然后紧接着做了一系列测试,包括测试在5600以上的高频内存下睡眠会不会报警以及将mclk:uclk改成1:1等等操作。结果S3睡眠顺利的解决了这一系列问题,甚至频率再加到6000都没事,但是因为6000发热相对严重了,咱没有风压,就降一档到5800稳定日用了,性能表现也比默认5200频率下的好不少,三角洲帧数高了10来帧。但是没高兴几天,新的问题又来了。
就是当系统第二次自动进入睡眠的时候,系统必定会软重启,问题很诡异,你手动让系统睡眠,不管睡几次都没问题。但是让其自动进入睡眠,第二次就必定会出问题。
没办法,只能硬着头皮去检查事件管理器中的日志记录,发现确实有相关的蓝屏日志,然后用windbg分析,不分析不知道,一分析吓一跳,错误直接指向nvlddmkm.sys,这完全就是独显的问题导致的呀,当时没仔细分析,直接看到错误指向就断定问题(现在想来确实草率)。然后结合最近狂飙模式下玩游戏确实有概率花屏,于是趁着没过保,直接报修要求换板。
等了大概一个星期左右,机器返修回来了,然后抽了两天的时间测试游戏会不会花屏以及S3睡眠问题。玩游戏确实不花屏了,这张显卡体质比我之前的那个也要好一点,小飞机超240核心1200显存稳定过测(算是4070m小雕吧,当然,没有吧友的300核心的卡雕就是了)。当我以为S3睡眠的问题也会被解决的时候,又软重启了......一看日志发现错误还是指向nvlddmkm.sys。
然后我想到会不会还是内存的问题?因为最开始改S3是因为内存超频后S0会睡死,说不定这个机器想要超频内存,就必须要舍弃睡眠呢?返修的期间也发现这两年的机器改S3睡眠似乎或多或少都会有些毛病,因为上游强推S0,S3没有做足够适配导致的。
所以我就想着要不把内存恢复默认,大不了我不要那10几帧的提升了,就图个S3睡眠的省电也好。结果还是一样,依旧会软重启。这就让我犯了难,看其他吧友改了S3能正常用。那我只能先怀疑我这个海力士的内存有问题了,我抽空拆机换回了原装的三星内存,进行了测试,情况是好了一点,但不多。在第四次系统进入睡眠状态时会稳定软重启。
既然问题的根源没有解决,那就只可能是还有其他的原因,我联想到S3睡眠是会将系统的状态写入内存,然后关闭除了内存以外的其他硬件。顺着这条思路,我又翻看了蓝屏日志,发现其中有个参数为:UNEXPECTED_DEFERRED_DESTRUCTION 表示在预期之外的时间点尝试销毁对象,既然是在预期之外的时间节点,那根据我写程序的经验来判断,很有可能是执行了某些内存操作,导致异常销毁,使得诸如显卡驱动一类的内存不完整,最终导致了软重启。
但是我把内存参数恢复到了默认,还是会软重启,虽然频次变低了,但是问题的根本并没有被解决。
之后在B站偶然刷到耀世的拆机视频,发现鸡哥自己模具的内存是分开放置的,而非蛟龙16Pro这样堆叠放置的,于是我有了一个猜想,会不会是内存堆叠引起内存高温,或者其他因素导致了不稳定。
然后我再次拆机,把两根内存取下来一根,然后进系统测试,结果发现没有任何问题了。(从晚上10点测试到了凌晨两点,因为触发的条件必须是系统自己进入睡眠,然后两根内存,两个插槽都要测,所以花了不少时间。)
所幸找到引起问题的原因了,就是因为叠叠乐导致的,我两根内存插任意一个插槽都没有问题。这就直接排除了内存插槽和内存本身带来的不稳定了。
接下来就是找具体原因了,是因为高温还是电磁干扰啥的导致的,于是简单装了下机器,打了几把游戏,发现内存温度也不算高,一个45度,一个48度,应该不至于导致不稳定。然后刷淘宝看到极客温控在卖笔记本专用的电磁吸波材料,同时想到有些厂商也会在内存上加屏蔽贴纸一类的东西,于是试着下单了两片,也不贵,就是9块钱,大不了少喝一杯蜜雪冰城。
今天到货了,然后我把两根内存插回去,贴上吸波材料,连续测试了几次,问题就没有出现了。心中的石头猛然落下去了,从研究超频到解决各项问题,陆陆续续花了差不多小两个月。后面在实际使用中继续观察,看看还会不会出问题。
写这个贴子主要目的是分享一个经验吧,帮助吧友避坑说是。