amd吧 关注:803,630贴子:18,573,355

回复:7900XT部署deepseek-r1 32B模型

只看楼主收藏回复

就看以后Ktransformers了,等出Windows平台和易于安装后试试。这个比ollama更优化显存和内存问题。


IP属地:广东16楼2025-02-15 21:36
回复
    同款,97%跑GPU,3%跑CPU,GPU占用98%,显存占满,共享显存用了2G多,CPU负载20%左右,内存占30G多一点,爆显存降低得性能可以忽略,日常用完全OJ8K
    手欠试了下70b,CPU跑满了,显卡占用14%,一个字一个字蹦,关键准确率反而不如32b,卸载


    IP属地:北京17楼2025-02-24 22:35
    收起回复
      2026-01-18 06:51:05
      广告
      不感兴趣
      开通SVIP免广告
      我的配置是7900XTX+64G内存,这样看32B应该会好些了


      IP属地:重庆18楼2025-03-07 11:23
      回复