图拉丁吧 关注:7,897,967贴子:131,637,794
  • 8回复贴,共1

4张mi50跑deepseek 70b模型

取消只看楼主收藏回复



IP属地:河北来自Android客户端1楼2025-02-16 19:22回复
    mi50的桥接器,理论上存在,实际上没见过,而且mi50的桥接器跟mi100以后的是不一样的,下图是mi100的四路桥接器,卡是mi50,很明显用不了



    IP属地:河北来自Android客户端2楼2025-02-16 19:25
    收起回复
      2025-08-06 03:44:30
      广告
      不感兴趣
      开通SVIP免广告
      没有桥,虽然GPUz里面显示“交火”可用,但是驱动里没有“交火”选项,共享显存啥的也就无从谈起,不够这次咱们用lm studio跑,因为支持多卡,没桥也没事儿


      IP属地:河北来自Android客户端3楼2025-02-16 19:30
      收起回复
        直接发结果吧,70b q4模型,显存合计占用44gb


        IP属地:河北来自Android客户端4楼2025-02-16 19:33
        收起回复
          算个数学题,不知道是不是上下文超了导致速度变慢了


          IP属地:河北来自Android客户端6楼2025-02-16 19:49
          回复
            设置如图


            IP属地:河北来自Android客户端7楼2025-02-16 19:50
            回复
              对了,现在是用vulkan跑的,这卡在win下不能原生支持rocm,不过有强行支持的方法,就是操作比较复杂。理论上用rocm跑的话,效率会更高


              IP属地:河北来自Android客户端8楼2025-02-16 20:51
              回复
                有人说32b q8比70b q4更聪明,试了试还真是,比6楼70b q4跑的还快,显存总共占用37.5gb




                IP属地:河北来自Android客户端9楼2025-02-16 22:32
                收起回复
                  2025-08-06 03:38:30
                  广告
                  不感兴趣
                  开通SVIP免广告
                  现在的主要问题是,显卡负载是平均分配的,不能跑满,不知道怎么解决


                  IP属地:河北来自Android客户端34楼2025-02-17 23:12
                  收起回复