网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
03月21日
漏签
0
天
deepseek吧
关注:
139,830
贴子:
407,631
看贴
图片
吧主推荐
游戏
1
2
下一页
尾页
39
回复贴,共
2
页
,跳到
页
确定
<返回deepseek吧
>0< 加载中...
大佬们技术求助
只看楼主
收藏
回复
有凤来仪
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
大佬们,我可以买一套大内存,然后用主板分配内存给显存,然后部署32b的模型吗
送TA礼物
IP属地:黑龙江
来自
Android客户端
1楼
2025-09-28 00:25
回复
有凤来仪
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
5060的显卡
IP属地:黑龙江
来自
Android客户端
2楼
2025-09-28 00:43
回复
收起回复
2026-03-21 20:35:47
广告
不感兴趣
开通SVIP免广告
什么时候产
中尉
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
🤔当老黄是傻的?
IP属地:广西
来自
Android客户端
3楼
2025-09-28 02:33
回复(4)
收起回复
雨裁贯虹
大尉
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
如果真不考虑速度的话,那可以试试魔改2080ti,22GB,一张卡两千多块钱,性能比5060强一些,还可以双卡交火。就是不建议小白用,一般都是垃圾佬整的
IP属地:江苏
来自
手机贴吧
4楼
2025-09-28 12:44
回复(4)
收起回复
雨裁贯虹
大尉
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Nvidia这边还有个方案,用4060ti-16GB这张卡,PDD用券2200左右应该可以拿下,虽然理论性能比5060弱一点,但是有16GB大显存,再加上Q4量化,4-bit权重,KV cache FP8推理应该可以用,但是上下文不能太长。8GB实在是用不了,几乎只能纯走CPU+少量GPU offload……
IP属地:江苏
来自
手机贴吧
5楼
2025-09-28 13:57
回复(1)
收起回复
有凤来仪
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
IP属地:黑龙江
来自
Android客户端
6楼
2025-09-28 14:04
回复(1)
收起回复
仅仅是质疑
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
32b模型就是一坨!
IP属地:河南
来自
Android客户端
7楼
2025-09-28 18:15
回复
收起回复
忧郁老猫
中尉
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
用lm,显存和内存一起干活。但是32b得16g显存加32g内存勉强能行吧。其实应该是64g才能运行的差不多。
IP属地:吉林
来自
Android客户端
8楼
2025-09-28 23:02
回复
收起回复
2026-03-21 20:29:47
广告
不感兴趣
开通SVIP免广告
进击的御坂酱
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
用ktransformers部署,你去b站搜一下
IP属地:湖北
来自
iPhone客户端
9楼
2025-09-29 10:23
回复(1)
收起回复
修改昵称
上尉
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
可以,我的是4070-8g,用了32的内存,自动分一半给共享显存,也就是8+16g,能部署q4m量化的qwen30b-a3b模型,会慢一点,吃内存带宽
IP属地:四川
来自
Android客户端
10楼
2025-09-29 12:05
回复
收起回复
圣光灬棍骑士
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
本地部署没啥智商的,建议用api算了。不是速度慢不慢的问题,是无法满足你的需要。
IP属地:江苏
来自
Android客户端
11楼
2025-09-29 13:04
回复
收起回复
铁翼拾星
新兵
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
建议api,本地基本是弱智
IP属地:江西
来自
Android客户端
12楼
2025-09-29 17:41
回复
收起回复
云行云-四十二
中尉
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
可以的,但是32b这个大小本身很蠢,有人搞过600B塞内存,用cpu算一秒3-4个token,倒也还行
IP属地:福建
来自
Android客户端
13楼
2025-09-29 18:42
回复(2)
收起回复
牢皇Official
上尉
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
可以但没必要
IP属地:北京
来自
Android客户端
15楼
2025-09-29 23:46
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
大快人心!人贩子梅姨落网
2054400
2
搞错物理常识,雷总承认失误
1676896
3
日厂拖尾款,外贸人反向收割
1251292
4
贵族转校生驾到,吹牛不脸红
1132596
5
开服存变数,尘白封群控声
841126
6
肥料卡脖子,日本农业遭重
758275
7
法军联网跑步,航母坐标被看光
559224
8
扎心!吧友表白被丑拒
469154
9
鸣潮流水暴跌,西小妹拉完了
351736
10
印度实力露馅,科技全线拉胯
325017
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示