网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
12月30日
漏签
0
天
deepseek吧
关注:
135,581
贴子:
371,067
看贴
图片
吧主推荐
游戏
1
2
下一页
尾页
39
回复贴,共
2
页
,跳到
页
确定
<返回deepseek吧
>0< 加载中...
大佬们技术求助
只看楼主
收藏
回复
有凤来仪
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
大佬们,我可以买一套大内存,然后用主板分配内存给显存,然后部署32b的模型吗
送TA礼物
IP属地:黑龙江
来自
Android客户端
1楼
2025-09-28 00:25
回复
有凤来仪
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
5060的显卡
IP属地:黑龙江
来自
Android客户端
2楼
2025-09-28 00:43
回复
收起回复
2025-12-30 17:01:08
广告
不感兴趣
开通SVIP免广告
什么时候产
Algobot
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
🤔当老黄是傻的?
IP属地:广西
来自
Android客户端
3楼
2025-09-28 02:33
回复(4)
收起回复
雨裁贯虹
Deepeye
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
如果真不考虑速度的话,那可以试试魔改2080ti,22GB,一张卡两千多块钱,性能比5060强一些,还可以双卡交火。就是不建议小白用,一般都是垃圾佬整的
IP属地:江苏
来自
手机贴吧
4楼
2025-09-28 12:44
回复(4)
收起回复
雨裁贯虹
Deepeye
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Nvidia这边还有个方案,用4060ti-16GB这张卡,PDD用券2200左右应该可以拿下,虽然理论性能比5060弱一点,但是有16GB大显存,再加上Q4量化,4-bit权重,KV cache FP8推理应该可以用,但是上下文不能太长。8GB实在是用不了,几乎只能纯走CPU+少量GPU offload……
IP属地:江苏
来自
手机贴吧
5楼
2025-09-28 13:57
回复(1)
收起回复
有凤来仪
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
IP属地:黑龙江
来自
Android客户端
6楼
2025-09-28 14:04
回复(1)
收起回复
仅仅是质疑
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
32b模型就是一坨!
IP属地:河南
来自
Android客户端
7楼
2025-09-28 18:15
回复
收起回复
忧郁老猫
Algobot
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
用lm,显存和内存一起干活。但是32b得16g显存加32g内存勉强能行吧。其实应该是64g才能运行的差不多。
IP属地:吉林
来自
Android客户端
8楼
2025-09-28 23:02
回复
收起回复
2025-12-30 16:55:08
广告
不感兴趣
开通SVIP免广告
进击的御坂酱
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
用ktransformers部署,你去b站搜一下
IP属地:湖北
来自
iPhone客户端
9楼
2025-09-29 10:23
回复(1)
收起回复
修改昵称
Algobot
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
可以,我的是4070-8g,用了32的内存,自动分一半给共享显存,也就是8+16g,能部署q4m量化的qwen30b-a3b模型,会慢一点,吃内存带宽
IP属地:四川
来自
Android客户端
10楼
2025-09-29 12:05
回复
收起回复
圣光灬棍骑士
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
本地部署没啥智商的,建议用api算了。不是速度慢不慢的问题,是无法满足你的需要。
IP属地:江苏
来自
Android客户端
11楼
2025-09-29 13:04
回复
收起回复
铁翼拾星
Dataseed
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
建议api,本地基本是弱智
IP属地:江西
来自
Android客户端
12楼
2025-09-29 17:41
回复
收起回复
云行云-四十二
Algobot
7
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
可以的,但是32b这个大小本身很蠢,有人搞过600B塞内存,用cpu算一秒3-4个token,倒也还行
IP属地:福建
来自
Android客户端
13楼
2025-09-29 18:42
回复(2)
收起回复
牢皇Official
Modelv1
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
可以但没必要
IP属地:北京
来自
Android客户端
15楼
2025-09-29 23:46
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
来去自如,解放军无人机俯瞰台北
2207970
2
殖人打假牢A翻车,假料成笑柄
2004799
3
验DNA遭拒,男子怒踹妻子终获刑
1685516
4
阿三外网疯狂造谣,咖喱味飘满网
1664226
5
穷小伙攒钱买车,UP主怒斥小资病
1426204
6
美国底层看病难,止痛药当饭吃
1419725
7
有钱不敢花,国人陷消费焦虑
1066824
8
交往coser被绿,终究比不过钞能力
818616
9
解放军围台演习,日本罕见沉默
647570
10
国女媚外上瘾,海外捞男狂吸血
631239
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示