网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
11月10日
漏签
0
天
amd吧
关注:
801,989
贴子:
18,511,484
看贴
图片
吧主推荐
视频
游戏
6
回复贴,共
1
页
<返回amd吧
>0< 加载中...
为什么很多人觉得16g大显存适合跑ai的
只看楼主
收藏
回复
落日の菜刀侠
亢龙有悔
11
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
14b模型显存占用9g,12g显存卡都能跑
32b模型显存占用21g,24g显存卡才能跑
16g显存卡在了非常非常尴尬且难受的位置,2080ti22g反而成了最优选。
送TA礼物
IP属地:山东
来自
Android客户端
1楼
2025-11-09 10:35
回复
馆长
神游太虚
15
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
两张不就完了…为啥要买fp8都不支持的玩意
IP属地:北京
来自
iPhone客户端
2楼
2025-11-09 11:11
回复
收起回复
2025-11-10 23:48:11
广告
不感兴趣
开通SVIP免广告
cryste7
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
你要看是什么ai啊,ai画画之类的16g就很不错
IP属地:广东
来自
Android客户端
3楼
2025-11-09 11:12
回复
收起回复
lly0571
亢龙有悔
11
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
纯考虑本地运行的话,现在所有24b以下的LLM(包括r1蒸馏的所有模型,Qwen3-14b,Gemma3-12b,gpt-oss-20b)都不如Qwen3-30b-a3b。显存大能减少moe的CPUoffload,从而加速。
如果需要批量推理的话,40系之后支持FP8 w8a8,需要批量推理7b的时候,4060Ti跑FP8和3090跑FP16的Prefill性能是接近的。
跑Flux的话,16GB跑FP8模型也会比12GB轻松很多。
2080Ti 22g就别买了,BF16和FA2都不支持。哪怕你吹吹3080 20g呢……
IP属地:广东
来自
Android客户端
5楼
2025-11-09 11:31
回复
收起回复
o_headache
六龙御天
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
32b把足够多的部分跑在显存里,速度就已经可以了,你非要全部在显存里,那就没完没了。14b当然是用起来差距明显啊
IP属地:广东
6楼
2025-11-09 11:52
回复
收起回复
望人在天北
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
不是把模型加载到显存就够了,还要考虑kvcache的占用,另外如果是独显输出,系统本身也要占用显存
IP属地:湖南
来自
Android客户端
7楼
2025-11-09 12:36
回复
收起回复
FrapsH
九霄腾龙
13
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
从来没觉得16G显存是用来跑AI的,只是之前有一条JS显存焦虑苟天天在吧里渲染它的XTX跑AI有多么多么强,把16G显存贬得跟没法打游戏一样,对于那种苟JS就必须往死里揭它老底~🤡🤡🤡
IP属地:湖南
8楼
2025-11-09 14:40
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
胸部设计擦边,小鹏机器人被批媚男
2701110
2
尽人事警告,武大杨姐梅开二度
2564731
3
女装退货创新高,巨型吊牌防白嫖
2192036
4
宿舍“屎魔”连环作案,全楼破防疯找
1900071
5
硬刚真Air标准!联想官方遭怒喷
1717664
6
加班赚钱给老婆花,专家又出神建议
1550850
7
决战天籁之巅!吧友在线评选好声音
1296864
8
官方带头耍赖?皖二胎补贴被追回
912962
9
T1刚夺冠游戏就凉,LOL2强势踢馆
724856
10
拳头开恩,教练喜提三次开麦权
557865
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示