网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
04月26日
漏签
0
天
deepseek吧
关注:
116,136
贴子:
226,950
看贴
图片
吧主推荐
游戏
10
回复贴,共
1
页
<返回deepseek吧
>0< 加载中...
NSA 注意力机制来了!感谢ds的再次进步!
只看楼主
收藏
回复
寓钓于乐
Modelv1
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
网上这篇论文的解读已经很多了,我下载了论文主要让ds回答了有关个人部署使用方面的问题:
1、NSA 注意力机制能加快多少推理速度?
2、论文中的技术能让上下文长度和输入输出长度变大多少?
3、对个人来说,部署私人满血AI模型的硬件难度是否大大降低?
送TA礼物
IP属地:江苏
来自
Android客户端
1楼
2025-02-19 21:00
回复
寓钓于乐
Modelv1
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
简单来说,就是能使用更少的显存达到原来十倍的速度!原本671b个人低成本的CPU方案输出速度太慢(2~5tokens/s),基本很难用,但现在翻十倍,可用性已经大大提升了。
IP属地:江苏
来自
Android客户端
2楼
2025-02-19 21:02
回复
收起回复
寓钓于乐
Modelv1
8
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
同志们,个人部署满血AI模型的时代已经近在眼前!!!
IP属地:江苏
来自
Android客户端
3楼
2025-02-19 21:07
回复
收起回复
故事の小黄花
Tensor
6
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
成本也不低吧…
IP属地:湖北
来自
Android客户端
4楼
2025-02-19 22:32
回复(2)
收起回复
Chitoo
Logicnet
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
论文题目是啥呀
IP属地:北京
来自
Android客户端
5楼
2025-02-20 03:55
回复(4)
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
江西理工大学留学生群殴中国学生
2914558
2
那个周三,她的课桌永远空了
2440592
3
BLG 2-0横扫NIP
1916865
4
郑钦文红土赛季首战落败
1896466
5
火影漂泊带土值得买吗
1701200
6
印巴局势升级会不会开战
1592040
7
NS2预售爆火供不应求
946264
8
陆川749局称霸金扫帚奖
800856
9
射雕亏麻拖累中影全年收益
679220
10
没想到铁血战士也惨遭DEI毒手
497838
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示