网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
01月11日
漏签
0
天
amd吧
关注:
803,441
贴子:
18,569,682
看贴
图片
吧主推荐
视频
游戏
首页
上一页
1
2
3
下一页
尾页
122
回复贴,共
3
页
,跳到
页
确定
<返回amd吧
>0< 加载中...
回复:Dee确认使用的是ptx语言 哈哈哈
只看楼主
收藏
回复
嗯啊哈哈哈
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
可恶啊,AMD线程撕裂者又要涨价了
IP属地:广东
来自
Android客户端
16楼
2025-01-31 23:23
回复
收起回复
r6144
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
我记得ptx比正常写cuda可移植性更差啊,这是更精准控制硬件所必须付出的代价。
IP属地:上海
来自
Android客户端
17楼
2025-02-01 01:42
回复(4)
收起回复
2026-01-11 09:05:19
广告
不感兴趣
开通SVIP免广告
回答哈u分
蛟龙得水
3
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
然而ptx也是nv的
IP属地:山东
来自
Android客户端
18楼
2025-02-01 01:50
回复(3)
收起回复
回答哈u分
蛟龙得水
3
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
IP属地:山东
来自
Android客户端
19楼
2025-02-01 01:53
回复
收起回复
跟美团拼好饭
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
deepseek都已经公开自己的论文了,为什么不去看?另外cuda本身就支持用户内联ptx(ptx就是英伟达显卡的汇编),我建议啥也不懂或者别有用心的媒体炒作成deepseek团队直接使用二进制01代码在穿孔纸带机上完成了训练,然后又巨牛逼地做了各个平台的适配,再收割一波美股
IP属地:广西
来自
Android客户端
20楼
2025-02-01 01:53
回复(7)
收起回复
打火机登
六龙御天
12
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
你是什么人类
IP属地:江苏
来自
iPhone客户端
21楼
2025-02-01 04:39
回复
收起回复
蒯陶
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
讲道理,这个ds对英伟达能有什么影响?nv的显卡不能用ds了吗?顶多就是让一些本来不能跑AI的人可以跑AI,我猜现在A卡已经开始涨价了
ds真威胁的是老美,好不容易搞的新锚点刚起步就没了。
IP属地:江苏
来自
iPhone客户端
22楼
2025-02-01 08:22
回复(1)
收起回复
realdwx
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
相当于拿汇编写的计算卡接口。这还不是最恐怖的,那个Deepseek可以自己写汇编自己升级
IP属地:上海
来自
Android客户端
24楼
2025-02-01 09:14
回复
收起回复
2026-01-11 08:59:19
广告
不感兴趣
开通SVIP免广告
一东北望一一
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
最大的意义在于打破了垄断,amd的卡也能用了,更重要的是,中国的卡也能用了,华为的卡好像已经适配好了。
IP属地:江苏
来自
Android客户端
25楼
2025-02-01 10:48
回复
收起回复
llwww12345
蛟龙得水
3
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
ptx也是cuda提供的,这怎么绕过nvidia?而且是中间语言,介于cuda C与cuda sass之间,怎么可能语法接近人类?那个sass才是类似汇编的,ptx更像是java中的字节码,怎么绕开奇怪了都
IP属地:上海
来自
iPhone客户端
26楼
2025-02-01 11:57
回复
收起回复
梦烟子
龙跃乘云
9
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
建议楼主不要看到个新名词不加考证就到处乱发,这样会显得你很无知诶
ptx是英伟达的GPU汇编语言,比cuda更底层,直接绑定GPU硬件架构的,兼容性比cuda更差,通常用于针对某个型号架构的GPU做极限优化时会使用内联ptx汇编编写。所以不可能说使用ptx绕过cuda生态。
IP属地:北京
来自
Android客户端
27楼
2025-02-01 12:19
回复(9)
收起回复
跟美团拼好饭
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
我不是什么懂哥,也算不上什么专业人员,但是我之前去百度搜了这个新闻,有的媒体会附一张v3论文的截图,我就去看了这篇论文,这篇论文的第三章标题是infrastructure,3.2小节的标题是training framework,根据我的理解3.2.1介绍了他们训练时使用的dualpipe流水线并行算法,附上了一张类似流水线时空图的东西,大概就是用高效的流水线并行算法让计算设备尽量地忙,而且dualpipe也不是deepseek首创,重点来了3.2.2小节说他们用一种高效的方法实现了跨节点多对多通信,就是在使用服务器集群训练的时候需要对集群中各个计算节点进行协调以适配dualpipe算法,3.2.2小节的最后一段,ptx这个词第一次也是唯一一次出现的地方(用浏览器打开pdf然后快捷键ctrl+f进行全文检索),也是我截图里面这一部分的最后几句,大致的意思就是他们使用了ptx指令以及自动调整communication chunk的大小,显著减少了l2缓存的使用以及流式多处理器之间的干扰,再去英伟达官网看cuda的文档页面,里面就有ptx的api文档那你们把用ptx指令优化训练服务器集群通信方式来适配dualpipe算法炒作成deepseek完全绕开cuda,这不就是典型的新闻学案例吗?
IP属地:广西
来自
Android客户端
28楼
2025-02-01 13:41
回复(1)
收起回复
mrpop1989
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
CUDA不给用,那肯定要绕开…
IP属地:山东
来自
iPhone客户端
29楼
2025-02-01 14:15
回复(1)
收起回复
跟美团拼好饭
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
更正一下:dualpipe确实是deepseek首创的,把之前看一些技术解读记混了,因为有人说这个dualpipe是借鉴+创新
IP属地:广西
来自
Android客户端
30楼
2025-02-01 14:15
回复(1)
收起回复
2026-01-11 08:53:19
广告
不感兴趣
开通SVIP免广告
宇忆商04
龙之诞
1
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
赛博马奇诺了
IP属地:北京
来自
Android客户端
31楼
2025-02-01 14:47
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
女粉不爆金币,辱男UP主光速变脸
1854510
2
主播出轨榜一,男友怒撕渣女
1699806
3
婚前惊现天价债,男生跑路拒接盘
1444744
4
爆冷!王曼昱不敌德国42岁老将
1292301
5
三孩奖3万,广东农村重金催生
1204892
6
催婚冥场面:逼迫吧友迎娶二婚女
875925
7
站长立霸王条款,公然挑衅劳动法
652200
8
最高法解读彩礼:结婚买房车也算
600369
9
开年首炸!性转版入赘测试屠榜
546106
10
反转还是洗白?ICE凶手有苦衷?
413574
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示