amd吧 关注:803,441贴子:18,569,682

回复:Dee确认使用的是ptx语言 哈哈哈

只看楼主收藏回复

可恶啊,AMD线程撕裂者又要涨价了


IP属地:广东来自Android客户端16楼2025-01-31 23:23
回复
    我记得ptx比正常写cuda可移植性更差啊,这是更精准控制硬件所必须付出的代价。


    IP属地:上海来自Android客户端17楼2025-02-01 01:42
    收起回复
      2026-01-11 09:05:19
      广告
      不感兴趣
      开通SVIP免广告
      然而ptx也是nv的


      IP属地:山东来自Android客户端18楼2025-02-01 01:50
      收起回复


        IP属地:山东来自Android客户端19楼2025-02-01 01:53
        回复
          deepseek都已经公开自己的论文了,为什么不去看?另外cuda本身就支持用户内联ptx(ptx就是英伟达显卡的汇编),我建议啥也不懂或者别有用心的媒体炒作成deepseek团队直接使用二进制01代码在穿孔纸带机上完成了训练,然后又巨牛逼地做了各个平台的适配,再收割一波美股


          IP属地:广西来自Android客户端20楼2025-02-01 01:53
          收起回复
            你是什么人类


            IP属地:江苏来自iPhone客户端21楼2025-02-01 04:39
            回复
              讲道理,这个ds对英伟达能有什么影响?nv的显卡不能用ds了吗?顶多就是让一些本来不能跑AI的人可以跑AI,我猜现在A卡已经开始涨价了ds真威胁的是老美,好不容易搞的新锚点刚起步就没了。


              IP属地:江苏来自iPhone客户端22楼2025-02-01 08:22
              收起回复
                相当于拿汇编写的计算卡接口。这还不是最恐怖的,那个Deepseek可以自己写汇编自己升级


                IP属地:上海来自Android客户端24楼2025-02-01 09:14
                回复
                  2026-01-11 08:59:19
                  广告
                  不感兴趣
                  开通SVIP免广告
                  最大的意义在于打破了垄断,amd的卡也能用了,更重要的是,中国的卡也能用了,华为的卡好像已经适配好了。


                  IP属地:江苏来自Android客户端25楼2025-02-01 10:48
                  回复
                    ptx也是cuda提供的,这怎么绕过nvidia?而且是中间语言,介于cuda C与cuda sass之间,怎么可能语法接近人类?那个sass才是类似汇编的,ptx更像是java中的字节码,怎么绕开奇怪了都


                    IP属地:上海来自iPhone客户端26楼2025-02-01 11:57
                    回复
                      建议楼主不要看到个新名词不加考证就到处乱发,这样会显得你很无知诶
                      ptx是英伟达的GPU汇编语言,比cuda更底层,直接绑定GPU硬件架构的,兼容性比cuda更差,通常用于针对某个型号架构的GPU做极限优化时会使用内联ptx汇编编写。所以不可能说使用ptx绕过cuda生态。


                      IP属地:北京来自Android客户端27楼2025-02-01 12:19
                      收起回复
                        我不是什么懂哥,也算不上什么专业人员,但是我之前去百度搜了这个新闻,有的媒体会附一张v3论文的截图,我就去看了这篇论文,这篇论文的第三章标题是infrastructure,3.2小节的标题是training framework,根据我的理解3.2.1介绍了他们训练时使用的dualpipe流水线并行算法,附上了一张类似流水线时空图的东西,大概就是用高效的流水线并行算法让计算设备尽量地忙,而且dualpipe也不是deepseek首创,重点来了3.2.2小节说他们用一种高效的方法实现了跨节点多对多通信,就是在使用服务器集群训练的时候需要对集群中各个计算节点进行协调以适配dualpipe算法,3.2.2小节的最后一段,ptx这个词第一次也是唯一一次出现的地方(用浏览器打开pdf然后快捷键ctrl+f进行全文检索),也是我截图里面这一部分的最后几句,大致的意思就是他们使用了ptx指令以及自动调整communication chunk的大小,显著减少了l2缓存的使用以及流式多处理器之间的干扰,再去英伟达官网看cuda的文档页面,里面就有ptx的api文档那你们把用ptx指令优化训练服务器集群通信方式来适配dualpipe算法炒作成deepseek完全绕开cuda,这不就是典型的新闻学案例吗?


                        IP属地:广西来自Android客户端28楼2025-02-01 13:41
                        收起回复
                          CUDA不给用,那肯定要绕开…


                          IP属地:山东来自iPhone客户端29楼2025-02-01 14:15
                          收起回复
                            更正一下:dualpipe确实是deepseek首创的,把之前看一些技术解读记混了,因为有人说这个dualpipe是借鉴+创新


                            IP属地:广西来自Android客户端30楼2025-02-01 14:15
                            收起回复
                              2026-01-11 08:53:19
                              广告
                              不感兴趣
                              开通SVIP免广告
                              赛博马奇诺了


                              IP属地:北京来自Android客户端31楼2025-02-01 14:47
                              回复