amd吧 关注:799,506贴子:18,429,607

是不是amd的浮点计算很烂啊

只看楼主收藏回复

目前手头的cpu是651k,写了点主要是求解微分方程的matlab程序仿真,怎么这么慢啊。刚刚查了一下评价单核浮点运算super pi的benchmark,3870k计算1m位是4130的一倍时间。super pi是不是能客观评价单核的浮点计算能力?


IP属地:江苏1楼2014-05-01 21:55回复
    super pi benchmark的排行,农企惨不忍睹。


    IP属地:江苏2楼2014-05-01 21:56
    收起回复
      2025-08-19 15:16:09
      广告
      不感兴趣
      开通SVIP免广告
      pi不是浮点数运算,不然结果会更惨,可以找个iu电脑做个测试看看,赛扬也行,看看是不是程序效率的问题


      IP属地:广东3楼2014-05-01 21:57
      收起回复
        所以说为什么AMD要搞异构
        ——来自 诺基亚 Windows Phone


        来自WindowsPhone客户端4楼2014-05-01 22:18
        回复
          不是说龙芯浮点很强大吗


          来自Android客户端5楼2014-05-01 22:40
          收起回复
            amd浮点本来就不行。


            IP属地:广东6楼2014-05-01 23:08
            回复
              首先,3870和4130不仅价格差了百分之50,而且浮点运算用显卡更快,你这个就像是帧数太低怪u一样


              来自Android客户端7楼2014-05-02 00:11
              收起回复
                amd现在纯cpu部分浮点被阉割了。不知道新版本matlab支不支持gpu加速?支持的话APU就吃香了。
                ——来自 诺基亚 Lumia 920


                IP属地:湖南来自WindowsPhone客户端8楼2014-05-02 00:20
                收起回复
                  2025-08-19 15:10:09
                  广告
                  不感兴趣
                  开通SVIP免广告
                  651k已经是目前AMD中单核性能最好的U了


                  IP属地:广西来自手机贴吧9楼2014-05-02 00:38
                  收起回复
                    主流计算软件gpu加速很少有针对游戏卡的,用过abaqus,听说支持gpu还挺高兴的,后来一看白皮书人家支持的是tesla芯片的gpu


                    IP属地:江苏来自手机贴吧10楼2014-05-02 00:48
                    回复
                      说多了都是泪


                      来自WindowsPhone客户端11楼2014-05-02 09:34
                      回复
                        我以前数学建模比赛的时候也玩过matlab


                        IP属地:广东来自iPhone客户端12楼2014-05-02 10:07
                        回复
                          ^0^——How did you find me here?


                          IP属地:海南来自Android客户端14楼2014-05-02 12:01
                          回复
                            很多人都搞不清楚SuperPi到底是整数还是浮点运算,就连许多媒体编辑也是瞎说。我可以肯定的告诉大家,是整数运算。在网上看到了一篇文章,转给大家看看:
                            如果有人比较精通编程的,欢迎使用其它语言编写,让我们都来跑跑看会有什么结果。
                            原文链接:http://www.cppblog.com/hktk/archive/2009/09/24/97148.aspx
                            不可否认,SuperPi历史非常悠久,用的人之多,其他同类软件难以匹敌。但是对其有更多了解的人却很少,下面这些细节你可能都不知道:
                            1.SuperPi发布日期是平成7年(1996年)
                            2.[もとのプログラムはFORTRANで书かれていますが、それをC言语に书き直しました。
                            原计划使用Fortran编写,最后使用C语言编写
                            3.ガウス・ルジャンドルのアルゴリズムを采用しています
                            采用Gauss-Legendre算法
                            4.创造纪录使用的大型机器是HITAC S-3800/480(95年的配置啊,当时看来可是绝对地强悍啊):
                             主记忆容量    :1792.75 MB (主内存)
                             拡张记忆容量   :25120 MB (扩展内存)
                            アルゴリズム   :ボールウェインの 4 次の収束アルゴリズム
                            使用算法:Borwein四次迭代算法
                            注意!和SuperPi所用的算法并不相同!!
                            许多人都知道,开发SuperPi的作者用大型机跑出了42亿位的纪录,且都认为使用是和SuperPI一样的算法,但是事实并非如此!大家都是在以讹传讹!
                            6.Pentium 66MHz计算104万位需要 1小时13分22秒
                            HITAC S-3800/480计算104万位大约只需要5秒!
                            Pentium 66MHz计算3355万位需要 105小时35分17秒
                            HITAC S-3800/480计算3355万位大约只需要4分钟!
                            注意:由于使用算法和软件环境不同,大型机和PC没有绝对地可比性,况且还是95年的大型机,但是其性能优异在一定程度上是可以肯定的。
                            硬件和软件的发展都是很惊人的,1986年9月,创造42亿位纪录者之一的金田用HITAC S-810/20计算了3355万Pi值,这在当时就是一个世界记录了!但同年10月他们就把记录提高一倍到6千7百万位。
                            我用QPI使用SuperPi的AGM算法计算3355万位,花了3分47秒就完成了,就算是体验到当年大型机的速度了吧
                            7.关于Gauss-Legendre算法和Borwein四次迭代算法,SuperPI也给出了详细的介绍:
                            SuperPI所采用的Gauss-Legendre算法:(PS:又叫做AGM算法(Arithmetic-Geometric Mean))
                            1.初值确定
                               a = 1
                            b = 1 / sqrt( 2 )
                            t = 1 / 4
                            x = 1
                            2. a与b都取同样的精度,反复迭代计算下式:
                            y = a
                            a = ( a + b ) / 2
                            b = sqrt( b ・ y )
                            t = t - x ・ ( y - a )^2
                            x = 2 ・ x
                            3.a和b迭代到足够精度后,根据下式可以计算出PI值
                            Pi = ( a + b )^2 / ( 4 ・ t )
                            这个公式的特点是每迭代一次将得到比前一次迭代高一倍的精度,所以要计算104万位(2的22次方),迭代19次就够了,这就是为什么SuperPi的计算为数都是以2的倍数递增,且计算时会出现一条条的纪录,这就是每一次迭代所花费的时间!理论上每次花费的时间都应该是完全相同的。比较可笑的是 SuperPi MOD版本的汉化翻译,把19次迭代翻译成需要重复计算19次,明显存在着理解上的错误。
                            计算42亿位的巨型机所使用的Borwein四次迭代式:
                            1.初值确定:
                            a[0] = 6 - 4 ・ sqrt( 2 )
                            y[0] = sqrt( 2 ) - 1
                            2. 反复计算下式,提高精度
                            y[k+1] = { 1-(1-y[k]^4 )^(1/4) } / { 1+(1-y[k]^4)^(1/4) }
                            a[k+1] = a[k]・(1+y[k+1])^4 - 2^(2・k+3)・y[k+1]・(1+y[k+1]+y[k+1]^2)
                            3.当a[n]和b[n]达到足够精度后,可以确定Pi值
                            Pi = 1 / a[n]
                            所以可以看出,该公式首先算出其实是Pi的倒数,算出a[n]后,要做一个“巨型”的除法才能得到真正的Pi值
                            另一方面必须要认识到,SuperPi的编写年代久远,现在看来实现的效率非常低。Qpi即使用完全同样的算法,在我的E6300机器上只需3.37秒就完成了104万位的计算的19次迭代!
                            计算过程(QPI4.5版 使用-agm3参数,和SuperPi完全相同算法 E6300未超频 Vista环境 ):
                            Starting 1st iteration, time : 0.13
                            Starting 2nd iteration, time : 0.19
                            Starting 3rd iteration, time : 0.17
                            Starting 4th iteration, time : 0.19
                            Starting 5th iteration, time : 0.19
                            Starting 6th iteration, time : 0.19
                            Starting 7th iteration, time : 0.17
                            Starting 8th iteration, time : 0.19
                            Starting 9th iteration, time : 0.17
                            Starting 10th iteration, time : 0.19
                            Starting 11th iteration, time : 0.17
                            Starting 12th iteration, time : 0.19
                            Starting 13th iteration, time : 0.19
                            Starting 14th iteration, time : 0.17
                            Starting 15th iteration, time : 0.19
                            Starting 16th iteration, time : 0.19
                            Starting 17th iteration, time : 0.17
                            Starting 18th iteration, time : 0.17
                            Starting 19th iteration, time : 0.17
                            Total iteration time : 3.37
                            Computing final value, time : 0.14
                            Total time : 3.56 seconds
                            Total memory used : 12,003,171 (11.45 MB)
                            Processor utilization : 128.98%
                            CPU 利用率达到了128.98%说明其利用了第二个核心的28.98%的效率,发挥了了一定的双核优势,但即使是完全单核执行应该也不会慢到哪里去,比起 SuperPi漫长的30秒计算几乎达到了10倍速,而这个成绩也比超频榜上的那些个发烫的成绩要快得多了,如果使用最快的chudnovsky算法,只要1.5秒便结束了104万的战斗....如果换成超频榜上的那些牛机,只需零点几秒便解决了!
                            不知道用SuperPi的人中有几个人知道Pifast,有几个知道Qpi,还有几个人两个都知道的
                            SuperPi在历史舞台上的地位是永远存在的,但是考验CPU速度,还是换更先进的算法和程序感觉会更好,更能体验飞速的感觉!看着SuperPi的排行榜,我仿佛看到了喷火的跑车发动机装在了拖拉机上...
                            你真的老了SuperPi...
                            别了SuperPi....


                            15楼2014-05-02 12:10
                            收起回复
                              2025-08-19 15:04:09
                              广告
                              不感兴趣
                              开通SVIP免广告
                              superPI仅仅是测整数除法,结果代表不了整数性能。比方说rar也是整数运算,但是FX8350压rar就要比3770K快。
                              想要比较全面地测试浮点性能,请用AIDA64Sisoftware Sandra或者linpack


                              IP属地:浙江本楼含有高级字体16楼2014-05-02 14:57
                              回复