象棋吧 关注:283,264贴子:6,257,327

回复:被让单车,偶尔娱乐。

只看楼主收藏回复

软件让车最好给软件补充下先手,例如红方开局连走中炮正马两先或者再多给先手。
这样对黑方影响不大,对红方能持平铁马的情况,不让让车变成让车马。


IP属地:安徽来自Android客户端18楼2022-08-04 16:38
收起回复
    无压力吊打


    IP属地:广东来自Android客户端19楼2022-08-04 19:52
    收起回复
      2026-06-12 14:50:06
      广告
      不感兴趣
      开通SVIP免广告
      看大家对“强软能否让业7单车轻松取胜”这个问题那么感兴趣,我也说说我的观点,并且可以以此作为实验设计。这个问题其实可以做为一个研究课题讨论。既然是做研究,那就一定要尽可能做到控制变量,严谨论证结果的适用范围。
      首先需要明确几点基础条件作为背景(当然这可以被其他合理假设替换作为其他架构下的实验基础)。第一,不论是人还是软件,在实际对局中表现出的棋力都是一个可以至少数值量化的浮动结果,该结果不能在一次实验中得到无偏估计。第二,棋力表现的波动程度与棋力水平呈负相关。即:棋力越高,出现低级表现的概率越低。亦即:棋力表现的均值与标准差负相关。
      在此条件下,实验双方的选择就有一定的要求。第一,软件需要具备稳定的表现,且对棋规和让子棋的特殊规定有合理设计,如不能满足后者则可能得到近似结果。第二,棋手需要稳定业7范围的水平。
      满足以上测试条件后,对实验的具体参数应有符合问题核心原则的设定。由于稳定业7的水平相比于强软来说具备较大的方差,所以实验需要使棋手做出充分的思考以及多次独立重复试验以说明软件是否“让得动”单车。否则在思考不充分的情况下,稳定业7也可能表现出超低的棋力水平,影响结果判断。另外,在实际情况下,所谓强软与弱软的界定也容易出现存疑。为此,应当有如下的假设成立:当业7棋手能够以超过某公认较强软件的某一阈值评分的优势战胜或优和“弱软”先手让单车,则认为该棋手有大概率不会输给“强软”先手让单车。当然,这个假设仍然可以被合理改变,以作为棋手对弱软和强软的结果嫁接。
      为此,在实际实验时,建议采用如下设定:
      1,选择胜率在45%到60%之间的业7棋手。
      2,对局时间60分钟包干或步时3分钟以上。
      3,采用统一棋规,软件设定铁马规则。
      4,对同一棋手采取分散对局十番棋以上。棋手数量大于10人。
      5,若棋手能够以大一马及以上优势战胜或优势和于测试软件,则认为:任意强软不能先手让单车战胜稳定业7棋手。
      以上具体参数可以更改,但架构及设计思路不建议改变。期待能够满足以上测试条件且愿意谨慎实证的棋友进行一次规模测试。


      IP属地:北京来自Android客户端21楼2022-08-05 08:55
      回复
        有需要的话我可以配合测试,一天可能下不完,三天十局没问题


        来自iPhone客户端22楼2022-08-05 09:52
        收起回复
          这是最后局面,招法不知道在哪里找,退出来好像就没了


          来自iPhone客户端24楼2022-08-05 10:59
          收起回复
            对于18楼“终日乾乾”提出的“软件让棋手单车,棋手让软件二先”的设计,我觉得其实是涉及到一点根本定义问题:“软件让单车”的定义是什么。如果是希望严格遵循铁马规则,那就还是改良软件添加铁马规则以后再说吧。对于近似定义来看,“直接让单车先走”和“让单车多二先”哪个更能代表“软件让单车”的含义,仁者见仁智者见智吧。


            IP属地:北京来自Android客户端26楼2022-08-05 15:34
            回复
              让单车前几步要人下才行,软件就是无脑出子出车,被人家一兑就歇菜,优势在中局,只要能避兑机会还是很大的


              IP属地:河南来自Android客户端27楼2022-08-05 15:55
              收起回复
                额外多吃双马取胜。


                IP属地:北京来自Android客户端28楼2022-08-05 23:25
                回复
                  2026-06-12 14:44:06
                  广告
                  不感兴趣
                  开通SVIP免广告
                  贴吧搞实证没意义。
                  这个软件让车的事我之后不参与表态了。
                  最后多说一点关于实验设计的看法。
                  之前我已经对实验过程中的细节做了讨论,但是没想到题干也能引发歧义。
                  “强软能让得了业7单车”,这一句话居然包含三个争论点。第一,强软是什么标准?如果采用不能达到这个标准的软件的最高等级,如何等效结果?第二,让得了是什么意思?是说软件可以以较大优势取胜?还是指任何取胜?或者是能保持和棋即可?再或者是其他的什么理解方式。第三,业7是什么意思?由于人的棋力在不同精神和心理状态下是迥然不同的,那么这个业7表示的是评测条件下的水平?最佳思考条件下的最佳水平?还是某种盲测定义下的水平?再或者是什么别的意思?
                  贴吧已经有胜率稳定的业7等级棋友番棋慢棋战胜软件最高等级直接让单车的统计记录了,这就足以说明业7在心理状态较好的情况下不会被软件让单车轻易打败。而目前看到的支持“软件让得了业7单车”的论据贴都是以各种充满争议的条件得到最概括的结论,有以偏概全之嫌,实在让人不能信服。此外,那个“在不告知被试实验目的的情况下,实验者自主选择白送车的方式,随后以软件最高等级进行多被试分别单轮次对局,最终得到软件让得了业7单车结论”的试验,我个人认为:这里边根本就不具备任何实证意义。具体的内容我也不展开了。如果真的有特别想搞明白“强软能不能让得了业7单车”这件事的棋友,欢迎借鉴我在本帖抛砖引玉的实验设计。至少在得到结论的时候说清楚条件和因果关系。


                  IP属地:北京来自Android客户端29楼2022-08-07 22:25
                  收起回复
                    我想在这个回贴里讨论一些不同的事情,也可以说是对小吧主的建议。小吧不赞成吧友的实验结论,完全可以。但吧友的实验,无论结论是什么样的,并不是如小吧所说没有任何实证意义。我们要看见实验证明了什么,小吧做研究的人肯定也知道部分结论的重要,我们加强结论的条件,吧友的实验就是一个很好的实验。吧友不是科学家,很难严谨实验,但这种实验的精神仍应鼓励。至少这场大讨论,让很多的吧友都形成了对软件自己的认识,我认为这是这场讨论最有意义的地方。


                    IP属地:上海来自iPhone客户端31楼2022-08-08 13:06
                    收起回复
                      另外,小吧给我一种感觉,就是在软件让车赢了的贴子下批评实验存在严重漏洞,而在赢了软件让车的贴子下发一些支持赞同的话,是不是带了一些主观的立场呢?


                      IP属地:上海来自iPhone客户端32楼2022-08-08 13:08
                      收起回复
                        业几业几只能说有一定代表性,不一定就能说明实力。入了门道的人,理论上是能赢软件让车的。


                        来自iPhone客户端33楼2022-10-21 00:46
                        回复