三国杀吧 关注:3,430,317贴子:90,294,387

回复:三国杀ol单挑组结论的统计学检验

只看楼主收藏回复

我觉得这个帖子赞同你的人还是少了,多来几个赞同的,把测试组干几眼,这样连证据不足的测试都看不到咯


IP属地:浙江来自iPhone客户端32楼2026-03-16 23:30
回复
    首先,你在局内是能感觉出来你这把来的牌运气好不好的,感觉不对肯定加测


    IP属地:浙江来自Android客户端33楼2026-03-17 00:10
    回复
      2026-03-26 02:24:55
      广告
      不感兴趣
      开通SVIP免广告
      那是因为你只看对局结果,而武将单挑对局不是单纯的抛硬币。
      本身测单挑的人是有意识的,这把牌糊不糊、能不能作为参考以及武将的强度差距都可以在对局中感受到,随机性带来的影响基本可以忽略。绝大多数的对局翻案也不是因为概率,是因为优化打法


      IP属地:湖南来自Android客户端34楼2026-03-17 00:14
      回复
        简单来说单挑的对局过程本身也是一种信息,实验的过程和最终比分都在导出结果。而你这篇内容考虑比分不考虑过程,自然也就会得出不准确的结论。


        IP属地:湖南来自Android客户端35楼2026-03-17 00:20
        回复
          那你来测?


          IP属地:湖南来自Android客户端36楼2026-03-17 00:23
          回复
            也有一些局,打两三把基本就定优劣了,比如我摸上来一堆烂牌你摸上来一堆好牌,然后这局我还赢了,下一句我摸牌运气一般你摸牌运气也一般,结果单方面吊打,这是不太会接着打下去的,直接谁优谁劣分好了,按照你的死板理论,这个样本的置信度极低,但真实胜率与单挑组结论相同的概率可能能到99.9%以上


            IP属地:浙江来自Android客户端37楼2026-03-17 00:27
            收起回复
              @豚鼠亦鼠丷 冷知识,这家伙是这样不正常的,参考之前他炮轰单挑组的言论


              IP属地:广东38楼2026-03-17 00:30
              收起回复
                你这个有问题啊,感觉你没考虑到分先这一块,我以前就思考过这方面的问题,你应该结合先后手考虑,即是否先手大于对方先手有置信度


                IP属地:上海来自Android客户端39楼2026-03-17 01:45
                收起回复
                  2026-03-26 02:18:55
                  广告
                  不感兴趣
                  开通SVIP免广告
                  没想到在贴吧这种地方也能感受到科学必须要服务于郑智
                  说句题外话,统计学检验这种东西真算不上多难懂,但却相当的好用,像这类卡牌游戏,很多时候都能看到有人抱怨运气问题,但只要简单做个统计学检验就能搞清楚到底是不是有暗箱操作了,不过这种事是真的费力不讨好,不论得出什么样的结论,总会有一群人来攻击,而且结论在科学意义上越严谨,反而遭受的攻击越强烈,之前有个人做炉石传说酒馆战棋的发牌的测试,数据量非常大,可以说是已经在尽可能的严谨了,但最终还是因为结论不符合一部分人的认知,直接被喷到删视频
                  说回单挑测试,测试过程中也有很多其他指标能用来辅助判断对局的优劣,当然就算综合所有的指标,这个样本数量也还是太少了,不过我始终认为,单挑测试的结果无非只是比脑测结果相对可靠一些的结论罢了,远远达不到“正确”的标准,但因此要全盘否定单挑测试的意义倒也大可不必,这已经是相当有性价比的方法了,而且这里是三国杀的贴吧,大家肯定会维护有利于这个社区的工作,把这种很可能产生争议的东西发出来想必楼主是做好了被攻击的准备的吧


                  IP属地:湖北来自Android客户端40楼2026-03-17 02:21
                  回复
                    我和单挑组无任何联系,发这篇文章仅仅出于科学的目的,当然该文章也有需要完善的地方。我希望大家不要把学术上的局限性个人化,单挑测试本身需要大量时间和精力,因此社区中有人持续进行测试本身是非常宝贵的。我指出一些局限性并不代表我不尊重他们。


                    IP属地:荷兰来自iPhone客户端41楼2026-03-17 02:44
                    回复
                      还有人提到我关于乐乐的言论,我的立场是一贯的学术的立场。任何的测试和文章都可以拿出来交给大家审议,即使乐乐的测试存在着操作上不严谨的地方。科学就是在这一次次的不严谨的发表和讨论中进步的。我不掩饰我为乐乐的离开而难过,乐乐不做单挑之后,单挑榜空窗近一年,想来也是大家的损失。


                      IP属地:荷兰来自iPhone客户端42楼2026-03-17 02:44
                      回复
                        我看到有很多人指出我的模型存在的不足之处,比如未建模先后手。我很高兴这一点。也只有在我们的局限性一个个被指出的过程中,我们对世界的认知才不断完善。研究者们应该为了自己在arxiv的文章的局限性被指出而高兴。


                        IP属地:荷兰来自iPhone客户端43楼2026-03-17 02:45
                        回复
                          当然了,本文没有讨论先后手的问题是一个问题,这种混合概率可以被建模,但是初步看只会带来更大的样本量需求,欢迎有兴趣的吧友们建模,我有时间的话也会做。也有了解单挑的人提到单挑组会认为“选取数据”,那这会带来选择效应的偏差。


                          IP属地:荷兰来自iPhone客户端44楼2026-03-17 02:45
                          回复
                            这是什么情况,这号的回复为什么外面是看不见的


                            IP属地:江苏来自iPhone客户端45楼2026-03-17 03:38
                            收起回复
                              2026-03-26 02:12:55
                              广告
                              不感兴趣
                              开通SVIP免广告
                              考虑先后手的情况。测30次和80次的95置信区间图如下


                              IP属地:荷兰来自iPhone客户端46楼2026-03-17 06:53
                              回复