体操吧 关注:255,107贴子:6,173,936
  • 22回复贴,共1

使用标准分数(Z-score)构建出单项世锦赛积分选拔公式

只看楼主收藏回复

自今年三月起,我开始着手构建一个积分模型,旨在基于现有公开数据,尽可能客观地评估运动员的真实国际竞争力,为中国体操队本年度单项世锦赛的选拔工作提供科学依据。
在参考了日本队和美国队的选拔算法后,我决定采用Z-score标准化方法,建立一套更贴合体操比赛实际情况、同时也更简便高效的计算体系。
该算法主要由两部分构成:一是某运动员在全年国内重要赛事(全锦赛EF+队测选拔)中某一单项成绩的标准分数,即Z国内;二是该运动员在全年国外重要比赛(亚锦赛EF+世界杯A级站EF+大运会EF)同一单项成绩的标准分数,即Z国外。最终的综合得分由Z国内与Z国外加权汇总得出。
将所有运动员的国内和国外得分通过Z-score公式进行标准化,可以消除不同级别赛事之间尺度差异,然后再加权相加。标准化后,得分表示相对于平均值的偏差,使得不同比赛之间的得分可比。
计算公式如图所示。“所有运动员”指该单项纳入二次队测大名单的所有最终候选人。W1、W2分别为该单项国内比赛与国外比赛之间的权重参数,W1=100%,W2=该单项全球正赛D分前三名(不含中国队成员)均值与该单项中国国内正赛D分前三名均值的比率。W2越大,证明该单项国际竞争越激烈,因而权重越高。平衡木项目因其D分E分负相关的特性,可以换取总分前三名标准差比率而非D分比率,从而更能反映稳定性。


IP属地:山东来自Android客户端1楼2025-09-02 15:02回复
    outliner_423、lergh被楼主禁言,将不能再进行回复
    啊,体操分数太少了你大数定理能成立吗还用Zscore


    IP属地:美国来自iPhone客户端2楼2025-09-02 15:05
    收起回复
      2026-01-11 02:19:42
      广告
      不感兴趣
      开通SVIP免广告
      牛,均值和标准差的计算还是有点具体


      IP属地:四川4楼2025-09-02 15:07
      回复
        那要是遇见发大水的选手和恶意压分的情况怎么办


        IP属地:内蒙古来自Android客户端5楼2025-09-02 15:17
        收起回复
          1.采取Z-score构建算法的原理:


          IP属地:山东来自Android客户端6楼2025-09-02 16:23
          回复
            单项世锦赛的打分分值其实挺容易明确的,设计团体比赛内每个选手的积分尺度感觉会是非常头疼的问题。


            IP属地:上海7楼2025-09-02 16:43
            收起回复
              总之是好的方向 可以慢慢优化


              IP属地:北京来自iPhone客户端8楼2025-09-02 16:47
              回复
                会计人点了


                IP属地:广东来自iPhone客户端11楼2025-09-02 19:58
                回复
                  2026-01-11 02:13:42
                  广告
                  不感兴趣
                  开通SVIP免广告
                  2. 数据清洗与归一化
                  这一步骤堪称体操比赛得分建模过程中的“死亡陷阱”。众所周知,体操比赛的样本量较小,而面向公众公开的比赛数据更为有限——仅有奥运会和世锦赛的历史数据披露相对全面(但缺乏E分小项得分表,因此无法进行主成分分析,否则极易受到主观性因素的严重干扰)。在洲际比赛中,仅欧锦赛的数据较为完整,而里约周期之前的世界杯、大运会等历史数据难以获取,其他小型赛事的数据也以欧洲为主。整体来看,国际体操数据缺乏连续性,存在明显的地域性与周期性空白。
                  不过也并非全无转机。自里约周期以来,世界体操的传统格局开始松动并逐渐瓦解,逐步进入一个“乱世”阶段。我判断,这种混乱并非偶然,且在当前周期中,混乱与重组仍将持续甚至加剧。因此,我决定采用里约、东京和巴黎三个周期的数据,用于预测本周期的发展趋势。
                  在确定样本范围后,需进行归一化处理,以消除因规则变更、裁判尺度波动等因素导致的分数系统性偏差。具体方法为:针对每一个比赛年份(赛季),将该年度所有国际重要赛事(包括欧锦赛、亚锦赛、泛美、世界杯A级分站赛、大运会)的成绩关键指标,除以同年世锦赛对应指标,分别计算出三项归一化比率(最高分比率、前三名平均分比率、前六名平均分比率)。再取这三项比率的平均值,作为该赛事的最终水平比率。
                  该方法确保了金牌(第一名)、奖牌(第二至三名)和决赛优秀选手(第四至六名)的权重分配大致为30%、40%和30%,既排除了极端值干扰,也符合体操比赛的荣誉评价习惯。选择以“年”为单位进行处理,是因为体操运动员多为处于发育期的青少年,伤病率高身体状态年际变化大,许多选手甚至难以完整坚持一个奥运周期就已状态下滑——尤其是女子选手,黄金竞技年龄往往仅限于16至18岁。
                  三项归一化比率及最终水平比率的具体计算方式可参考此贴:2013~2023年世界杯分站赛单项权...


                  IP属地:山东来自Android客户端12楼2025-09-03 14:20
                  回复
                    3. 国外比赛权重的确定(女子单项决赛)
                    在计算出各国际赛事在过去三个周期的最终水平比率后,经观察发现其分布较为集中。为进一步简化比较,进行模10映射处理,即将每个数据除以10并取余数,从而将原始数据映射至区间 [0,10] 内,忽略十位及以上的高位数字,仅提取个位与小数部分。最终得到的权重系数如下图所示。
                    根据该权重系数表,可确定各单项决赛中不同赛事的权重配比如下:
                    跳马:亚锦赛–世界杯A级站–大运会:45%–37%–18%;
                    高低杠:亚锦赛–世界杯A级站–大运会: 43%–36%–21%;
                    平衡木:亚锦赛–世界杯A级站–大运会: 45%–35%–20%;
                    自由操:亚锦赛–世界杯A级站–大运会: 37%–37%–26%。
                    由于大运会女子参赛选手的主流年龄范围仅覆盖世锦赛女子选手的约40%,因此大运会的权重在世锦赛比率基础上折价40%计算。
                    基于上述权重配置,可灵活、实时地计算任意国内外选手的“国外标准分数(Z国外)”。然而,“国内标准分数(Z国内)”目前尚无法可靠计算,进而难以进一步估计衰减因子或进行指数加权平均汇总。主要原因包括:全锦赛历史数据残缺不全、队内测试成绩未公开透明、临赛伤病情况也难以获取,整体历史数据环境犹如“黑暗丛林”,充满不确定性。
                    在上一篇帖子中,我建议将2025年全锦-队测1-队测2权重暂时设定为40%–20%–40%(即最传统朴素的线性平均主义)。该方案虽然可能不够稳定,但相较于因指数计算错误而导致误差爆炸、决策者背锅,仍是一种更为稳妥的做法。


                    IP属地:山东来自Android客户端13楼2025-09-03 14:36
                    回复
                      我根据这套算法计算了一下美国女队五位全能热门候选人的标准分数,W2设定为0.96
                      黄丽娜Z国内0.89,Z国外1.428,Z总分2.261
                      杰拉Z国内-0.394,Z国外0.707,Z总分0.285
                      罗伯森Z国内0.107,Z国外-0.531,Z总分-0.403
                      里维拉Z国内0.255,Z国外-1.174,Z总分-0.872
                      沙利文Z国内-0.201,Z国外-0.792,Z总分-0.961
                      注:黄丽娜和罗伯森今年无国外成绩,按照吧友建议,用她俩巴黎周期世锦赛成绩递补,对照巴黎周期四项均值、标准差、协方差矩阵等历史数据建立贝叶斯模型,黄丽娜国外均分估分56.16,罗伯森国外均分估分54.32,两人高于54.239的概率都为62%,在此基础上算出两人Z国外。
                      按照我的算法,根据目前已公开的成绩(不知美国女队最后的队测是否会公开)算出的Z总分排名,美国队全能一号二号位应选择黄丽娜(国内胜利者,世锦赛老将)和杰拉(国内发挥不佳但泛美高光)。
                      但美国队可能会力捧里维拉,毕竟美国女队身处高位,可能会产生自己怎样都能赢的天选之子错觉。


                      IP属地:山东14楼2025-09-03 22:40
                      回复
                        这套算法核心思路是以标准分数Z-score为大框架,用贝叶斯局部推算补充数据缺失部分,可以进一步优化的点是先验分布的选择(先验历史数据精度和今年数据精度的平衡),以及状态衰退因子的引入,反映伤病风险从年初到年终随时间递增的趋势。但大方向的把握和预判是没问题的。


                        IP属地:山东16楼2025-09-04 14:01
                        回复
                          男队第二次队测前夜,放出国外男子单项决赛赛事权重参数,虽然我不会给男队算分。等什么时候他们想明白“团体金、全能金和单项金是不是权重一样的”以及“团体赛大比分输给宿敌日本能不能靠单项金遮羞”这种小学生数学问题和政治问题再说吧。


                          IP属地:山东17楼2025-09-09 01:18
                          收起回复