如果历年全锦数据、选拔赛数据和临赛伤病率清晰可查,就能够通过历史数据计算出权重系数最优值,然后用指数加权平均的方法建模预测,这样就符合体操比赛“越近期成绩越反映临赛状态,预测大赛结果越准确,赋予权重越高”的实际需求,模型预测性能将优于线性均值回归。
但现在往年数据缺乏连续性甚至空白,卡在权重系数设置这一步,若主观设置一个权重系数,指数级衰减可能导致残差失控,无法拟合。所以暂时也只能做最简单的线性模型。
死板不计权重,这是日本的思路,线性平均主义最稳健,一旦出了事可以自保甩锅;依赖非线性的指数函数模型,这是美国的思路,美国男队内规赋分曲线图就是这种思路的体现,预测复杂性强的团体大赛一旦权重设错了就完蛋了,预测单项世锦赛实际也就起到个美化分数表、抬高实际得分的作用。
鉴于瓜队数据严重不全,不是公开透明披露,而类似黑箱解密,我还是用自创的土办法试一试吧。毕竟建模并不是越复杂越非线性才越“数学”,陷入矩阵漩涡被迷了魂还不如化繁为简。
但现在往年数据缺乏连续性甚至空白,卡在权重系数设置这一步,若主观设置一个权重系数,指数级衰减可能导致残差失控,无法拟合。所以暂时也只能做最简单的线性模型。
死板不计权重,这是日本的思路,线性平均主义最稳健,一旦出了事可以自保甩锅;依赖非线性的指数函数模型,这是美国的思路,美国男队内规赋分曲线图就是这种思路的体现,预测复杂性强的团体大赛一旦权重设错了就完蛋了,预测单项世锦赛实际也就起到个美化分数表、抬高实际得分的作用。
鉴于瓜队数据严重不全,不是公开透明披露,而类似黑箱解密,我还是用自创的土办法试一试吧。毕竟建模并不是越复杂越非线性才越“数学”,陷入矩阵漩涡被迷了魂还不如化繁为简。









