【蒙特卡洛树搜索又称随机抽样或统计试验方法】
首先存在概率估计这种基于遍历的结果树。
现在下棋时,希望不遍历,或只提取一个该招数的主观概率值。招数改成按此概率值随机选一个。
比如某步三个选项,原来遍历后三个选项有总概率值。然后选概率最大的。
现在三个选项总概率值已知(或近似知)。按赢律随机选一个选项。
0.1,0.3,0.6三个选项都有机会被选中。
被选中的概率是px。
怎么模拟指定需求的概率呢。
0.1,0.3,0.6
0.1,0.1+0.3=0.4,0.4+0.6=1
0.1,0.4,1
随机一个0到1的数p
问落在哪个段落
(0.0.1)(0.1,0.4)(0.4,1)
落在哪就是那个选项。