刚在B站看完番,正好在上game theory的选修课,就想来分析一下如果双方都是理性思考的情况
首先如果把输的回报设定为-1,平的回报设为0,赢的回报设为1,那么这个游戏可以表现成下面这样:
公主: 石头 剪刀 布
男主:
石头 (-1,1) (0,0) (-1,1)
剪刀 (-1,1) (-1,1) (0,0)
布 (1,-1) (-1,1) (0,0)
括号里是(男主回报,公主回报)
首先可以看出男主出剪刀的回报-1,-1,0和出布的回报1,-1,0相比,无论公主出什么都不会出现男主剪刀的回报比布多的情况,所以男主一定不会出剪刀。这是基于这个游戏的构造,是双方都可以分析得出的,所以这个选项可以删掉。
然后变成:
公主: 石头 剪刀 布
男主:
石头 (-1,1) (0,0) (-1,1)
布 (1,-1) (-1,1) (0,0)
这时又可以发现公主出石头的回报1,-1和出布的回报1,0相比,现在无论男主出什么公主出石头的回报都不会大于布的回报,所以公主一定不会出石头。这也是双方可以得知的,所以公主的石头选项也可以删掉。
然后变成:
公主: 剪刀 布
男主:
石头 (0,0) (-1,1)
布 (-1,1) (0,0)
在这种情况下,理性思考的双方的最优解是公主50%剪刀50%布,男主50%石头50%布。这样的话任何一方都不可能在对方策略不变的情况下通过改变自己的策略来增加自己的回报,也就是达到了一个Nash equilibrium。男主不管如何改变出石头和布的几率,他的回报都是-0.5。
现在再回来看动画,如果单论结果的话,多拉并没有判断失误,她随机到了50%的剪刀,只是男主运气好而已。如果以全知的视角去看男主的分析,也是基于他知道多拉并不能够理性分析这个game的前提下才成功的。
首先如果把输的回报设定为-1,平的回报设为0,赢的回报设为1,那么这个游戏可以表现成下面这样:
公主: 石头 剪刀 布
男主:
石头 (-1,1) (0,0) (-1,1)
剪刀 (-1,1) (-1,1) (0,0)
布 (1,-1) (-1,1) (0,0)
括号里是(男主回报,公主回报)
首先可以看出男主出剪刀的回报-1,-1,0和出布的回报1,-1,0相比,无论公主出什么都不会出现男主剪刀的回报比布多的情况,所以男主一定不会出剪刀。这是基于这个游戏的构造,是双方都可以分析得出的,所以这个选项可以删掉。
然后变成:
公主: 石头 剪刀 布
男主:
石头 (-1,1) (0,0) (-1,1)
布 (1,-1) (-1,1) (0,0)
这时又可以发现公主出石头的回报1,-1和出布的回报1,0相比,现在无论男主出什么公主出石头的回报都不会大于布的回报,所以公主一定不会出石头。这也是双方可以得知的,所以公主的石头选项也可以删掉。
然后变成:
公主: 剪刀 布
男主:
石头 (0,0) (-1,1)
布 (-1,1) (0,0)
在这种情况下,理性思考的双方的最优解是公主50%剪刀50%布,男主50%石头50%布。这样的话任何一方都不可能在对方策略不变的情况下通过改变自己的策略来增加自己的回报,也就是达到了一个Nash equilibrium。男主不管如何改变出石头和布的几率,他的回报都是-0.5。
现在再回来看动画,如果单论结果的话,多拉并没有判断失误,她随机到了50%的剪刀,只是男主运气好而已。如果以全知的视角去看男主的分析,也是基于他知道多拉并不能够理性分析这个game的前提下才成功的。