数学吧 关注:933,786贴子:8,932,417
  • 12回复贴,共1

怎么解释这个强化版“双信封悖论”?

只看楼主收藏回复

连续抛硬币直到出现背面向上为止,记总次数为k,也就是P(k=x)=1/2^x,然后在两个信封中分别装入4^k元和4^(k+1)元。
打开一个信封后发现里面有4^m元。
若m≥2,记该事件为g=m,那么此时有P(k=m|g=m)/P(k=m-1|g=m) = P(k=m)/P(k=m-1) * P(g=m|k=m)/P(g=m|k=m-1) = 1/2,即P(k=m|g=m)=1/3,P(k=m-1|g=m)=2/3。则换信封的收益期望是1/3*4^(m+1) + 2/3*4^(m-1) = (4/3+1/6)4^m=3/2*4^m,大于不换的收益4^m。
若m=1,则换的收益为16,同样大于不换的收益4。
这样应该解决了原来的双信封悖论里定义分布的问题,但依然陷入了换信封优于不换的悖论。


IP属地:浙江来自Android客户端1楼2025-07-22 18:18回复
    大概是不能保证每次都是4^m元?你第一次摸到一个比较大的4^m1元,换亏了(这个概率更大),然后你摸m2,m3...需要很久之后才有一个新的选择m1的机会来补平亏损


    IP属地:上海来自Android客户端2楼2025-07-22 20:46
    收起回复
      2026-01-17 17:44:04
      广告
      不感兴趣
      开通SVIP免广告
      我的理解是,由于收益的期望E(4^m)是无穷大,也就是说对于任意有限的观测值m,总有更大的m+1使得收益的期望成倍增加,最终导致期望的数值被k→∞时主导。因此对于任意有限的情况,期望值的指导意义失效了。换句话说就是,由于k越大,概率越低,但对期望的贡献成倍增加,反而有限的那些大概率情况对期望的贡献很低。导致期望在数值上无法反映有限情况的优劣


      IP属地:山西来自Android客户端3楼2025-07-22 21:41
      收起回复
        有一些新的想法,不知道对不对。
        P(g=m)=P(g=m|k=m-1)+P(g=m|k=m)=0.5×0.5^(m-1)+0.5×0.5^m=1.5×0.5^m
        未启封时,
        采用不换信封策略的收益期望:Ea=∑[P(g=m)×4^m]=∑1.5×2^m,m→∞
        采用换信封策略的收益期望:Eb=∑[P(g=m|k=m-1)×4^(m-1)+P(g=m|k=m)×4^(m+1)]=∑9/4×2^m,m→∞
        对于这两个级数的每一项,都有Eb(m)>Ea(m)
        但同时Eb(m)=0.5Ea(m)+0.5Ea(m+1),也就是说,级数b实际上是将级数a的每一项拆分重组得到的,所以两个级数是等价的。
        所以结论就是:在打开信封之前,两种策略的期望都是发散级数,而且级数b可以由级数a重排得到,所以两种策略没有区别。
        而打开信封之后,两种策略的收益期望都收敛至这两个级数的某一项,此时换的收益就比不换高了。


        IP属地:浙江来自Android客户端4楼2025-07-22 23:11
        收起回复
          假设双信封问题是,选择一个信封,不打开,直接选择是否换,那么很简单的换或不换的期望收益相同。
          假设选择信封后,先打开看后,再选择是否更换,这就是一个策略问题。
          因为
          1,很明显,知道信封内金额的范围后,完全可以做一个该范围内单调递减函数,函数值域是0~1。那么根据该函数概率选择更换,期望收益肯定会变高。
          2,假设双信封分别为a、b。此时根据金额范围任意取一个数c。该问题就可以转化为,先看了c,然后看了a,此时有一个选择换的机会。或者说,已知c,然后选择一个策略,可以观察双信封中的一个时,使得最终取到最大信封的概率变大。
          方法应该还有许多,根本原因就在于“看”这个动作,看了就从一个计算期望收益的问题变成一个策略问题。


          IP属地:湖北来自Android客户端5楼2025-07-23 08:53
          回复
            因为期望不存在吧。
            不太确定这个为什么叫悖论,我猜是基于这样一种认识:俩信封是对称的,但是后开的信封的期望永远大于前开的,“求和”后肯定不相等。
            但是发散的级数就是可以靠交换律和结合律“变形”成一个每项都比原来大的新级数。


            IP属地:中国香港来自iPhone客户端6楼2025-07-23 09:32
            回复
              因为m的标准并不公平。若记信封一为4∧m,当信封二为4∧(m+1)时,m=k;当信封二为4∧(m-1)时,m=k+1。在保证k对双方等价时,显然以m为基准就会放大信封二的优势事件缩小它的劣势事件,就成为了不公平的游戏规则


              IP属地:福建来自Android客户端7楼2025-07-23 13:55
              回复