每位玩家都应知道的最令人瞠目结舌的统计数据
理解概率
从随身携带雨伞到投注,我们每天都在根据自己对于概率的理解作出各种决定。然而,我们与生俱来的直觉经常成功地将我们引入歧途,而此时统计数据将是我们最值得信赖的盟友,能帮助我们重回真理之路。
警告:本文中分析的心理陷阱非常反直觉,甚至连最有思辨精神的统计学家都感到震惊。不过在我们继续谈论理论之前,不妨先检验一下我们天生的直觉。
两位实力相当的斯诺克选手打比赛。你认为比赛中的领先地位会在二者之间交换多少次?你觉得他们打的局数越多,领先地位交换的次数就越多还是越少?
既然我们假定他们的实力相当,就可以使用最著名的随机化测试(即掷硬币,其中一位选手为硬币正面,另一位为硬币反面),来观察领先地位如何在二者之间交换。落后的选手需要先追平比分,领先地位才可能改变。那么,让我们先看看获得均等结果的机会有多大。
- [什么是回撤?如何管理回撤?]
如果我们掷六次硬币,那么在直觉上我们明白连续六次结果为正面的可能性很低。掷六次硬币会生成64种可能的组合。六次结果都一样(无论全是正面还是反面)的概率为2/64——约为3%(1 x ½ x ½ x ½ x ½ x ½)。
我们还明白,尽管每种结果的机会都是50%,但这并不代表在掷六次硬币这么小的样本中,我们一定会掷出三次正面三次反面。
掷六次硬币得到三次正面三次反面的实际概率为20/64(约31%)——大约为三分之一。那这是否意味着,如果我们将这个连续掷六次硬币的实验重复三次,其中就一定有一次的结果是三次正面三次反面呢?答案同样为不一定。
计算均等概率
对于不同的掷硬币次数序列,正面(H)和反面(T)次数相同的几率是多少?无论是在哪个阶段,都是要么正面多,要么反面多,或者正反面次数相同。在任何序列中,掷硬币的次数必须为双数,才可能获得次数相同的正反面结果。
随着掷硬币次数的增加(2、4、6、8……),我们很可能会认为正反面次数相同的几率也会变大。这是对[平均法则]的直觉应用。在这个法则中,人们普遍认为,随着样本规模的增加,结果会越来越接近总体的平均值。简单来说,这就是为什么在下了一周雨后,我们很可能会认为接下来会是晴天。
不过从统计学的观点来看,这不仅是错的,还错得离谱。
在《Taking Chances》一书中,John Haigh探究了在一个独立掷硬币序列中,在任何一点上正反面次数相同的概率。
掷硬币的概率
正面(H)和反面(T)次数相同的概率
掷硬币的次数 2 4 6 8 10
相同的几率 1/2 3/8 5/16 35/128 63/256
概率 50% 37.5% 31.25% 27.34% 24.6%
这些数字中呈现的模式非常反直觉,甚至连最精通数学的人都得看两遍才能相信。根据这些数据,随着掷硬币次数的增加,正反面次数相同的概率实际上降低了。
如果我们掷20次硬币,那么在掷哪一次硬币时,正反面次数在这个序列中最后一次相同?有可能是第2次、第4次、第6次……第16次、第18次或第20次中的任何一次。看着这11个可能的答案,你会选择哪个?最近的那一次?最远的那一次?还是中间的那一次?
很多人会选靠近中间位置的答案,但美国统计学教授David Blackwell发现概率大约从正中间开始完全对称。掷第16次硬币和掷第4次硬币时正反面次数最后一次相同的几率是一样的,第0次和第20次时的几率最高,概率会朝着正中间逐渐递减。
正反面次数最后一次相同的几率
掷20次硬币的序列中,不同时间上正反面次数最后一次相同的几率
正反面次数最后一次相同的时间 0或20 2或18 4或16 6或14 8或12 10
概率 17.62% 9.27% 7.36% 6.55% 6.17% 6.06%
换言之,如果早期没有发生均等的现象,之后可能要等很长时间才会发生。
双方交换领先地位的频率有多高?
对于领先地位的交换频率,我们能从上文中获知什么?下表中是掷101次硬币的序列中正反面领先地位交换次数的概率。
领先地位交换概率
领先地位交换次数 | 概率 |
---|---|
0 | 15.8% |
1 | 15.2% |
2 | 14% |
3 | 12.5% |
4 | 10.7% |
5 | 8.8% |
6 | 6.9% |
7 | 5.2% |
8 | 3.8% |
9 | 2.7% |
10 | 1.8% |
11 | 2.6% |
领先地位交换不超过四次的概率为68%。交换五至九次的概率大约为27%,十次或十次以上的概率仅为4%至5%。
更有趣的是,在序列的下半部分中有一半的时间都未出现均等分数,这意味着,无论哪一面在中点前保持领先,这一面在实验接下来的一半时间中都将继续保持领先。
在体育博彩中运用掷硬币的智慧
现在,希望你已经清楚地看到了它在博彩中的价值。从硬币实验中,我们了解到如果实力相当的选手打比赛,那么通常很长时间都不会发生均等现象,然后可能会接连发生数个均等现象。均等更有可能在比赛开始时或结束时发生,而不是在比赛中点附近出现。
根据Haigh的计算,在实力相当的斯诺克选手之间的比赛中,在16局后领先的选手有50%的几率会一直保持领先,直到32局后。我们能不能进一步在足球博彩中运用相同的逻辑呢?一个联赛中有很多支实力不同的球队;因此,我们必须进行深入的调查研究,才能确认规则是否适用。
当然,不是所有结果都和掷硬币一样清楚明了,因为要考虑很多情况因素,比如[损失规避]比起目标是赢得比赛时,我们在避免失败时会表现得更好。掷硬币是理论实验,但却为体育博彩玩家提供了极其相关的模式。