• 精选
  • 会员

高斯与曼德尔布罗特

2025年1月4日  来源:黑天鹅 作者:纳西姆·尼古拉斯·塔勒布 提供人:goulun70......

2001年12月,我从奥斯陆去苏黎世,在法兰克福机场转机。

我在机场有足够的空闲时间,这是我尝一尝欧洲黑巧克力的大好机会,尤其是我成功地说服自己在机场消费的卡路里是不算数的。收银员找给我一张10德国马克的纸币。德国马克不久后就会退出流通,因为欧洲改用欧元。我把它作为一种告别纪念保留。欧元诞生之前,欧洲有许多种货币,这对印刷商、货币兑换商,当然还有我这样的外汇交易商来说是好事。当我吃着我的欧洲黑巧克力,若有所思地看着这张纸币时,差一点噎着。我突然发现,而且首次发现,它上面有一样很有意思的东西。这张纸币上印着高斯的头像以及他的高斯钟形曲线。

这是极度的讽刺,因为与德国货币最不相关的就是这一曲线:马克在20世纪20年代的短短几年间从1美元兑换4马克变为1美元兑换4万亿马克,这告诉你钟形曲线在描述汇率变动的随机性时毫无意义。只需要一次这种情况就能让你抛弃钟形曲线——只要一次,你只需要想一想它的后果。但这张纸币上印着钟形曲线,旁边是高斯博士,长相平庸,有一点严厉,显然不是我想与之在阳台上一起消磨时光、喝茴香酒、漫无边际地闲聊的那一类人。

真是令人震惊,钟形曲线竟然成为风险管理工具,被监管者和穿深色西服、以乏味的方式谈论货币的中央银行人员使用。

上面印着高斯的头像,他的左边是平均斯坦的钟形曲线。

图15–1 最后的10德国马克纸币

减少中的增加

高斯的主要理论是,大部分观察结果集中在中等水平附近,也就是平均值附近;随着对平均值的远离,偏离平均值的可能性下降得越来越快(呈指数下降)。假如必须以一句话来表示这一理论,那就是:随着偏离中心(也就是平均值),可能性的下降速度便急剧增长。下面的数字显示了这一点。我以一个高斯变量为例,例如身高(将它作了简化,使演示更清楚),假设平均身高(男人及女人)是1.67米。我把一个偏离单位定义为10厘米。然后我们在1.67米之上逐渐增加高度,并考虑人们身高为这个高度的可能性。 [50]

比平均值高10厘米(即高于1.77米):6.3分之一

比平均值高20厘米(即高于1.87米):44分之一

比平均值高30厘米(即高于1.97米):740分之一

比平均值高40厘米(即高于2.07米):32 000分之一

比平均值高50厘米(即高于2.17米):3 500 000分之一

比平均值高60厘米(即高于2.27米):1 000 000000分之一

比平均值高70厘米(即高于2.37米):780 000000 000分之一

比平均值高80厘米(即高于2.47米):1 600 000000 000 000分之一

比平均值高90厘米(即高于2.57米):8 900 000000 000 000 000分之一

比平均值高100厘米(即高于2.67米):130 000000 000 000 000 000 000分之一

比平均值高110厘米(即高于2.77米):36 000000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000 000000 000 000 000 000 000 000 000分之一

我相信,在22个偏离单位之后,也就是比平均值高出220厘米,可能性会变为一个古戈尔分之一(古戈尔是1后面加100个零)。

一系列数字的目的在于表现出加速。看看比平均值分别高出60厘米和70厘米的情形:只增加了10厘米,就从10亿分之一变为7800亿分之一!从70厘米增加到80厘米时,就从7 800亿分之一变成1 600万亿分之一! [51]

这种急剧下降的概率使你能够忽视意外。只有一种曲线能描述这种下降,那就是钟形曲线(以及它的非突破性同胞)。

曼德尔布罗特分布

作为比较,下面看看在欧洲成为富人的可能性。假设这里的财富具有突破性,也就是满足曼德尔布罗特分布。(这不是对欧洲财富的准确描述,只是为了简化突出突破性分布的原理。) [52]

突破性财富分布

净资产高于100万欧元:62.5分之一

高于200万欧元:250分之一

高于400万欧元:1 000分之一

高于800万欧元:4 000分之一

高于1 600万欧元:16 000分之一

高于3 200万欧元:64 000分之一

高于32 000万欧元:6 400 000分之一

这里概率下降的速度是固定的(或者没有下降)!金额每翻一倍,概率变为原来的1/4,不管金额是多大,不管是800万欧元还是1600万欧元。简而言之,这就是平均斯坦和极端斯坦的区别。

回忆一下第三章对突破性和非突破性的比较。突破性意味着没有阻力使你慢下来。

当然,曼德尔布罗特的极端斯坦可以有多种形式。比如财富极度集中的极端斯坦——如果财富翻番,概率只降低一半。结果在数量上会与上面的例子大不相同,但符合相同的逻辑。

极不公平的财富分形分布

净资产高于100万欧元:63分之一

高于200万欧元:125分之一

高于400万欧元:250分之一

高于800万欧元:500分之一

高于1 600万欧元:1 000分之一

高于3 200万欧元:2 000分之一

高于32 000万欧元:20 000分之一

高于64 000万欧元:40 000分之一

在高斯分布中,我们会看到下面的结果。

高斯分布的财富分配

净资产高于100万欧元:63分之一

高于200万欧元:127 000分之一

高于300万欧元:14 000 000 000分之一

高于400万欧元:886 000 000 000 000000分之一

高于800万欧元:16 000 000 000 000000 000 000 000 000 000 000分之一

高于1 600万欧元:……我的任何一台电脑都无法进行这项计算

我想用这些数字定性地说明两类分布的不同。第二种是具有突破性的,它的变化不受阻力。请注意,突破性的另一个叫法是幂律。只是知道我们处于一个幂律环境并不能让我们获得很多信息。为什么?因为我们必须计算现实生活中的参数,这比在高斯框架下困难得多。只有高斯分布能够很快显现出特性。我的建议就是只把它当做看待世界的一般方法,而不是精确的解决办法。

记住什么

记住:高斯钟形曲线都受到一种阻力,使偏离平均值的概率下降得越来越快,突破性分布或者曼德尔布罗特分布则不受这种限制。这基本上就是你需要知道的。 [53]

不平均

让我们更近距离地观察不平均的本质。在高斯框架下,随着离差的扩大,不平均程度降低,因为概率在加速降低。在突破性框架下不是这样:不平均程度保持不变。超级富人中的不平均与中等富人中的不平均程度是一样的,它没有缓和。 [54]

想想下面的例子。从美国人群中随机挑选两个年收入加起来为100万美元的人。他们分别的收入最可能是多少?在平均斯坦,最可能的组合是各50万美元。在极端斯坦,最可能的是5万美元与95万美元。

这种倾斜在图书销量中更为明显。如果我告诉你两位作者的书一共销售100万册,最可能的情况是一位作者的书销售了99.3万册,另一位的销售了7000册。这种情况比每位作者分别销售50万册的可能性大得多。对于大的总数,其构成会越来越不对称。

为什么是这样呢?用身高问题对比一下。如果我告诉你两个人的身高加总为4米,你会认为最可能的情况是两人各2米,而不是一人1米,一人3米;甚至也不是一人1.5米,一人2.5米!身高高于2.5米的人几乎没有,所以这种组合不太可能。

极端斯坦与80/20法则

你听说过80/20法则吗?它是一种标志性的幂律,实际上幂律的发现正是从它开始的。当时维尔弗雷多·帕累托观察到意大利80%的土地被20%的人占有。有人运用这一法则指出,80%的工作由20%的人完成;或者80%的工作只产生20%的结果,反之亦然。

从数学公理上讲,这一法则的表述不一定是最令你吃惊的:它可以很容易地被改称为50/01法则,也就是50%的工作由1%的人完成。它使得世界看上去更加不公平,但这两个法则其实是完全一样的。为什么?假如存在不平均,那么在80/20法则的那20%当中也存在不平均,即少数人完成大多数工作。其最终结果是,大约1%的人完成稍稍超过50%的工作。

80/20法则只是比喻的说法,它并不是法则,更不是严格的规律。在美国出版业,分配比例更可能是97/20(也就是97%的图书销量来自20%的作者)。如果只看非虚构类作品,情况更严重(8000种图书中的20种占据一半的销量)。

请注意,这并非完全来自不确定性。某些情况有80/20的集中度,但同时具有可预测性,这使人们很容易作决策,因为你可以事前确定那重要的20%在哪里。这些情况很容易控制。例如,马尔科姆·格拉德威尔在《纽约客》的一篇文章中写道,对囚犯的大部分虐待行为出自极少数邪恶的狱警。把这些狱警清除掉,虐囚率就会大大下降。(相反,在出版业,你不会事先知道哪本书能赚大钱。战争也是,你不会事先知道哪场战争会威胁大量地球居民。)

小草与大树

我将在此总结并重申本书此前提出的观点。由于钟形曲线的不确定性计量方法忽视了跳跃性或者不连续变化发生的可能性及影响,因此无法适用于极端斯坦。使用它们,就好像只看见小草,而看不见参天大树。虽然发生不可预测的大离差的可能性很小,但我们不能把它们当做意外而置之不理,因为它们的累积影响如此强大。

传统的高斯方法只关注平均水平,把意外当做附属问题。我们还有另一种方法,它把意外当做起点,把平均水平当做附属问题。

我已经强调过,有两种不同的随机性,它们具有本质的不同,就像空气与水。一种不关心极端情况,另一种受到极端情况的严重影响;一种不会产生黑天鹅,一种会。我们讨论气体与讨论液体不能使用同一种方法。即使能,也不能把这种方法称为“近似”。一种气体不可能与一种液体“近似”。

对于最大值不会与平均值相差太大的变量,高斯方法对我们很有用。如果数量受到向下的拉力,或者如果存在物理上限,使得非常大的数值不会出现,那么我们在平均斯坦。如果存在强大的均衡力量,使得当情况偏离均衡时会被迅速拉回来,你也可以使用高斯方法。否则,请忘记它。这就是为什么大量经济学研究以均衡概念为基础:别的好处不说,它起码使你能够把经济现象当做高斯变量处理。

请注意,我并不是在告诉你平均斯坦的随机性不会产生某种极端情况,而是说它们很少发生,加起来也不会有重大影响。这些极端情况的影响小得可怜,而且随着总体的增大而下降。

更专业的说法是,如果存在巨人和侏儒,二者之间的差异达到几个数量级,你仍然可能处于平均斯坦。为什么?假设你以1000个人为样本,其中既包含侏儒也包含巨人。你可能会在样本中看到许多巨人,而不是极少数巨人。你的平均值不会受到额外增加的一个巨人的影响,因为你预期到巨人是样本的一部分,所以你的平均值会比较高。也就是说,最大观测值不会偏离平均值太远。平均值总会涵盖两类人——巨人与侏儒,所以两者都不会太罕见,除非在极少数情况下遇到超级巨人或超小侏儒,那将是一个偏离单位较大的平均斯坦。

请再次注意如下原则:事件越稀有,我们对其概率估计的错误越大,即使使用高斯方法。

让我为你展示高斯钟形曲线如何把随机性从生活中抹去,这正是它流行的原因。我们喜欢它,因为它带来了确定性!怎么做到的呢?通过平均化,我将在下面讨论。

咖啡杯会跳起来吗

第三章对平均斯坦的讨论中提到,个体不可能对总体产生影响。随着总体规模的增加,这一特点越来越强。平均值会越来越稳定,所有样本都是相似的。

我一生中喝过许多杯咖啡(它是我最上瘾的东西)。我从未遇到杯子从桌上跳起两英尺的情况,咖啡也从来没有自动从杯子里流到这份书稿上。要想发生这类情况,需要的可不仅仅是对咖啡上瘾。它可能需要超过人们想象的时间才会发生,概率太小了,是1后面加上许多零分之一,我用全部的业余时间可能都写不完这个数字。

但从物理上讲,我的咖啡杯是可能跳跃的,这是非常低的可能性,但仍是可能的。粒子一直在跳跃。但为什么由跳跃的粒子组成的咖啡杯本身不跳呢?原因很简单,要让杯子跳起来,必须所有粒子向同一个方向跳跃,并且连续这样同步跳几次(同时导致桌子向相反方向移动)。我的咖啡杯的数万亿粒子不可能同时向一个方向跳;在宇宙的整个历史中这种情况也不会发生一次。所以我可以安全地把咖啡杯放在写字台的边缘,去操心更严重的不确定性来源。

安全的咖啡杯演示了高斯变量的随机性是可以通过平均来消除的。如果我的咖啡杯是一个大粒子,或者能够表现为一个大粒子,那么它的跳跃就是一个问题。但我的杯子是由数万亿非常小的粒子组成的整体。

在平均斯坦,随着样本规模的增大,观测到的平均值越来越稳定,在图中可以看到,分布越来越窄。这就是一切统计理论的工作原理(或者所谓的工作原理)。平均斯坦的不确 定性在平均化之下消失。这就是人们常说的“大数定理”。

图15–2 大数定理的原理

赌场经营者非常明白这一点,这就是他们从不亏本的原因(如果经营得当的话)。他们不让赌徒下大注,而是喜欢让许多赌徒下很多受限制的小注。赌徒的总赌注可能有2000万美元,但你不需要为赌场担心:每注平均可能只有20美元;赌场对最大赌注设了上限,赌场老板晚上可以安心睡觉。所以赌场收入的变化会小到可笑的地步,不管总赌注有多大。你永远不会看到谁带着10亿美元离开赌场,在宇宙的整个历史中都看不到。

上面的例子就是平均斯坦最高法则的应用:当你有大量赌徒时,单个赌徒对总体只可能造成微弱的影响。

其结果就是,对高斯变量平均值的偏离,或者“误差”,不会造成麻烦。它们很小,可以忽略。它们只是在平均值附近做温和的波动。

爱上确定性

如果你在大学上过(无聊的)统计课,不明白教授为什么兴奋,不知道“标准差”是什么意思,不要担心。标准差的概念在平均斯坦以外毫无意义。假如你上过审美神经生物学或者殖民地时期之后的非洲舞蹈课程,这显然对你更有好处,也更具娱乐性。从经验主义的角度,这一点很容易看出来。

高斯变量之外不存在标准差,即使存在,也无关紧要,并且说明不了什么。但事情却变得更糟了。高斯变量家族(有许多朋友和亲戚,比如泊松分布)是唯一能用标准差(以及平均值)描述的分布。你不再需要别的东西了。钟形曲线满足了那些容易上当的人对简化论的需求。

还有一些在高斯世界之外没有或没有重大意义的概念:相关性,以及(更糟糕的)回归。它们在我们的方法中根深蒂固,在商业谈话中不听到“相关性”这个词是很难的。

要想了解相关性在平均斯坦以外多么没有意义,只需要看一看涉及两个极端斯坦变量的历史序列,比如债券和股市,或者两只股票的价格,或者美国儿童图书销量变化和中国化肥产量,或者纽约房地产价格和蒙古股市收益率。计算这些成对变量在不同子期间的相关性,比如1994年、1995年、1996年,等等。计算结果很可能表现出严重的不稳定性,它取决于计算的期间。但人们谈论相关性时仿佛它是某种真实确定的东西,把它实际化、具体化,赋予它物理属性。

同样的具体性假象也会影响所谓的“标准”差。选取任何价格或价值的历史序列,将之分割为子序列,计算“标准”差。奇怪吗?每个子序列会有一个不同的“标准”差。那为什么人们还要谈标准差呢?想想吧。

请注意,正如叙述谬误一样,当你拿过去数据计算出单一的相关性或标准差时,你忽略了它们的不稳定性。

怎样制造灾难

如果你使用“统计显著性”这种说法,请小心它所带来的确定性假象。人们有可能把观测误差当做满足高斯分布来处理,而这要求它必须来自高斯环境,比如平均斯坦。

为了看清高斯方法的误用多么普遍以及危害多么大,请看一部由多产作家、大法官理查德·波斯纳(RichardPosner)撰写的(无聊的)书《大灾难》(Catastrophe )。波斯纳哀叹公务员对随机性的误解,建议政府的政策制定者向经济学家学习统计学。法官波斯纳看上去正在努力制造灾难。尽管属于应该多花时间读书而不是写书的人,他还是有可能成为具有洞察力的、深刻的、原创的思想家。和许多人一样,他只是不知道平均斯坦和极端斯坦的区别,他相信统计学是“科学”,而不是骗局。假如你碰到他,请告诉他。

如涉及版权,请著作权人与本网站联系,删除或支付费用事宜。

0000