万书网 > 文学作品 > 你有你的计划,世界另有计划 > 总有一种力量让我们回归平均

总有一种力量让我们回归平均




以前所有人都认为因果是天经地义的东西,但100多年以前,统计学家们搞了一次革命,从此认为科学知识里根本就没什么因果……

统计学上有个非常经典的概念叫作“回归平均”,它在生活中有各种应用,但是至今仍然有很多体面的人因为不懂这个概念而犯错。

这个概念,你想必已经听说过,但我们这里要从一个更高的角度来讲。

这一切还得从举世罕见的聪明人、学术多面手、人类学家、著名的种族主义者、发明家、统计学的祖师爷、达尔文(Darwin  )的表弟、弗朗西斯•高尔顿(FrancisGalton  )先生讲起。

高尔顿的困惑

1877年,高尔顿在英国皇家科学院做了一个演示报告。皇家科学院的报告传统真是让人心驰神往——听众都是各方牛人,正装出席,报告人不用PPT  ,而是面向观众,就像变魔术一样  ,一  边演示实验一边侃侃而谈,内容都是对大自然的最新揭秘。

高尔顿这次演示的东西,被后世称为“高尔顿板”。它是一个平板,下部有很多垂直的槽,槽上面是一些排列成三角形的小隔挡。

让一个小球从最上方掉下去,它会经历各个隔挡的阻碍,最终落到一个竖槽里。每个小球在进入竖槽之前的运动都是随机的,但当我们放了很多小球之后,它们就会在竖槽上呈现一个明显有规律的分布,如右图所示。  [1]

这当然就是正态分布。高尔顿板演示的是人的遗传。比如身高和智商,可能受多个遗传因素的影响——类似高尔顿板上的隔挡,这些因素综合起来一起作用,结果就一定是正态分布。事实上人的身高和智商的确就是正态分布,即身高特别高和特别矮的人都很少。

正态分布不是新闻。高尔顿这个报告的真正剧情还在后面。他说如果我在竖槽下面再放上一些隔挡,隔挡下面再放上第二排竖槽,如右图  [2]  所示,那会是什么样的情景?

这就模拟了两代人的身高。第一排,也就是竖槽A  ,代表第一代人的身高分布,即正态分布。那么第一代人再遗传一次,到达竖槽B  ,会是什么分布?

不论是理论推导还是实验演示,第二排竖槽里的小球都呈现一个更宽广的正态分布。我们在《标准差和人生哲学》一文中讲过“标准差”的概念,竖槽B  的标准差更大,如下图所示。

(回报率的可能性)



这意味着每一代人身高的标准差会越来越大,也就是身高特别高和特别矮的人应该一代代越来越多才对。

可是真实世界根本就不是这样。真实世界里一代代人的身高标准差都是一样的。

我再换个说法你就更明白了。假设现在有一批身高特别高的人,他们处在第一代正态分布曲线的右侧边缘地带。如果他们生的孩子的身高是在他们的身高基础上进一步随机演化,那么其中应该有一半人的身高比父辈高。如此说来,第二代人身高的边界,应该比第一代更宽才对。

但事实并非如此。真实世界里牛人的第二代并没有一半的机会比牛人强——第二代好像普遍比第一代弱。高尔顿考察了605个英国名人,发现这些名人的儿子们,普遍不如名人自己有名。

这个规律好像还无处不在。比如姚明特别高,他的妻子也非常高,我们可以想象姚明的女儿肯定也会很高——但是根据高尔顿发现的规律,姚明女儿的身高将不会像姚明那么高。最可能的结果,是她会稍微矮一点。

高尔顿把这个现象叫作“回归平庸”。第一代出类拔萃,占据了正态分布曲线边缘的位置;第二代则普遍没有接着开疆拓土,甚至连第一代的优势都没保住,反而都往曲线的中间“回归”。

高尔顿不得不把高尔顿板做了一个改进,把一些竖槽变成斜槽,才能体现这个“回归”,如右图所示。  [3]

可这斜槽代表什么呢?难道说冥冥之中有一种力量让我们回归平庸吗?

高尔顿的解释

有些问题值得思考10多年。一直到1889年,高尔顿才把这件事情想明白。

高尔顿意识到,根本就没什么特殊力量。

他考察英国男子的身高和手臂之间的关系,发现特别高的人手臂也都很长——但是他们的手臂并不是最长的。这就好像最聪明的父亲没有生出最聪明的儿子一样。手臂相对于身高,也出现了回归平庸。

父亲跟儿子之间也许有因果关系,身高跟手臂之间似乎不太可能有因果关系。

更进一步,父亲相对于儿子,也有一个回归平庸!如果你先看儿子身高,那些最高的儿子,他们的父亲的身高也不是最高的。显然儿子身高并不能决定父亲的身高,这个关系肯定不是因果关系!

高尔顿把这种关系叫“相关”。这就是“相关性”这个概念的起源。

高尔顿是第一个意识到“相关不是因果”的人。

儿子出生的时候父亲已经成年了,儿子身高总不可能影响父亲的身高,所以绝对不可能有一种什么神秘力量,决定了从儿子到父亲的回归平庸。

今天我们管这个现象叫“回归平均”(regressiontowardthemean  )。

回归平均

丹尼尔•卡尼曼在《思考,快与慢》里,

对回归平均有个很好的解释。想要理解回归平均,你得理解下面这两个公式:

成功=天赋+运气

大成功=多一点点天赋+很多好运气

你得承认运气的作用。

具体到身高来说,我们的身高有一部分是直接继承了父母的基因,还有一部分是遗传基因的排列组合以及跟环境的相互作用影响到基因表达,这些过程中有一些运气的成分。

高个父亲不但有好基因,而且有好运气。基因可以遗传,可是运气不能遗传。好运气总是非常罕见的,所以大概率下,儿子不会有那么好的运气——所以儿子的身高就不如父亲。

这就好比说如果父亲的财富很大一部分是来自买彩票中的大奖,我们就容易理解,儿子将来不会像父亲一样有钱。中国有句话叫“富不过三代”,其实并不见得是第二代和第三代从小骄奢淫逸不会赚钱了,可能仅仅是因为第一代的好运气是不可继承的。

所以回归平均其实就是一个简单的统计学现象,本质原因是小概率事件不会一再发生——这里面并没有什么神秘力量。

这个现象是如此简单,但是这个知识并没有普及!今天仍然有很多人在犯高尔顿1877年的那个错误,他们见到回归平均,总觉得背后一定有一个缘故。

回归平均种种

一个电影大获成功,于是就出了续集。可是续集的票房往往不如第一部高,这是为什么呢?很多人就说续集没那么好看,都是为了赚钱的狗尾续貂!

其实不一定。用回归平均完全可以解释为什么好电影的续集往往不好。第一部电影之所以大受欢迎,是因为它运气好。好运气总是稀少的,第二部电影没那么好的运气,自然票房平庸。其实票房平庸很正常,第一部大获成功才不正常。

再比如,NBA  新秀如果第一年表现非常好,第二年不行了,人们就会说他是不是骄傲自满了,成了名不好好努力了。

其实不一定。第一年表现好很可能是因为运气好,正好赶上跟队友关系好比赛打得顺手;而好运气不可持续是大概率的情况,所以第二年表现不好很正常——这跟他自己本人怎么努力没关系。

我最喜欢的一个例子还是卡尼曼讲的。

有一次卡尼曼给以色列空军办讲座。卡尼曼讲到心理学,说你要想让你的学员进步,一定要多正面鼓励,不要去骂他们。心理学家有充分的证据证明,正面鼓励比打骂有效得多。

这时候有一个教官表示不同意。他跟卡尼曼说,我的经验可不是这样。如果一个飞行员有一天飞得特别好,我当场表扬他、鼓励他了,他第二天往往飞得没那么好。可是如果一个人飞得特别差,我骂他一顿,他第二天果然就飞得没那么差了。这不就说明,表扬没用,打骂有用吗?

卡尼曼一时语塞!他后来才想明白这个事,这其实是回归平均。

飞得特别好这种事情并不容易发生,你表扬或者不表扬他,他下一次飞也会回归平均,会没那么好。飞得特别不好也是小概率事件,你批评或者不批评他,他下一次飞也会回归平均,会没那么差。在回归平均这个大趋势面前,表扬固然没有立竿见影的作用,批评的作用其实也是错觉。

reasoncause

说到这儿我想辨析两个英文单词:“reason  ”和“cause  ”。这两个词的意思差不多都是原因,但是你细品的话,会发现它们有重大区别。

所谓reason  ,是说对这件事的解释。比如你问我某个电影的续集为什么票房不高,我说这是回归平均,这个事儿有一个解释。

而cause  ,则是导致这件事的另一件事。你现在为什么感到有点饿,因为你没吃早饭。cause  就是“因果关系”里的那个“因”,我们这里统一翻译成“缘故”。

为什么高个父亲的儿子往往没有他高?这件事有个解释,但是没有缘故——没有一个神秘力量导致儿子的身高变矮,这纯粹是个统计学现象。

为什么你买彩票中了大奖?这有一个解释——总会有人中大奖,这次碰巧是你。但是没有缘故——并不是因为你昨天做好事帮助孤寡老人,导致你今天中了大奖。

世界上有些事儿,是无缘无故发生的。

高尔顿终于意识到回归平庸这个现象根本就没有cause  。他意识到1877年的自己犯了一个以为什么事儿都有缘故的错误,他的因果惯性思维害了他。

高尔顿痛定思痛,干脆认为,世界上一切事物都没有因果!后来高尔顿的徒弟,叫卡尔•皮尔逊(KarlPearson  ),把这个思想发展壮大了。

皮尔逊坚定地认为,科学的世界里只有相关没有因果。那这个思想是不是从一个极端又走向了另一个极端呢?



第一条守则,是不要欺骗你自己——而你自己是最容易被你骗的人。

—理查德•费曼《别闹了,费曼先生》

[更多精品好书请访问haobook.org]