万书网 > 文学作品 > 人生新算法 > 1.6 递降分布统治社会之谜

1.6 递降分布统治社会之谜




这种普遍性递降的统计分布是深入理解人类行为、社会及经济现象的关键。下面我将具体介绍一下这个重要的统计分布曲线。

在统计学中,以正态分布——“吊钟形”分布居多(图  1-2)。其特点是,以平均值为中心,两侧(高于平均值和低于平均值)的曲线左右对称。

图  1-2  正态分布(泊松分布)和  U  分布的比较。正态分布呈吊钟形,以平均值为中心,两侧(高于平均值和低于平均值)的曲线左右对称。U  分布是逐渐下降的曲线分布。半对数线图则呈一条直线分布。

我们来举一个正态分布的实例。掷了几次骰子后,点数的平均值是多少?假设我们掷了  5  次骰子,点数依次为  3→5→1→6→1,那么  3+5+1+6+1=16,16÷5=3.2,平均值就是  3.2。如果我们反复掷多组,每组还是掷  5  次,虽然得出的平均值各不相同,但结果均以  3.5  为中心(骰子点数的平均值是  3.5)上下波动。这就是正态分布。掷  5  次骰子得到的平均值大多都接近  3.5,很少会出现像  1  或  6  这样偏离  3.5  的数值。因为想让平均值为  1,就必须每次都掷出点数  1,而这是极其偶然的情况。

在统计学的相关书籍中,很多书的内容都是以正态分布为前提的。想必许多人都认为,世界上大部分现象都可以用正态分布表示,其余的情况都是例外——“正态”这个名称本身就包含了这层意思。

但是,在现实社会中,大数据的统计分布大多为递降的  U  分布。在这一分布中,当变量为  0  时频率最高,随着变量的增大,频率会逐渐降低。并且,正态分布与  U  分布的形状差别很大,前者呈吊钟形,后者呈递降曲线(章末注  2)。

我们该如何理解这一现象?难道只是碰巧变成了一条递降曲线?我查阅了许多书籍和文献,都没有找到人类行为呈递降分布这一规律的原因。每次见到统计学和物理学界的学者,我都会问:“为什么统计学中用正态分布进行研究,而物理现象用递降分布研究呢?”明明是基本的问题,却几乎没有人能回答上来(唯一明确回答我的,是巴西统计物理学界的权威康斯坦丁诺·查理斯教授。他的回答令我深受启发,在此也向他表示感谢)。很长一段时间以来,我的眼前仿佛烟雾弥漫,一片模糊。但是最近我通过模拟和解析,终于找出了让人心悦诚服的答案,眼前也顿时云开雾散,一片清明。

“反复之力”,是一种我们平时没有感知到的力量。通过研究,我渐渐看到了这种力量是如何撼动整个社会的。