这种普遍性递降的统计分布是深入理解人类行为、社会及经济现象的关键。下面我将具体介绍一下这个重要的统计分布曲线。
在统计学中,以正态分布——“吊钟形”分布居多(图 1-2)。其特点是,以平均值为中心,两侧(高于平均值和低于平均值)的曲线左右对称。
图 1-2 正态分布(泊松分布)和 U 分布的比较。正态分布呈吊钟形,以平均值为中心,两侧(高于平均值和低于平均值)的曲线左右对称。U 分布是逐渐下降的曲线分布。半对数线图则呈一条直线分布。
我们来举一个正态分布的实例。掷了几次骰子后,点数的平均值是多少?假设我们掷了 5 次骰子,点数依次为 3→5→1→6→1,那么 3+5+1+6+1=16,16÷5=3.2,平均值就是 3.2。如果我们反复掷多组,每组还是掷 5 次,虽然得出的平均值各不相同,但结果均以 3.5 为中心(骰子点数的平均值是 3.5)上下波动。这就是正态分布。掷 5 次骰子得到的平均值大多都接近 3.5,很少会出现像 1 或 6 这样偏离 3.5 的数值。因为想让平均值为 1,就必须每次都掷出点数 1,而这是极其偶然的情况。
在统计学的相关书籍中,很多书的内容都是以正态分布为前提的。想必许多人都认为,世界上大部分现象都可以用正态分布表示,其余的情况都是例外——“正态”这个名称本身就包含了这层意思。
但是,在现实社会中,大数据的统计分布大多为递降的 U 分布。在这一分布中,当变量为 0 时频率最高,随着变量的增大,频率会逐渐降低。并且,正态分布与 U 分布的形状差别很大,前者呈吊钟形,后者呈递降曲线(章末注 2)。
我们该如何理解这一现象?难道只是碰巧变成了一条递降曲线?我查阅了许多书籍和文献,都没有找到人类行为呈递降分布这一规律的原因。每次见到统计学和物理学界的学者,我都会问:“为什么统计学中用正态分布进行研究,而物理现象用递降分布研究呢?”明明是基本的问题,却几乎没有人能回答上来(唯一明确回答我的,是巴西统计物理学界的权威康斯坦丁诺·查理斯教授。他的回答令我深受启发,在此也向他表示感谢)。很长一段时间以来,我的眼前仿佛烟雾弥漫,一片模糊。但是最近我通过模拟和解析,终于找出了让人心悦诚服的答案,眼前也顿时云开雾散,一片清明。
“反复之力”,是一种我们平时没有感知到的力量。通过研究,我渐渐看到了这种力量是如何撼动整个社会的。