一、正态分布，熟悉的陌生人

学过基础统计学的同学大都对正态分布非常熟悉。这个钟型的分布曲线不但形状优雅，其密度函数写成数学表达式

也非常具有数学的美感。其标准化后的概率密度函数

更加的简洁漂亮,两个最重要的数学常量π

【正态分布曲线】

正态分布又通常被称为高斯分布，在科学领域，冠名权那是一个很高的荣誉。早年去过德国的兄弟们还会发现，德国的钢镚和10马克的纸币上都留有高斯的头像和正态密度曲线。正态分布被冠名高斯分布，我们也容易认为是高斯发现了正态分布，其实不然，不过高斯对于正态分布的历史地位的确立是起到了决定性的作用。

【德国马克上的高斯头像和正态分布曲线】

正态曲线虽然看上去很美，却不是一拍脑袋就能想到的。我们在本科学习数理统计的时候，课本一上来介绍正态分布就给出密度分布函数，却从来不说明这个分布函数是通过什么原理推导出来的。所以我一直搞不明白数学家当年是怎么找到这个概率分布曲线的，又是怎么发现随机误差服从这个奇妙的分布的。我们在实践中大量的使用正态分布，却对这个分布的来龙去脉知之甚少，正态分布真是让人感觉既熟悉又陌生。直到我读研究生的时候，我的导师给我介绍了陈希儒院士的《数理统计学简史》这本书，看了之后才了解了正态分布曲线从发现到被人们重视进而广泛应用，也是经过了几百年的历史。

正态分布的这段历史是很精彩的，我们通过讲一系列的故事来揭开她的神秘面纱。

二、邂逅，正态曲线的首次发现

第一个故事和概率论的发展密切相关，主角是棣莫弗(De Moivre)和拉普拉斯(Laplace)。拉普拉斯是个大科学家，被称为法国的牛顿；棣莫弗名气可能不算很大，不过大家应该都熟悉这个名字，因为我们在高中数学学复数的时候我们都学过棣莫弗定理

(cosθ+isinθ)n=cos(nθ)+isin(nθ)(cos⁡θ+isin⁡θ)n=cos⁡(nθ)+isin⁡(nθ).

古典概率论发源于赌博，惠更斯、帕斯卡、费马、贝努利都是古典概率的奠基人，他们那会研究的概率问题大都来自赌桌上，最早的概率论问题是赌徒梅累在1654年向帕斯卡提出的如何分赌金的问题。统计学中的总体均值之所以被称为期望(Expectation)，就是源自惠更斯、帕斯卡这些人研究平均情况下一个赌徒在赌桌上可以期望自己赢得多少钱。


棣莫弗(De Moivre)	拉普拉斯 (Laplace)

有一天一个哥们，也许是个赌徒，向棣莫弗提了一个和赌博相关的一个问题：A,B两人在赌场里赌博，A,B各自的获胜概率是p

问题并不复杂，本质上是一个二项分布，最后求出的理论结果是

2npqb(n,p,np),

其中

b(n,p,i)=(ni)piqn−i

是常见的二项概率。但是对具体的n

与此相关联的另一个问题，是遵从二项分布的随机变量X∼B(n,p)

对于p=12

n!∼2πn−−−√(ne)n

1733年，棣莫弗很快利用斯特林公式进行计算并取得了重要的进展。考虑n

b(i)=b(n,12,i)=(ni)(12)n

通过斯特林公式做一些简单的计算容易得到，

b(n2)∼2πn−−−√ ⇒ b(n2+d)b(n2)∼exp(−2d2n).

于是有

b(n2+d)∼22πn−−−√exp(−2d2n).

使用上式的结果，并在二项概率累加求和的过程中近似的使用定积分代替求和，很容易就能得到

P (∣∣∣ X n - 1 2 ∣∣∣ \leq c n--\sqrt )

转载于:https://www.cnblogs.com/nucdy/p/6343617.html

你可能感兴趣的文章