• 首页>
  • GMAT考试>
  • 正态分布的前世(三)——三种分布(卡方分布、t分布和f分布)

正态分布的前世(三)——三种分布(卡方分布、t分布和f分布)

2024-03-12 15:42:55来源:西游留学网作者:浮夸 阅读量:9016

20世纪以前,统计学处理的数据一般是大量自然收集的,基于拉普拉斯中心极限定理,总是使用正态回归的方法。

到了19世纪末,数据和正规的适应性不佳也备受关注,

进入20世纪后,人工实验条件下所得数据的统计分析问题越来越受到重视。

正态分布的前世(三)——三种分布(卡方分布、t分布和f分布)

由于实验数据量有限,依赖近似正态分布的传统方法开始引起人们的疑问,人们开始研究这种情况下的精确统计方法问题。

在这样的背景下,统计学三大分布2分布、t分布、f分布登上了历史舞台。

这三大分布是数理统计所需的知识点。

这三种分布都与英国现代数理统计学的三位大神有关

2分布最先发现该分布的其实是物理学家麦克斯韦。 他在推导空气分子运动速度分布时发现,分子速度在三个坐标轴上的分量呈正态分布,而分子运动速度的平方v^2符合自由度为3的2分布。

麦克斯韦发现了这种分布,但真正完善并传播他的是皮尔森。

没错,在数据挖掘中经常出现的就是那个皮尔森相关系数的人。

分布曲线和数据拟合优度检验2分布是一个利器。

而且皮尔森的这项工作被认为是假说验证的开山之作。

皮尔森在统计学上的研究非常深入,在19世纪末到20世纪初的很长一段时间里,他一直是数理统计的领导者。

t分布戈塞特( W.S.Gosset )的笔名是大家熟悉的学生( Student ),他发现的是t分布。

戈赛特是化学、数学双学位,依靠自己的化学知识进入酿酒厂,工作中考虑酿酒配方实验的统计学问题,跟随卡尔皮尔森学习了一年统计学,最终依靠自己的数学知识制作了t分布,在青史上留名。

1908年,戈赛特提出了正态样品中样品均值与标准差之比的分布,给出了第一个在应用中极为重要的分布表。

戈赛特的t分布工作是小样本统计学的先驱。

f分布是分布费舍尔( R.A.Fisher ),为了纪念费舍尔,使用了他名字的首字母。

这三人中费舍尔的才能最高,在费舍尔的统计上造诣非常高,在高斯的启发下,系统地创立了最大似然估计法。 该理论目前在统计学参数估计中最有用。

费舍尔还没有出名。 皮尔森已经是统计学的泰斗。 两人年龄相差33岁,但戈塞特在他们之间。

三人在统计学上不可避免地会有切磋的见解。

费舍尔天赋极高,年轻有为。 皮尔森很强势,固执己见,难免会大肆欺凌。 费舍尔真的被皮尔森骂得很厉害。

戈赛特性格温和,总是两个人之间和谐相处。

还是长江后浪推前浪,新的一代换旧人,许多擂台赛费舍尔都有过人的身手,最终取代皮尔森成为数理统计学的第一剑客。

由于这三大剑客和统计三大分布的出现,正态分布在数理统计学中已不再是孤家寡人,数理统计的领土基本上被这三大分布夺去了半壁江山。

但是,这对正态分布来说并不是坏事。 让我们来看看这三个分布的数学细节。 假设独立随机变量

这三大分布都来源于正态分布,当初是从正态分布切入进行研究的。

有统计学三大分布的加持,正态分布是数理统计学的独领风骚。

统计学这三大牛成为现代数理统计学的奠基人。

以戈赛特为先锋,以费舍尔为主将,掀起了一场小样本理论的革命,实际上提高了正态分布在统计学中的地位。

在数理统计学中,除了以正态分布为基础的小样本理论取得了空前的胜利外,其他分布中没有成功的例子,这不得不让人对正态分布刮目相看。

在此后的发展过程中,相关回归分析、多元分析、方差分析、因子分析、布朗运动、高斯过程等多种统计分析方法相继出现在历史舞台上,这些与正态分布密切相关的方法,成为推动现代统计学快速发展的强大动力。

当然正态分布还有更吸引人的数学性质。 我们可以享受以下乐趣:

相关文章

热门文章