什么是正态分布?知道了有什么用?

2024-03-12 11:42:55来源:西游留学网作者:阿轩 阅读量:11120

什么是正态分布? 正态分布( Normal Distribution )又称高斯分布,表示概率的分布情况,是统计学中的重要概念。

在科学理论不太发达的过去,早期的科学家们首先从观察事物现象入手,试图发现、记录、总结、归纳,最后抽象出背后的规律。

什么是正态分布?知道了有什么用?

如果观察数据或样本集涉及“平均”和“偏差”,则它们的出现频率往往描绘为以下曲线:

图为百度百科

图表的横轴表示样本值,纵轴是与某个样本值对应的出现概率,其中,该曲线为正态分布曲线。

看这个图形,正规曲线以x=(平均数所在的位置)为中心左右对称地呈“时钟”的形状。

曲线无限接近横轴,合成的面积为1,表示所有样本出现的概率之和为100%。

用数学语言画出这条曲线,

公式包含两个参数:期望(平均数)和标准差。

也经常用更简单化的形式来解释什么是正态分布。 n(,^2); 表示分布的集中趋势,横轴上越接近的值出现概率越高; ^2(方差)表示数据分布的离散度,越大,数据分布越分散,曲线越“矮子”。

实际上,包括生成制造、科学实验、部分自然界现象在内的许多变量的分布接近正态分布。 例如,一个小组的身高和脚的大小,我每天上班所需的时间,一个班所有学生的语文成绩等。

这样的规律的出现是因为上述样本根据大量的随机变量重复“实验”。 我每天都在上班=重复,另一方面,地铁是否挤得坐不下两趟,我是否在手机上坐过站,在走的两个路口是否遇到了红灯还是绿灯等变量=随机。

其背后的理论支撑被称为中心极限定理(对数学史感兴趣的朋友可以点击n重伯努利实验进一步了解)。

知道什么是正态分布,对我们有什么用呢?

试着在现实生活中重复“上班时间”等随机事件,记录每个情况的出现次数,统计频率并作图(在Excel中很容易实现)。 请检查一下那个形状是否接近正态分布。

在你积累了足够的数据,出现了某种“神秘”的规律特征之后,未发生的事件有很大的概率落入可靠区间。

读到这里,我想你大概明白了什么是正态分布,可以在生活中发现它的存在,并利用它来“预测未来”。

相关文章

热门文章