当前课程知识点:概率论与数理统计 > 第四周:常见随机变量 > 正态分布 > 4.4 正态分布
正态分布是应用最广泛的概率分布
表达一个随机变量服从正态分布
通常称其为X服从Normal(μ,σ方)
其中μ和σ方是两个参数
μ可以取任意实数
σ则规定大于0
随机变量X的密度函数
是一个比较复杂的指数表达式
其定义域为整个实数域
特别地
当正态分布参数取 μ=0,σ方=1时
称此时的正态分布为标准正态分布
因为标准正态分布非常重要
非常常用
所以人们常常区别与
一般随机变量的密度函数
和分布函数表达
特别地用小写希腊字母
小φ(x)表示其密度函数
用大写希腊字母大Φ(x)
表示其分布函数
正态分布的分布函数
没有显示的解析表达式
因此只能通过
数值计算的方法进行近似
对服从参数为(μ,σ^2)的正态分布随机变量X
可以证明(X-μ)/σ服从标准正态分布
这样一般的
正态分布随机变量
的概率计算都可以转换为
标准正态分布计算
所以只要有了标准正态分布的
分布函数值
就可以很容易的得到
任意正态分布的分布函数值
所以人们编制了
标准正态分布的分布函数表
需要的时候通过查表
即可知道标准正态分布函数值
正态分布的密度函数关于x=μ对称
是典型“钟型”曲线
当x=μ时达到最大值
在其两边密度函数值迅速衰减
主要面积集中在中间部分
具有明显的“中间大
两头小”的特点
由对称性可知μ是分布的均值
观察不同参数的
正态分布的密度函数曲线
可以看到σ越小时
密度函数曲线的峰值越突出
密度函数向两边衰减的速度就越快
而σ越大时
密度函数曲线越为平缓
覆盖的区域更大一些
所以σ表示数据的分散程度
σ越大则数据分布越散开
σ越小则数据分布越集中
标准正态分布的分布函数值Φ(x)
可以通过查表得到
各种计算软件
也提供计算这一函数的命令
这里所列的表
即为部分的标准正态分布的分布函数表
例如,要用到Φ(0.28)的值
则通过查表
在最左侧一列找到0.2
再找8对应的列
得到Φ(0.28)=0.6103
如果计算Φ(0.284)
则取Φ(0.28)和Φ(0.29)
之间的一个适当的数即可
表中只列出
自变量为正数时的分布函数值
如果自变量为负数时
因为标准正态分布
密度函数关于x=0轴对称
所以Φ(-x)等于1减去Φ(x)
Φ(-0.74等于1-Φ(0.74)
等于1减去0.7703等于0.2297
自变量为负的时候
Φ(x)小于0.5
自变量为正的时候Φ(x)大于0.5
自变量为0时Φ(0)=0.5
下面给出更大自变量范围的
标准正态分布函数表
直到x等于3.09
注意到x等于3.09时
分布函数的值已经达到1.0000
已经非常接近于1
对于小数点后面保留4位的函数表
对于更大的x
只能近似为1.0000
已无法再给出更精确的分布函数值
曾经有新闻报导
测定两名围棋少年的智商
1人为140
另1人则高达168
人们惊叹这名智商达到168的少年智力超群
并给予了非常高的期望
我们现在考察一下
智商达到168
到底是一个多么杰出的分数
它意味着什么样的具体的含义
在现代的智力测验中
使用了很多的概率统计观念和工具
一种典型的智商规则是
设定主体人口的平均智商为100
而总的智商服从N(100,15平方)的正态分布
所谓主体人口是要对人群做些限制
如果将婴幼儿也包括进来
他们的智力尚未发育充分
统一在一起考虑是不够合理的
因此提出了一个主体人口的概念
在正态假设下
求智商超出140和168的概率分别是多少
设随机变量X服从正态分布
正态分布的参数是N(100,15平方)
我们要分别计算
X大于140和X大于168的概率
正态分布的概率计算
首先要转换为标准正态分布
然后再利用查表得到
此时(X-100)/15服从标准正态分布
因为15分之(X-100)服从标准正态分布
所以将X大于140的概率
转换为用标准正态分布表达的概率为
15分之(X-100)
大于15分之140减去100的概率
等于15分之(X-100)大于2.67的概率
等于1减去(X-100)/15小于等于2.67的概率
即1减去Φ(2.67)
其中Φ为标准正态分布的分布函数
查表得Φ(2.67)等于0.9962
所以X大于140约为0.0038
这已经是一个很超群的智商了
这个值意味着在1000人中
大约只有4个人的智商会超过140
同理计算X大于168的概率
得到X大于168的概率等于1减去Φ(4.53)
这个值太接近于1
我们给出的4位简表
到Φ(3.09)已经等于1.000
无法再给出更精确的数值了
经过计算软件的计算
我们得到1-Φ(4.53)大约
大约等于2.95乘以10的-6次方
这一结果表明
在100万人中
大约只有3个人的智商会达到或超过168
在现代典型的智力测验中
设定主体人口智商服从正态分布
将平均智商设定为100,即μ=100
若同时要求50%的人
智商集中在90至110之间
其中智商在90-100
和100-110的人各占25%
问σ或σ方应取什么值
智商随机变量服从参数为100
σ^2的正态分布
将此分布变换为σ分之X减100
服从标准正态分布
按题目要求X大于100小于110的概率为0.25
则需要满足标准正态分布
随机变量σ分之X减100在0
和10/σ之间的概率等于0.25
σ分之X减100小于10/σ大于0的概率
等于Φ(10/σ)减去Φ(0)
因为Φ(0)=1/2
所以得到Φ(10/σ)=0.75
查表得到Φ(0.675)=约等于0.75
解出σ=14.8
实际上设定智商分布服从参数为100
15的平方的正态分布
就是希望一半人集中在90-110之间
-随机试验与随机事件
-古典概型
--1.2 古典概型
--第一周:古典概型
-事件间的关系与事件的运算
--第一周:事件间的关系与事件的运算
-两个著名的例子
--第一周:两个著名的例子
-讲义
-条件概率
--2.1 条件概率
--第二周:条件概率
-有关条件概率的三个重要计算公式
--第二周:有关条件概率的三个重要计算公式
-事件的独立性
--第二周:事件的独立性
-应用实例
--2.4 应用实例
--第二周:应用实例
-网球比赛胜率的计算
--Video
-讲义
-随机变量及分布函数
--第三周:随机变量及分布函数
-离散型与连续型随机变量
--第三周:离散型与连续型随机变量
-分布函数的性质与特殊的例子
--第三周:分布函数的性质与特殊的例子
-概率论所需微积分要点回顾
--第三周:概率论所需微积分要点回顾
-讲义
-二项分布与负二项分布
--第四周:二项分布与负二项分布
-泊松分布
--4.2 泊松分布
--第四周:泊松分布
-几何分布与指数分布
--第四周:几何分布与指数分布
-正态分布
--4.4 正态分布
--第四周:正态分布
-讲义
-随机变量函数的分布
--第五周:随机变量函数的分布
-随机变量的数学期望
--第五周:随机变量的数学期望
-随机变量的方差
--第五周:随机变量的方差
-原点矩与中心矩
--第五周:原点矩与中心矩
-期望和方差的一些补充性质
--第五周:期望和方差的一些补充性质
-讲义
-二项分布与泊松分布的期望与方差
--第六周:二项分布与泊松分布的期望与方差
-几何分布的期望与方差
--第六周:几何分布的期望与方差
-均匀、指数和正态分布的期望与方差
--第六周:均匀、指数和正态分布的期望与方差
-随机变量数学期望的应用实例
--第六周:随机变量数学期望的应用实例
-快速排序算法的平均计算量分析
--Video
-讲义
-多维随机变量
-第七周:多维随机变量
-常见多维随机变量举例
--第七周:常见多维随机变量举例
-随机变量的独立性
--第七周:随机变量的独立性
-独立随机变量期望和方差的性质
--第七周:独立随机变量期望和方差的性质
-讲义
-条件分布
--8.1条件分布
--第八周:条件分布
-条件期望
--8.2 条件期望
--第八周:条件期望
-全期望公式(上)
--第八周:全期望公式(上)
-全期望公式(下)
--第八周:全期望公式(下)
-讲义
-随机变量函数的期望
--第九周:随机变量函数的期望
-协方差
--9.2 协方差
--第九周:协方差
-相关系数
-- 9.3 相关系数
--第九周:相关系数
-相关与独立
--第九周:相关与独立
-讲义
-独立随机变量和的分布
--第十周:独立随机变量和的分布
-独立正态分布和的分布
--第十周:独立正态分布和的分布
-最大值、最小值分布
--第十周:最大值、最小值分布
-顺序统计量
--第十周:顺序统计量
-讲义
-正态分布的相关与独立
--第十一周:正态分布的相关与独立
-边缘密度均为正态,联合分布不是二元正态的例子
--第十一周:边缘密度均为正态,联合分布不是二元正态的例子
-二项分布的正态近似
--第十一周:二项分布的正态近似
-正态近似计算实例
--第十一周:正态近似计算实例
-讲义
-大数定律
--12.1大数定律
--第十二周:大数定律
-中心极限定理
--第十二周:中心极限定理
-蒙特卡洛(Monte Carlo)算法
-伪随机数和随机模拟
-讲义
-统计学实例
-总体与样本
-常用统计量
--第十三周:常用统计量
-三种重要的统计分布和分位数
--第十三周:三种重要的统计分布和分位数
-讲义
-参数的矩估计
--第十四周:参数的矩估计
-参数的极大似然估计
--第十四周:参数的极大似然估计
-参数点估计的无偏性和有效性
--第十四周:参数点估计的无偏性和有效性
-参数点估计应用实例
--第十四周:参数点估计应用实例
-讲义
-区间估计的基本思想
--第十五周:区间估计的基本思想
-区间估计的构造方法
--第十五周:区间估计的构造方法
-两个正态总体的区间估计
--第十五周:两个正态总体的区间估计
-大样本置信区间
--第十五周:大样本置信区间
-讲义
-假设检验问题的提示和标准步骤
--第十六周:假设检验问题的提示和标准步骤
-假设检验问题的两类错误和P值
--第十六周:假设检验问题的两类错误和P值
-单个正态总体参数的假设检验
--第十六周:单个正态总体参数的假设检验
-拟合优度检验
--第十六周:拟合优度检验
-讲义
-利用条件概率计算网球比赛胜率
-利用期望的计算性质分析快速排序算法的平均计算量
-讲义
-事件
--事件
-分布函数
--分布函数
-正态
--正态
-指数与二项
--指数与二项
-随机变量函数的分布
-指数分布期望
--指数分布期望
-切比雪夫不等式
--切比雪夫
-二元离散
--二元离散
-协方差
--协方差
-二元特征
--二元特征
-统计量
--统计量
-无偏估计
--无偏估计
-点估计
--点估计
-假设检验
--假设检验
-选择
--选择
-填空
--填空
-大题
--大题