当前课程知识点:概率论与数理统计 > 第二章 随机变量及其概率分布 > 第3节 连续型随机变量 > 2.3.3 正态分布
大家好
上一节我们讨论了均匀分布和指数分布
这一节我们来学习常见的连续型随机变量的
另一种重要分布
正态分布
若连续型随机变量𝑋具有概率密度
𝑓(𝑥)等于根号2𝜋 𝜎
分之一
𝑒的负的2倍的𝜎²分之
(𝑥−𝜇)²的平方,𝑥大于负无穷小于正无穷
其中参数𝜎大于0
𝜇为任意的实数,则称随机变量𝑋
服从参数为𝜇和𝜎²的正态分布
或高斯分布,记为
𝑋~𝑁(𝜇,𝜎²)
正态分布的分布函数为概率密度
从负无穷到𝑥的积分,等于
根号2𝜋 𝜎分之一
负无穷到𝑥, 𝑒的负的2倍的𝜎²分之
𝑡−𝜇的平方d𝑡
这样积分
由于这个积分不是简单的初等函数积分
所以,对于正态分布的分布函数
没有明确的解析式
常常表示为上式的积分形式
正态分布的概率密度函数
一定满足两条基本性质
性质1,概率密度函数一定是非负的
由正态分布概率密度的解析式
这一点是显然的
性质2,可以验证概率密度
从负无穷到正无穷的积分
一定等于1
也就是根号2𝜋 𝜎
分之一,负无穷到正无穷
𝑒的负的2倍的𝜎²分之
𝑥−𝜇的平方,这样的一个积分
一定等于1
正态分布是概率论和数理统计中
最常用也是最重要的分布
比如,同龄人的身高或体重
农作物的产量和株高,各种产品的质量指标
如零件的尺寸及纤维的强度和张力
射击目标的水平或者垂直偏差
信号的噪音等等,都服从或
近似服从正态分布
下面我们来讨论正态分布密度曲线的特征
由正态分布密度函数的解析式可知
概率密度曲线的几何图形为
以𝑥等于𝜇为对称轴的中间高两边低的
钟型曲线的这样一个形状
从图形可以看出
概率密度曲线在𝜇点左边是单调增加的
在𝜇点右边是单调减小的
因此,第一个特征
概率密度在𝑥等于𝜇
这一点达到极大值
而且极大值为根号
2𝜋 𝜎分之一
概率密度在𝜇
两边变化是对称的
因此第二个特征,概率密度关于
𝑥等于𝜇是对称的
第三
当𝑥趋向于正负无穷时
概率密度函数以𝑥轴为渐近线
第四,𝑥等于𝜇加减𝜎
为概率密度的两个拐点
也就是正态分布的概率密度
左右是有凹凸性变化的
好,由于参数𝜇为概率密度曲线的对称轴
那么当𝜇参数变化的时候
密度曲线会随着𝜇的变化
只是在𝑥轴左右平移
因此,𝜇参数变化时
概率密度曲线的形状不变
参数𝜇决定曲线的对称轴和位置
好,下边我们来讨论参数𝜎
当𝜎减小的时候
概率密度的极大值
𝜎在分母,极大值
反而增大
拐点为𝜇加减𝜎
𝜎变小拐点会靠近𝜇
这个时候的密度曲线会变得陡峭
𝑋在𝜇附近取值的概率就会变大
也就是说
𝑋在𝜇附近取值就比较集中
反之
当𝜎增大的时候
概率密度的极大值反而减小
拐点远离𝜇,这个时候的曲线
会变得平缓
说明随机变量𝑋在𝜇附近
取值的概率会变小
𝑋在𝜇附近取值就比较
分散
因此参数𝜎实际上决定
了曲线的陡峭程度
反映了随机变量在𝜇附近
取值的一个集中程度
下面我们来看正态分布曲线图形
第一个图是𝜎不变
𝜇给了两个参数
曲线只是位置和对称轴发生了变化
第二个图是𝜇不变
𝜎给了三个参数
𝜎等于0.5时
曲线最陡峭
𝜎等于4时
曲线较平缓
好,对于正态分布参数𝜇和
𝜎²取不同值时
对应不同的正态分布
在各种形式的正态分布中
特别地,当𝜇等于0
𝜎²等于1时
大𝑁(0,1)就称为标准正态分布
标准正态分布的概率密度
我们会特别地记成小𝜑(𝑥)
等于根号2𝜋分之一,𝑒的负的
2分之𝑥²,𝑥从负无穷到正无穷
标准正态分布的参数𝜇等于0
因此,概率密度曲线是关于𝑦对称的
中间高两边低的钟形曲线
它是一个特别的正态分布
对称轴
𝜇等于0
标准正态分布的分布函数
会相应地写成大𝛷(𝑥)
等于根号2𝜋分之一
从负无穷到𝑥,𝑒的负的二分之𝑡方
d𝑡这样一个积分,𝑥从负无穷
到正无穷,分布函数就是概率密度函数
从负无穷到𝑥的积分
分布函数
是概率密度函数的积分
它的几何意义就是图形中概率密度曲线
和𝑥轴围成的
𝑥这一点左边的这样一个面积
这是它的几何意义
好,下边关于标准正态分布
我们来看几个重要的特征
第一
概率密度函数小𝜑(𝑥)
在𝑥等于0这一点达到了极大值
在0的左边是单增的
0的
右边是单减的
达到极大值,极大值为根号2𝜋分之一
第二点
小𝜑(𝑥)就是概率密度
关于𝑦轴对称
由𝜑(−𝑥)等于𝜑(𝑥)
小𝜑(−𝑥)等于小𝜑(𝑥)
第三点
标准正态分布的概率密度从负无穷
到正无穷积分一定等于1
它的几何意义就是整个密度曲线和
𝑥轴围成的整个的面积为1
第四个特征
我们看看分布函数
大𝛷(−𝑥)
按照分布函数的几何意义,大𝛷(−𝑥)
就是概率密度从负无穷到负𝑥
这个区间段内的积分
也就是−𝑥这一点
左边的面积大𝛷(−𝑥)
由于概率密度的对称性
负𝑥左边的面积和
𝑥这一点右边的面积是相等的
所以,𝑥这一点右边的面积也为大𝛷(−𝑥)
而𝑥这一点左边的面积,刚刚提过
𝑥这一点左边的面积是大𝛷(𝑥)
整个的面积是1
那么右边𝑥这一点
右边的面积又可以写成
1减大𝛷(𝑥)
𝑥这一点右边的面积
既为大𝛷(−𝑥)又为1减大𝛷(𝑥)
因此,我们就会有大𝛷(−𝑥)就
等于1减大𝛷(𝑥)
我们就会有这样一个
很重要的这么一个公式
说明分布函数跟概率密度不一样
分布函数不具有对称性
那么由分布函数这样一个几何意义
实际上我们很显然,大𝛷(0)代表的
就是0这一点左边的面积
那么就等于,由于对称性整个面积是一
所以0这一点左边的面积一定是0.5
所以𝛷(0)一定是等于0.5的
好,对于标准正态分布
我们会有标准正态分布表,任意随机事件的概率
都可以查标准正态分布表得到
那么接下来我们讨论的是一般正态分布
如何转化为
标准正态分布的概率计算
若𝑋服从参数
为𝜇和𝜎²这样一个一般正态分布
则𝑌等于𝜎分之𝑋−𝜇
一定服从标准正态分布
为了说明这个结论
下边我们求一求随机变量𝑌的分布函数
𝑌的分布函数
我们把它记为大𝐹_𝑌 (𝑦)
它就代表着𝑌随机变量的分布函数
由定义
它就等于大𝑌小于等于小𝑦的概率
把大𝑌换成𝜎分之𝑋−𝜇
进一步我们就会整理为大𝑋
小于等于𝜎倍的𝑦+𝜇的概率
这个概率
可以用𝑋的概率密度积分来求得
它等于𝑋的概率密度积分的
上限是𝜎𝑦+𝜇
下限是负无穷
也就是𝑋的概率密度从负无穷到𝜎𝑦+𝜇的
这样一个积分
对于这个积分可以做变换
令𝑢等于𝜎分之𝑥−𝜇
则𝑥等于
𝜎倍的𝑢加𝜇
d𝑥就等于𝜎倍的d𝑢
把它们带入上式
我们就会得到随机变量𝑌的
分布函数为根号2𝜋分之一
从负无穷到𝑦,𝑒的负的二分之𝑢²
d𝑢这个积分
这个积分恰好为
标准正态分布概率密度积分,积分上限
为𝑦,因此这个积分
就等于标准正态分布函数
在𝑦这一点的函数值
说明,随机变量𝑌的分布函数是
标准正态分布的分布函数
也就是
𝑌等于𝜎分之𝑋−𝜇
服从标准正态分布
即,任意一般正态分布都可以做如上的
线性变换,转化为标准正态分布
这样我们对于大𝑋小于等于𝑥
这样的概率,也就是这样的
一般正态分布的概率计算问题
我们都可以将不等号两边同时减𝜇
比上𝜎
由于𝜎分之大𝑋减𝜇
服从标准正态分布
所以这个概率就可以用
标准正态分布来表示
等于标准正态分布函数在小𝑥减𝜇
比𝜎,这一点的函数值
这就说明一般正态分布的概率计算
都可以转换为标准正态分布的
概率计算问题
例如
如果随机变量服从的是参数为2
和0.5方这样一个一般正态分布
求下边三个随机事件的概率
大𝑋小于2.22的概率
两边同时减𝜇比𝜎
左边
我带入符号
不等号的右边代入具体的数据
那么大𝑋减𝜇比𝜎就是一个
标准正态分布随机变量
这个概率就等于标准正态分布在
右端点的这个函数值
就等于大𝛷(0.44)
通过查标准正态分布表等于0.67
而大𝑋大于2.11
同理
两边同时减𝜇比𝜎
左边,不等号的左边是符号
右边是具体的数据
那么这个概率就等于
1−𝛷(0.22),0.22
就是右边这个数据
通过查标准正态分布表
那么这个概率等于0.413,类似的
当𝑋大于2.11小于2.22
不等号两边同时减𝜇比𝜎
中间是符号
两边是具体的数据
这样形式的概率就等于标准正态分布
在两端点的函数差
也就等于大𝛷(0.44)减去𝛷(0.22)
通过查表
那会等于0.0829
下面我们来看另一个例题
若随机变量𝑋服从一般正态分布
𝑘大于0
求大𝑋减𝜇的绝对值小于𝑘倍的
𝜎的概率等于多少
这个概率,首先我们把它去绝对值符号
那它就等于大𝑋减𝜇大于负𝑘倍的
𝜎,小于𝑘倍的
𝜎
不等号两边同时比上𝜎
就等于大𝑋减𝜇比𝜎
大于负𝑘小于𝑘的概率
这个概率用标准正态分布函数表示为
大𝛷(𝑘)减大 𝛷(−𝑘)
由于标准正态分布大𝛷(−𝑘)是等于
1减大𝛷(𝑘),因此等于2倍的大𝛷(𝑘)− 1
所以,大𝑋减𝜇的绝对值小于𝑘倍的
𝜎的概率就等于
二倍的
大𝛷(𝑘)− 1
和𝑘有关
我们分别取𝑘等于1,𝑘等于2
𝑘等于3,三种情况带入查标准正态分布表
我们就会得到
0.6827,0.9545,0.9973
这样三个概率值
其中𝑘等于3时
大𝑋减𝜇的绝对值小于
3倍的𝜎的概率
它就等于大𝑋大于𝜇−3σ
小于𝜇+3σ的
概率,等于0.9973
接近于1这个概率
这个概率可以解释为随机变量
𝑋取值在以𝜇为中心
以3倍的𝜎为半径这个领域
这个邻域内取值的概率是0.9973
说明正态分布随机变量取值
大部分集中在𝜇的3𝜎领域内
也就是在一次试验中
随机变量𝑋落在𝜇的3𝜎领域内
几乎是肯定的
这也是正态分布的另一特征
常称为正态分布的3𝜎原则
这一节我们主要讲了一般正态分布和
标准正态分布的概率密度函数和
分布函数
讨论了一般正态分布,分布密度曲线的特征
讨论了标准正态分布,分布密度
函数和分布函数的性质
一般的正态分布可通过线性变换化为
标准正态分布,用标准正态分布函数值
计算
一般正态分布随机变量取值的概率
正态分布是概率论和数理统计中
最常用也是最重要的分布
好,今天就到这里
谢谢大家
-第1节 随机事件
--1.1 作业
-第2节 概率的定义和性质
--1.2 作业
-第3节 古典概型与几何概型
--1.3 作业
-第4节 条件概率
--1.4 作业
-第5节 随机事件的独立性
--1.5 作业
-本章测试
--第一章测试
-第1节 随机变量与分布函数
--2.1 作业
-第2节 离散型随机变量
--2.2 作业
-第3节 连续型随机变量
--2.3 作业
-第4节 随机变量函数的分布
--2.4 作业
-本章测试
--第二章测试
-第1节 二维随机向量及其分布函数
--3.1 作业
-第2节 二维离散型随机向量
--3.2 作业
-第3节 二维连续型随机向量
--3.3 作业
-第4节 条件分布与随机变量的独立性
--3.4 作业
-第5节 随机向量函数的分布
--3.5 作业
-本章测试
--第三章测试
-第1节 数学期望
--4.1 作业
-第2节 方差
--4.2 作业
-第3节 协方差和相关系数
--4.3 作业
-第4节 矩和协方差矩阵
-本章测试
--第四章测试
-第1节 大数定律
--5.1 作业
-第2节 中心极限定理
--5.2.2 De Moivre-Laplace 中心极限定理
--5.2 作业
-本章测试
--第五章测试
-第1节 数理统计的基本问题
-第2节 总体、样本和统计量
--6.2 作业
-第3节 抽样分布
--6.3 抽样分布
--6.3 作业
-第4节 抽样分布定理
--6.4 作业
-本章测试
--第六章测试
-第1节 参数点估计
--7.1 作业
-第2节 区间估计
--7.2 作业
-第3节 非正态总计参数的区间估计
--7.3 作业
-本章测试
--第七章测试
-第1节 假设检验的基本概念
--8.1 作业
-第2节 正态总体参数的假设检验
--8.2 作业
-第3节 非正态总体参数的假设检验
-本章测试
--第八章测试
-期末考试