当前课程知识点:管理定量方法 > 第四章 数据的描述与统计推断 > 第九节 概率与随机变量(一) > 第九节 概率与随机变量(一)
同学们 大家好
欢迎来到管理定量方法课程
我是今天的主讲老师 杨老师
第九讲
我们讨论概率
与随机变量的第一部分
这部分内容
我们给大家分成两个问题来讨论
第一 我们讨论概率和随机变量的定义
第二
我们讨论随机变量的概率分布特征
首先我们看看概率和随机变量
概率的概念
来自于一个游戏
1700年左右法国赌场
就有了一种21点的游戏
1931年
当美国内华达州
宣布赌博为合法活动的时候
21点游戏第一次公开出现在
内华达州的赌场俱乐部
15年内它取代了掷骰子游戏
而一举成为非常流行的
赌场庄家参与赌博的游戏
当然 中国很早就有掷骰子
和麻将牌的游戏
这些游戏实际上都是一个概率的问题
那么什么是概率呢
概率
Probability
是指我们研究的某一个特定事件
发生的可能性
这个可能性
是介于0~1之间的一个分数比例
当一个事件不可能发生的时候
它的概率我们设为0
当该事件确定要发生
这个事件的概率设为1
随着人们对事件发生
掌握信息的增加
对事件发生的概率的判断会越准确
那么研究概率的时候
不可能回避的另外的一个概念
叫做随机变量
什么是随机变量呢
当一个概率模型中的事件
发生的结果
可以用数字来表示的时候
我们把这个不确定的量
称之为随机变量
在做管理学研究的过程中
我们会面对两种随机变量
第一种离散型随机变量
第二种连续型随机变量
离散型随机变量
是指样本空间中的事件结果
仅取独立的
可分开的数值
连续的随机变量
是指样本空间中事件发生的结果
可取某一个数值区间内
任何的数值
随机变量能够取得
所有可能的数值列或者是结果
以及相应的概率
是我们研究随机变量的概率的分布特征
这里边我们给大家举一些例子
大家来一起来判断一下
这一类的随机变量是离散型随机变量
还是连续的随机变量
比如
掷骰子的点数
离散型随机变量
明天一天的温度变化
连续随机变量
长虹电视机月销售量
属于离散型随机变量
长虹电视的月销售额
可以用连续型随机变量来表示
美元兑人民币的汇率
可以用连续随机变量来进行表示
随机变量是定义在样本空间中的
一个单值的实函数
一个随机变量不是一个固定的数值
它可能会取不同的数值
有关随机变量的信息
能为决策者提供决策的支持
和建模的基础
下面 我们讨论
离散型随机变量的概率分布特征
对任何的离散型随机变量X
我们可以去求随机变量的概率质量函数
概率质量函数我们用P(x)来表示
随机变量X取值的所有的概率
离散型随机变量的概率分布特征
P(x)有以下的两个基本性质
第一 P(x)肯定是大于等于0的
第二 把所有已知的随机变量的数值
所发生的概率
加总在一起应该等于1
因为它是一个完全可能发生的事件总和
∑p(x)=1
这里我们给大家举一个例子
General Avionics
飞机订单数量的概率分布
General Avionics是一个大型的
商用喷气式飞机的制造商
x表示该公司
第二年飞机订单的数目
每年公司都会针对第二年的
飞机订单数目的概率分布特征
进行一个估计
下表就是飞机制造商
预测第二年的
飞机订单数目的概率分布
我们可以简单地看一看
把每一个订单数量的
概率分布特征加总在一起
正好等于∑p(x)是等于1的
代表了所有样本空间中
事件发生的概率的大小
那么我们把所有的离散型随机变量的
概率分布特征加总在一起
就构造出累计的分布函数
随机变量x取值小于或者等于x的概率
称之为累积分布函数
F(x)等于
probability
( 大x小于等于小x)
就等于所有的事件的概率
加总在一起的概率值
累积分布函数的性质是
F(x)是x的一个非减函数
这是我们做的
General Avionics
飞机订单数量的概率分布图
和累积分布函数的概率分布图
离散型的随机变量的概率分布特征
我们还关心两件事
一 是随机变量的期望值
另外一个就是
随机变量的方差和标准差
概率分布的均值
我们称之为
随机变量的期望值
它可能的结果
等于所有数值概率的一个加权平均
我们可以看到下面的公式
μx代表的是随机变量x的期望值
也可以用E(x)来表示
它就等于每一个事件的数值大小
乘以对应的概率加总在一起
∑x乘以p(x)
当我们求一个复合事件的期望值的时候
有以下的计算方法
对于任意的常数c
E[cX]的期望值
就等于把c提出来
c乘以E[x]
对于任何的一个常数项c
当我们去求E[X+c]的期望值的时候
它就等于 E[x)]加c
对于任意两个随机变量x1和x2
任意的常数c1和c2
我们求期望值
c1X1加上c2X2的期望值
就等于 c1乘以E[x1]
加c2乘以E[x2]
我们在求随机变量的期望值的时候
一定要注意
期望值
不是最可能发生的基本事件
甚至不一定是一个可能的基本事件
如同我们在打高尔夫球的时候
我们希望一球上果岭
当我们在求出一个期望值的距离
和角度的时候
50%的可能性向左偏
50%的可能性向右偏
是否平均而言
我们的球一定能够上果岭
答案是不一定
因为刚才我们谈到
期望值
不是最可能发生的基本事件
甚至在我们的样本空间中
不是一个基本的可能事件
另外 我们还关心
随机变量的方差和标准差
如果假设随机变量x的取值为
x1 x2一直到xn
其对应的概率分别为
p1 p2一直到pn
并且期望值为μx
我们可以求得随机变量x的方差
为σx平方
就等于VAR(X)
就等于∑xi减去μx括起来的平方
乘以对应的概率pi加总在一起
开平方就是随机变量x的标准差
当我们在求一个复合事件的方差
和标准差的时候
有以下的公式可以应用
对任意的常数c
和随机变量x
VAR[cx]就等于cx的方差
就等于把c提出来
但c要加上一个平方
c的平方
乘以VAR[x]
也就是c的平方乘以σx的平方
当随机变量x加上一个常数c
VAR[X+c]
就等于Var[X]
因为常数项的方差等于0
对任意的常数c1和c2
和相互独立的
两个随机变量X1和X2
我们去求
c1乘以x1加c2乘以x2的方差
就等于分别把
c1c2的平方提出来
c1的平方乘以Var[X1]
加上c2的平方乘以Var[X2]
那么关于随机变量的期望
方差和标准差的计算
我们给出来一道例题
请大家思考
Karen是一家金融公司的中层经理
她很希望知道明年的报酬情况
由于得到了竞争对手B公司的聘用函
这家竞争对手B公司
给他提高了20%的工资
另外在原A公司工资的基础之上
增加12,000的奖金
Karen对现在A公司
明年会给她的报酬
有如下表格的一个概率估计
请问Karen如何来评估跳槽与否的风险
如果我们用x表示现在A公司明年给她的工资
可计算出 x的期望值E(x)
和x的方差标准差
VAR(x)和σ(x)
如果Karen加入竞争对手B公司
则她的工资为Y
就等于1.2乘以x+12,000
然后我们可以分别来计算
Y的期望值E[Y]
和Y的方差标准差VAR(Y)和σy
我们比较期望值
方差和标准差的结果
自然可以得到答案
以上是我们讨论的
关于随机变量的方差和标准差
以及期望值的大小
那么在我们实际的建模过程中
可能对我们影响比较大的
是第二个问题
我们要讨论的是
常用的离散型随机变量的
概率分布特征
和常用的连续型随机变量的
概率分布特征
我们先讨论
常用的离散型随机变量的
概率分布特征
主要讨论两类
一类是二项式分布
一类是泊松分布
什么是二项式分布
二项式分布
用来计算n个独立的实验的成功
或者失败的次数
其中每次实验的成功概率
我们设为p
也就是说
随机变量发生的结果只有两类
一类是成功
一类是失败
这里我们要强调一下
二项式分布
一般应用于稀疏的问题
也就是事件发生的次数
不多的情况之下
对离散型随机变量
进行概率分布特征的估计
比如说
某批产品中次品数量的估计
投掷50次硬币出现正面的次数
其分类主要是成功或失败
正面或反面
消费者买还是不买
那么如何去估计
二项式分布概率的函数呢
统计学家研究出来
如果X是一个随机变量
服从二项式分布
样本容量为n
事件发生的概率为p
当 p(x)等于小x的时候
那么它的概率分布特征的函数
就等于 cnx乘以px次
再乘以1减p的n减x次
这就是二项式分布概率函数的估计公式
cnx是一个组合公式
从N次随机实验中抽取X个结果
泊松分布是用来计算
某段时间内或某空间内
出现某特定事件的次数
泊松分布是用来计算
某段时间内或某空间内
出现某特定事件的次数
比如一个小时内到达的顾客数目
两个小时内呼叫中心
接听电话的呼叫次数
17寸LED显示屏上的坏点个数等等
泊松分布的概率质量函数的估计
x为成功的次数
λ是每单位时间段内成功的次数
比如说
每小时顾客到达的数量
t为时间的长度
比如说三个小时
这里我们给出
泊松分布的估计公式
大x就等于x的概率
等于X的阶乘分之λ
乘以t的x次方
乘以e的负λt次方
这里的λ
为泊松分布的均值μ
或者叫做期望值
泊松分布的方差是λt
根号下λt为标准差
这就是泊松分布的基本概念
好 这节课我们就上到这里
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题