当前课程知识点:计量经济学 > 1.计量经济学基础 > 1.3-假设检验的一般逻辑 > 1.3 假设检验的一般逻辑
在统计学中
我们学习过
假设检验的知识
计量经济学当中
处处是假设
处处是检验
假设检验
有两种方法
一种是置信区间法
一种是显著性检验法
两者本质上是一样的
下面
我们复习显著性检验法
检验
就是利用样本信息
来推断总体信息
如总体的特征和分布
假设是对总体的
不是对样本的
但总体往往未知
因此
需要在总体中
随机选择样本
显然
样本是波动的
不同的抽样
肯定得到不同的样本
因此
假设检验
要先对总体
进行假设
然后
利用样本信息
再进行检验
利用随机性的样本信息
来推断总体
是有风险的
因为
样本是波动的
因此
推断出的结论
只是概率意义上的
而不是必然的事实
既然是概率意义上的
当然可以认为
小概率事件
一般不会发生
打个比方
我随意向外丢一块石头
结果
打中了一个麻雀
你信吗
检验
是利用样本信息
推断总体信息
怎么推断呢
当然
离不开统计量和分布
统计量
它是一个函数公式
在统计量这个函数公式里面
它含有
来自样本的信息
还含有
来自总体的信息
而统计量
还要求服从
一个所谓的分布
对于连续变量而言
一个分布
必须满足两个条件
第一
这个分布函数
必须在X轴上方
也就是说
函数大于
或者等于零
第二
这个分布函数和X轴
所围成的区域面积
等于1
也就是说
它的无穷积分等于1
对于一个分布而言
存在一个平均值
统计量
对应的临界值
离平均值越远
这个临界值
就越不容易发生
在统计学中
我们学过
未知总体均值的t检验
原假设H0
这是对总体的
假设总体平均身高(为)μ
等于一个具体的数值μ0
然后
随机选取n个同学
测量身高
得到
X₁、X₂(等等到)Xn
计算出
样本身高的平均数和标准差
注意
这些
都是来自样本的信息
下面
需要构建一个统计量
以及统计量的分布
根据数理统计知识
构建了一个t统计量
形式上
是一个函数公式
同学们想想
这个统计量中的
样本平均数和样本标准差
都是来自样本的信息
n是样本数
而μ是来自总体的信息
是未知的
数理统计证明
这个统计量
服从
一个自由度为n-1的t分布
在假设检验时
我们把样本均值和标准差
代入统计量
把关于未知总体的原假设
代入统计量(中)
计算出
一个函数值
我们称为临界值
在t分布当中
对应这个临界值t0
需要判断
这个临界值发生的概率
使用显著性检验法的时候
我们习惯于
用分布当中的阴影部分的面积
表示临界值
发生的可能性
阴影部分的面积
称为P值
同学们想想
如(果)P值越小
这个临界值
是容易发生呢
还是不容易
当然是P值越小
临界值
越不容易发生
通过回顾假设检验的知识
我们想把假设检验的一般逻辑
用图示方式
展示出来
帮助同学们
更好地学习计量经济学
首先
总体特征和分布信息
是未知的
想知道总体
怎么办
当然要对未知总体
进行假设
下一步
就是要检验了
如何检验
在总体当中
随机抽取一个样本
得到样本信息
然后
构建一个
相关的统计量以及其分布
常用的分布有
t分布
正态分布
χ2分布
F分布等等
同学们可能会问
老师
统计量及其分布
怎么构建
这些内容
实际是数理统计的任务
我们只管用
我们将样本的信息
和原假设信息
代入统计量公式
得到临界值
把这个临界值
和这个统计量
所对应的分布
结合起来
得到对应的P值
根据P值的大小
我们对原假设
做出决策
如果P值很小
表示是
小概率事件
不大可能发生
所以
如果在一次试验当中
小概率事件发生了
我们可以拒绝
原假设
否则
我们就接受原假设
下面
我们对假设检验的这个逻辑
做进一步解析
P值很小是多小
不同研究者
有不同的标准
通常
把P值小于10%记为*
P值小于5%记为**
P值小于1%记为***
如(果)P值大于10%
就不能称为很小了
如果P值很小的情况发生了
也就是说
一次抽样检验当中
小概率事件
居然发生了
那我们就要找原因
可能有三个方面的原因
第一
我们的统计量
或者分布出错了吗
这个不用怀疑
这是数理统计论证出来的
不可能出问题
第二
会不会是样本信息
出了问题呢
因为
样本是随机抽取的
小概率事件
在一次实验当中
也不大可能发生
第三
只有一种可能
怀疑原假设
有问题
所以
当P值很小时
我们总是选择拒绝原假设
在这部分学习中
同学们通常有一些疑问
第一
还会纠结
统计量及其分布
是怎么来的呢
好吧
我们回顾一下
在以前学习的知识当中
我们学过
在两个
总体均值的相等性检验中
我们是怎样构建
统计量及其分布的呢
我们是用样本平均数
来构建t统计量及其分布的
而在三个变量
均值相等的检验当中
我们是通过
方差分解
来构建F统计量及其分布的
总而言之
这是数理统计的问题
以后
统计量及其分布的知识
我们只管
把结论拿来使用
不必深究
第二
原假设如何设置
理论上说
我们根据研究需要
来设定
但是
我们还是归纳一下
看看在初级计量经济学当中
是如何设定原假设的
在t检验当中
我们原假设C(i)等于0
在F检验当中
我们的原假设是
所有解释变量的系数
都等于0
在遗漏变量检验中
原假设
是遗漏变量项的系数
等于0
在Wald检验当中
原假设是
系数关系相等
在Chow检验中
设定对应系数项相等
在异方差检验中
原假设为
残差项的方差为常量
在自相关检验中
原假设
为残差的相关系数为0
这些检验
以后都会学习到
但是
我们归纳一下
这些检验当中
原假设有什么样的特点呢
我们发现
我们通常
把确定性的作为原假设
第三
前面讲过
决策规则
当P值很小
我们就
拒绝原假设
P值不是很小
比如
大于5%或者10%
我们就接受原假设
接受原假设好吗
从概率值来看
在大多情况下
原假设都是可接受的
注意
接受原假设并不意味着
原假设是正确的
只是没有找到理由
来拒绝原假设而已
而拒绝原假设
更可信
所以
我们通常
把希望得到结论的反面
作为原假设
这样
拒绝原假设
恰巧证明
我们希望得到的结论
是可靠的
是有充分的
是更有科学价值的
这一点
同学们在后面的学习中
慢慢理解
-1.1-教学构架
--1.1-教学构架
-1.1E-文件、数据、变量与群实验
-1.2 -数据-变量-模型
-1.2E1-窗口与菜单实验
-1.2E2-变量描述统计与显示实验
-1.3-假设检验的一般逻辑
-1.3E-齐性检验与分布检验实验
-第一章 作业
-2.1最小平方法与决策系数
-2.2 CLRM假设条件
-2.3 回归分析
--2.3 回归分析
-2.3E1 回归分析实验
-2.4 回归检验
--2.4 回归检验
-2.4E1 回归检验实验
-2.4E2 回归检验实验
-2.5 预测与分析
-2.5E 预测实验
-第二章 作业
-3.1非线性回归模型的线性化(1)
-3.2非线性回归模型的线性化(2)
-3.2 E非线性化的转换实验
-第三章 作业
-4.1哑变量及设置
-4.2哑变量的回归
-4.3结构稳定性问题
-4.3E哑变量回归实验
-第四章 作业
-5.1异方差概念及其后果
-5.2异方差侦测方法
-5.2E异方差侦测实验
-5.3异方差救治措施
-5.3E异方差救治实验
-第五章 作业
-6.1自相关性及其后果
-6.2自相关性侦测方法
-6.2E自相关性侦测实验
-6.3自相关性救治措施
-6.3E自相关性救治措施实验
-第六章 作业
-7.1多重共线性及其后果
-7.2多重共线性侦测方法
-7.2E多重共线性侦测实验
-7.3多重共线性救治措施
-7.3E多重共线性救治措施实验
-第七章 作业
-8.1模型选择:标准与检验
-8.1E模型选择:检验与实验
-第八章 作业
-课程勘误