当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.5 Estimation
我们接着讨论rct的estimation它的估算
假设我们成功的做完一个实验了
这个时间做得很成功
我们也采纳了
我们要的 outcome的数据
我们怎么来去估算rct的结果
显然我们可以用最简单的方法非常直观
就是来比较 treatment group跟
control group
这两组人它们在outcome上的差值
是不是根据 rct的整个这样的一个模型的setup
它就是我们的ate Y1i减去Y0i的期望值
就是我们的平均处理效应
因为我们只要前面的设计是正确的
我们的实验实施是严谨的
那么我们最后观测的这两组人的outcome的差值
就是 treatment effect
这个就是简单做一个均值比较就可以了
当然我们做均值比较是要做t检验的
不是只报一个
这个点估计除此之外
我们还可以用什么方法
我们是不是还可以跑一个回归
对吧
大家也预习了
那么显然我们跑一个回归
这个里面的唯一的自变量就是我们的分组变量Di
那么它的系数它的系数就是我们要的平均处理效应
它这个系数等于t检验里面均值的差值它是完全相等的
大家我们下节课的workshop的时候也会带大家
再去看一下
那么这个是完全等价的
那么既然等价的话
显然做t检验更简单直观
为什么我要跑回归
为什么要跑回归
是不是
因为在回归方程里面我们还可以加入协变量
我听到咱们小组讨论里面有同学对协变量这个概念纠结了
很久
协变量covariance
协变量
它可以指所有的变量
所有的自变量
但是当我们这里面有明确的这个研究感兴趣的变量
key variable of interest在这里是
Di的时候
我们也往往把剩下的变量叫做协变量
也就是我们的控制变量 x也是能够影响到y的一些
外生的解释变量
我们为什么要加协变量
我们要讨论的时候同学讨论过这个问题
大家想我加了协变量之后
谁会变小
是不是残差会变小
因为如果我不加协变量
这一部分如果我不加协变量
那么 x它就会放在残差里面
是不是
如果我把协变量提出来
残差delta它就会减小
是不是
残差的方差减小
我们会有什么好处
是不是
我们就会因此所有的参数的标准误就会减小
我们是不是就增加了power
是不是
这是非常好的
所以说即便我们的分组相当的平均两组人没有任何地在
统计上显著差异
我们也是非常希望加入一些重要的协变量
能够增加power
这个是很重要的
当然你这个协变量是不是不能加这个
treatment结束 treatment的
实施过程中以及结束之后的一些变量
它只能加 treatment之前的变量
是不是
这个要考虑到
好
有没有什么问题
问题
我们来看一个例子
这个也是书上的例子
我们来看一下
这个就是简单的t检验
t检验的均值之差是4.899
它的 T统计量是2.9
那么我们跑一个一元的回归
那么唯一的自变量就是这个分组变量
我们会发现确实分组变量voucher的系数
beta1
它的估算值跟前面t检验是一模一样的
就是完全一样的
当我们加入一个控制变量前测成绩的时候
加入前测成绩的时候
我们可以发现大家在讨论的时候你们也讨论起来
R^2是不是首先会变大
R^2从之前的0.016一下子跳到多少
42%
40.2%是不是
R^2的变化是非常大的
提高了我们整个模型的拟合优度
而且什么
Residual的方差是不是减小了
从19减到了14
因此我们可以看到什么
我们可以看到我们感兴趣的变量beta1
它的标准误也从1.68降到多少
降到1.2
对吧
1.26
那么这个就是我们刚才说的 power会变大
这个就是因为标准误会减小
那么来看这个值本身这个值之前是4.8
现在是4.1
那么它是不是有一点点的不一样
还是有一些变化的
是不是
那么这个变化你怎么去判断呢
你认为这个变化是一个很巨大的变化
还是一个不太大的一个扰动
那么我们要有个判断
就是说这个结果是不是consistent
它是不是一致的
那么这个要靠什么
要靠整个值的大小以及它跟标准误的这样的一个相对关系
来看
那么对于标准误是1.6的这样的一个一个参数的值
如果它的值本身降低了
比如说0.7,0.8
对于1.6的标准物来讲还不是太大
所以我们还是可以接受
认为它还是一个一致性的估计
比较稳定的估计
如果从4.8一开始降到了
比如说2
这个时候这个变化就特别大了
是不是
大家想如果产生这样的变化是什么原因造成的
是不是就说明我们认为它外生的变量voucher
分组变量
它可能不是一个外生变量
至少它跟 pre achievement
它是相关的
是不是才会造成加入一个变量
使得系数发生非常巨大的变化
这个时候就可能出现问题了
我们就要仔细的分析了
好
有没有问题
没有问题
我们再来探讨两个概念
Validity在这里
它跟测量学里面的效度不是一个概念
在测量学里面的效度
它包括比如说内容效度
结构效度
效标效度
它是对我们测量工具的性质的一系列的考核
但是在定量研究里面
那么效度它一般是特指两种
一个是外部效度
一个是内部效度
外部效度是说我们的分析的结果是否能够
generalize
能够推广到整个population也外部效度
那么外部效度大家想是由什么因素来决定的
刚才我们提到的整个实验的实施
外部效度是不是跟我们抽样的方法是不是等等都是有关的
如果你的抽样有代表性的
那么外部效度就会高一些
那么你抽样没有代表性
你的外部效度就会低一些
这主要是由抽样来去决定
那么内部效度是什么呢
内部效度是说因为我的模型的设计和实施
而使得我得出来的结论就能够作为 treatment
effect的一个无偏的估计
它是在内部逻辑上能够去很好的支撑这样的一个结论
这个就是内部效度
那么内部效度大家想会受哪些因素的影响
内部效度它也受很多因素的影响
比如说我们这个实验实施的是不是很成功
对不对
我们 treatment它是不是到位
等等
那么它其实都会影响到内部效度
那么我们会专门来讨论
在实施过程中哪些因素会威胁到我们的效度
那么相信大家在阅读中都读到了这样的一些可能带来的
威胁
我看大家讨论中也讨论的比较清楚
我们在这里就不花太多的时间来说了
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM