3.5 Estimation慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

我们接着讨论rct的estimation它的估算

假设我们成功的做完一个实验了

这个时间做得很成功

我们也采纳了

我们要的 outcome的数据

我们怎么来去估算rct的结果

显然我们可以用最简单的方法非常直观

就是来比较 treatment group跟

control group

这两组人它们在outcome上的差值

是不是根据 rct的整个这样的一个模型的setup

它就是我们的ate Y1i减去Y0i的期望值

就是我们的平均处理效应

因为我们只要前面的设计是正确的

我们的实验实施是严谨的

那么我们最后观测的这两组人的outcome的差值

就是 treatment effect

这个就是简单做一个均值比较就可以了

当然我们做均值比较是要做t检验的

不是只报一个

这个点估计除此之外

我们还可以用什么方法

我们是不是还可以跑一个回归

对吧

大家也预习了

那么显然我们跑一个回归

这个里面的唯一的自变量就是我们的分组变量Di

那么它的系数它的系数就是我们要的平均处理效应

它这个系数等于t检验里面均值的差值它是完全相等的

大家我们下节课的workshop的时候也会带大家

再去看一下

那么这个是完全等价的

那么既然等价的话

显然做t检验更简单直观

为什么我要跑回归

为什么要跑回归

是不是

因为在回归方程里面我们还可以加入协变量

我听到咱们小组讨论里面有同学对协变量这个概念纠结了

很久

协变量covariance

协变量

它可以指所有的变量

所有的自变量

但是当我们这里面有明确的这个研究感兴趣的变量

key variable of interest在这里是

Di的时候

我们也往往把剩下的变量叫做协变量

也就是我们的控制变量 x也是能够影响到y的一些

外生的解释变量

我们为什么要加协变量

我们要讨论的时候同学讨论过这个问题

大家想我加了协变量之后

谁会变小

是不是残差会变小

因为如果我不加协变量

这一部分如果我不加协变量

那么 x它就会放在残差里面

是不是

如果我把协变量提出来

残差delta它就会减小

是不是

残差的方差减小

我们会有什么好处

是不是

我们就会因此所有的参数的标准误就会减小

我们是不是就增加了power

是不是

这是非常好的

所以说即便我们的分组相当的平均两组人没有任何地在

统计上显著差异

我们也是非常希望加入一些重要的协变量

能够增加power

这个是很重要的

当然你这个协变量是不是不能加这个

treatment结束 treatment的

实施过程中以及结束之后的一些变量

它只能加 treatment之前的变量

是不是

这个要考虑到

好

有没有什么问题

问题

我们来看一个例子

这个也是书上的例子

我们来看一下

这个就是简单的t检验

t检验的均值之差是4.899

它的 T统计量是2.9

那么我们跑一个一元的回归

那么唯一的自变量就是这个分组变量

我们会发现确实分组变量voucher的系数

beta1

它的估算值跟前面t检验是一模一样的

就是完全一样的

当我们加入一个控制变量前测成绩的时候

加入前测成绩的时候

我们可以发现大家在讨论的时候你们也讨论起来

R^2是不是首先会变大

R^2从之前的0.016一下子跳到多少

42%

40.2%是不是

R^2的变化是非常大的

提高了我们整个模型的拟合优度

而且什么

Residual的方差是不是减小了

从19减到了14

因此我们可以看到什么

我们可以看到我们感兴趣的变量beta1

它的标准误也从1.68降到多少

降到1.2

对吧

1.26

那么这个就是我们刚才说的 power会变大

这个就是因为标准误会减小

那么来看这个值本身这个值之前是4.8

现在是4.1

那么它是不是有一点点的不一样

还是有一些变化的

是不是

那么这个变化你怎么去判断呢

你认为这个变化是一个很巨大的变化

还是一个不太大的一个扰动

那么我们要有个判断

就是说这个结果是不是consistent

它是不是一致的

那么这个要靠什么

要靠整个值的大小以及它跟标准误的这样的一个相对关系

来看

那么对于标准误是1.6的这样的一个一个参数的值

如果它的值本身降低了

比如说0.7,0.8

对于1.6的标准物来讲还不是太大

所以我们还是可以接受

认为它还是一个一致性的估计

比较稳定的估计

如果从4.8一开始降到了

比如说2

这个时候这个变化就特别大了

是不是

大家想如果产生这样的变化是什么原因造成的

是不是就说明我们认为它外生的变量voucher

分组变量

它可能不是一个外生变量

至少它跟 pre achievement

它是相关的

是不是才会造成加入一个变量

使得系数发生非常巨大的变化

这个时候就可能出现问题了

我们就要仔细的分析了

好

有没有问题

没有问题

我们再来探讨两个概念

Validity在这里

它跟测量学里面的效度不是一个概念

在测量学里面的效度

它包括比如说内容效度

结构效度

效标效度

它是对我们测量工具的性质的一系列的考核

但是在定量研究里面

那么效度它一般是特指两种

一个是外部效度

一个是内部效度

外部效度是说我们的分析的结果是否能够

generalize

能够推广到整个population也外部效度

那么外部效度大家想是由什么因素来决定的

刚才我们提到的整个实验的实施

外部效度是不是跟我们抽样的方法是不是等等都是有关的

如果你的抽样有代表性的

那么外部效度就会高一些

那么你抽样没有代表性

你的外部效度就会低一些

这主要是由抽样来去决定

那么内部效度是什么呢

内部效度是说因为我的模型的设计和实施

而使得我得出来的结论就能够作为 treatment

effect的一个无偏的估计

它是在内部逻辑上能够去很好的支撑这样的一个结论

这个就是内部效度

那么内部效度大家想会受哪些因素的影响

内部效度它也受很多因素的影响

比如说我们这个实验实施的是不是很成功

对不对

我们 treatment它是不是到位

等等

那么它其实都会影响到内部效度

那么我们会专门来讨论

在实施过程中哪些因素会威胁到我们的效度

那么相信大家在阅读中都读到了这样的一些可能带来的

威胁

我看大家讨论中也讨论的比较清楚

我们在这里就不花太多的时间来说了

3.5 Estimation在线视频

3.5 Estimation课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

3.5 Estimation笔记与讨论

也许你还感兴趣的课程: