3.15 Q&A 4慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

首先下一题依然是一个cross over的问题

问的是用Ive去解决这个问题的时候

是不是只排除了defier那部分人引起的内生性

而never-taker和always-taker永远无法识别

出来

其实这个问题是这样的

首先实验参与者被随机地分到了实验组和对照组中

这个随机分配的状态是纯外生的

但是因为在实际的操作过程中

实验的参与者就可以分为那4类

其中never-taker always

taker和defier

他们最后实际接受干预的情况是与随机分配的状态不符的

这导致不符的原因可能就会与残差和因变量相关

因此就会出现内生性问题

导致我们估计结果的一个偏误

而且不同类型的人导致的偏误方向是不同的

但是这几种人混在一起

我们没有办法识别

这个时候用一个纯外生的分配状态去做工具变量

估算实际的干预情况

就可以解决内生问题

具体的机制就是上一组文涛刚刚解释的那样

所以Iv去解决的应该是never-taker

always-taker和defier这三者

同时引起的内生性

也就是文涛展示的图中的红色的部分

所以说虽然我们永远没有办法识别这4类人到底谁是谁

但是用Iv去解决这个问题

实际上是要排除所有的内生性问题

不知道大家对这个问题还有没有什么疑问

如果没有的话

我们就进下一道题

好

第6题主要问的是上节课的瓦尔德系数是怎么样估算的

马上翻到下一页

谢谢

对

首先它的第一个小问题是有没有考虑男女性别

我们看一下

用于计算的这一列

我们已经用红框圈出来了

最后在计算的时候我们取的是1200

其实是1117和1243的一个中间的估算值它不是

非常精确

所以是综合考虑了两种性别的

然后第二个小问是为什么取了没有协变量的而不取有协变量

的

其实两类都应该计算

但是课堂上由于时间关系

我们只计算了其中的一页

然后关于瓦尔德系数具体怎么样计算

首先我们还是从d和z的意义来解释

其实刚才文涛解释得很清楚了

Di是研究者对被试者的分类

被试者研究者期望被试者属于哪一组

而Zi是或者叫Ti不同的地方有不同的写法

就是他们实际上是否接受了 treatment

瓦尔德估计实际上是 iv估计里的2sls的

一种非常简单的情况

所以我们是希望用瓦尔德估计的方法来算出排除掉内生性

影响之后的比较准确的β值

我们来看下面右边这幅图的分子是怎么计算的

当Di等于1的时候

y可以写成β0加β1加误差随机扰动当Di等于0

的时候

y可以直接写成β0+ε

然后分子就是把这两式相减

我们可以看到减出来等于β1就是Di前面的系数

β1

所以这个应该是我们上面那张图里的表中的第三列

我们不考虑协变量的情况

所以分子的值应该取值1200

然后分母的值就在下面的左边这张图里

这个应该是非常好理解的一个两个条件概率的相减

然后最后减出来是1200÷0.6

实际上等于2000

算出来等于1800

是因为我们前面的值不是

我们前面的1200是一个估算值

它不是那么的准确

然后1800是为了跟上面图里的第5列作比较

在排除了内生性影响之后

它其实是跟瓦尔德估计其实是跟 Ive的估计值是

接近的

然后下一页谢谢

然后我在这里补充了一个例子

我也不知道设计的好不好

这是我自己想的一个题目

然后希望能够提供一个实际的例子

帮助大家来理解Itt

我们假设有200位病人随机分成ab两组

然后a组是实验组b组是对照组

a组是从第二周开始

每天给a组的每位病人喝一瓶可乐

a组和b组都在第一周不幸病逝了20位

第三周不幸病逝了10位

然后我们就会看到

如果我们要按照实际的直接用简单的ols去计算

treatment的作用的话

我们会发现 a组接受了treatment

也就是开始喝可乐的人一共是80位

因为有20位已经是不幸逝世了

所以接受了实际接受treatment的是80位

其中死亡了10位

所以a组的死亡率是0.125

么b组的死亡率是0.3

这样我们就会得出一个匪夷所思的结论

就是可乐对治病是有用的

之所以实际上就可以看出来

如果不排除内生性的影响的话

直接计算会导致β1的估计值偏高

所以为了得出更准确的结论

我们应该用瓦尔德估计只会了直接找到一个IV来排除掉

内生性影响

得到更准确的值应该是ab两组是没有差

死亡率方面是没有差异

这是第6题

不知道大家还有没有什么疑问

这个例子倒是挺好的

但是这个应该不是Itt intention to

treat

应该还是估算的一个平均处理效应

而不是 intention是

intention to treat的概念

就是说不论这个人是不是接受了治疗

吃了给的药

那么我们就按照分配方案来计算

那就相当于reduce form里面工具变量的系数

这个例子本身解释的是没有问题的

你题目 Itt这个题目可能要改成ate或者是

local ate好的

好的

下面我来说一下内部有效性和外部有效性的相关问题

首先我们要回顾一下它的定义

内部有效性是指研究人员分析某一种特定因素所造

造成的效果是一定不能把其他原因造成的效果错误的归结

到被研究的对象上

举一个例子就是说测量一种药物对心血管疾病是否有疗效

如果病情较重的人服用了药物

而病情较轻的人他没有服药

那么病情的轻重程度会对分析结论造成一定的干扰

外部有效性是指从有限样本中得出的研究结论

能够在多大的程度上推广到总体中去

比如也举个例子

某一种药它在美国的临床实验中取得了一定的效果

那么这种药在中国的临床中是否能取得效果呢

关于这个概念就是有以下几个需要注意的地方

首先就是确保内部有效性是所有研究工作的起点

在内部有效性得到保证的基础上

我们再来继续探讨研究结论的外部有效性

这里就回答了有一位同学提的二者平衡的问题

但是我们小组认为这二者之间其实并不是一种平衡的关系

内部有效性它是研究所要达到的一个基础

外部有效性的话

它是这项研究可能要做的一个延展

还有一点

一项研究它很难在内部有效性和外部有效性两方面同时

做到非常完美

那么我们如何在保证有效性的基础之上

提高内部有效性的基础之上

提高外部有效性

我们小组主要是想了以下三点

大家还有其他的也可以补充

第一点就是充足稳定的经费是非常必要的

这也是很基本的一个条件

第二点就是适当的延长treatment的时间

举个例子就是一项追踪研究的话

它是需要很长时间的

但是时间越长

它的结论就越重大越靠谱

第三点就是大范围开展增加样本的代表性

所以我们可以看出在保证内部有效性的基础之上

如果想要提高外部有效性的话

就必须花费更多的精力和更多的金钱

我对这个问题的解答有什么问题可以提

大家好

由我为大家来解答第8题

第8题一共有三个小题

那么就我们一题一题来看

首先第一题

这位同学问两个是等价的

两个方框分别如何理解

那么我们可以看到第一个式子和第二个是指从形式上来讲

都一样

其中第一个式子后面的整体的残差内容是要反映什么呢

我们可以发现它的区别就是在于前面这一个这个是怎么读

来着

阿拉伯epsilon

εij加μ0j那么我们可以发现

如果当这个j给定的时候

这个μ0j

就是一个定值

它反映的是第j组的残差

也就是我们控制组或者对照组的一个残差

但是如果当他没有给定的话

就说明这个μ0j反映的是各个组的区别

于是当他和εij放到一块的时候

它反映的就是整个组群的残差聚集残差

那么3.4这个式子同样的当它和γ00放在一块的时候

γ00本身是已知的

那么当j给定的时候

它指的就是第j组

他的截距是如何

当μ0j确定了之后

他与已经给定的这种平均截距γ00合在一块的时候

他给出了第j组的截距

那么当j没有给定的时候

它反映的就是整体的随机截距上

对

这是第8.1题

那么第8.2题

这位同学问的是在这一个随机截距项的多元多层次模型

当中

ρ组间组内差异的计算

哪些是直接给出的

哪些是导出的

那么今天老师会带着我们做workshop

实际上这三个式子都可以直接由计算得出

无论是组间差异还是组内差异

然后关于ρ得出的公式

老师课堂的PPT上已经给出来了

今天我们可以跟着老师在rct的workshop

当中来计算验证一下这个公式

下一题

8.3

这位同学问随机效应模型和固定效应模型它有什么区别

那么首先这两者最大的区别就是这个效应到底是由什么

带来的

如果说这种差异是由样本

你抽样过程当中本身就带有的随机抽样带来的差异

那么就是随机效应模型

那么如果不是的

这种差异是由于抽样个体的异质性带来的

与协变量有关

那么我们就应该采用固定效应模型

这位同学也指出来了

豪斯曼检验是用来检验随机效应模型和固定效应模型

来判断他们

但这种判断只似乎没有反映真实的样本数据研究问题与

模型设定条件等属性和特征

的确检验是基于数理的特征

但是我们在检验之前

实际上也是基于我们已经在研究设计之前已经固定好的

模型

那么在选择时我们应该考虑哪些因素以及如何做出模型

选择

那么这一点首先这个问题老师今天还会再讲

那么在我的理解和设计相关资料上

别人给的结论就是无论是随机效应还是固定效应

都可以用这种固定效应的估计方法来处理

只不过是在如果我们的模型是随机效应模型的话

那么采用随机效应的这种计算结果的更有效

显著性更加高

一般我们在平时做研究的过程当中

肯定整个模型包括数据没有那么完美

一般都是会用到固定效应的

那么究竟采不采用固定效应

我们也可以用豪斯曼检验来确定

以上就是对这位同学的解答

谢谢

3.15 Q&A 4在线视频

3.15 Q&A 4课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

3.15 Q&A 4笔记与讨论

也许你还感兴趣的课程: