当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.7 IVE for corss-overs 1
那么这个里面能够做调整的是第4种情况
cross over
所以下面我们会来重点的来去研究一下
Cross over这个问题在rct里面是一种
什么情况
我们有没有办法去解决它
那么也就是说我们虽然在rct里面做了一个非常完美的
设计
我们把研究对象随机的分成两组
但是在现实中
当我们实施这个实验的时候
是不是分组的结果还是随机的
这个是存疑的
那么这个是我们想要的一个状态
随机分组
那么在现实中可能并不是按照我们的意图研究者的意图来
去发生的
我们用 treatment group跟
control group来去界定我们的分组
分组变量
你刚才说的d这是我们研究者的分组
treated和not treated是现实对不对
它用的过去式显然它是现实就是说这些被试他到底是接受
了treatment还是没有接受
那么接受的就是treated
没有接受的就是not treated
这个是两种不同的概念
那么显然我们是非常希望看到这样的一个结论是吧看到这样一个
现象
当我们把某一个人分到treatment group的时候
他就接受treatment
我们把某一个人分到 control group的时候
他就不接受treatment
这个是我们希望看到的最好的配合的这种被试
但是在现实中也有这种人就是说它比较希望接受一个treatment
里面
不论我把他分到哪一组
比如说我们在学校里面开展一个计划
我们有一个新型的比如说阅读的一个培训
那么参加阅读课程之后
学生的阅读能力可能会上升
但是我们并不清楚
因此我们要选两个班来做一下这个实验
这时候有个家长就说
如果他的孩子被分到实验的班还好
如果被分到了control group
他家长就会说为什么让我的孩子去control group对不对
我就要去接受新颖的东西
所以他就回来找学校去说
那么校长或者班主任可能就得把他再调到这个treatment group
所以说不论我们研究者把他分到哪一组
他一定要接受treatment
那么有这种人现实中是有这种人存在的
那么除此之外
还有这种比较保守的人对不对
如果把它分到control group
他可能觉得很好
但是如果你一旦把他分到了treatment group
他就会来找家找学校了
他说为什么把我的孩子当小白鼠
是不是你们新的方法效果怎么样都不清楚
你就让我的孩子来试是吧
那么我就是不参加
那么这个时候不论我们研究者之前是把它分到
treatment group还是control
group
他都不接受treatment
那么这也是一类人
也是现实中是有的
那么这是一类
那么还有一类喜欢反着干的
是不是
就是说我们如果把它分到了treatment group
他就要求去control group
如果我们把它分到了control group
他就要求去treatment groups
反正他就是要要对着来
那么这个人也是有的
虽然它可能在现实中比较少
所以我们可以看到说虽然我们的理想非常好
但实际上真正的实施之后
在这样的一个2×2的矩阵里面
每一个空格里面都有两种人
都有两种人
只有一种人是我们需要的
那么其他的这三种都是都是干扰
也就是说这里面就产生了这几种概念
一个是complier遵从我们的实验设计的
但是他们不是全部显然会有never taker
就是说他永远不愿意接受treatment
还有always-taker
还有defier对着干的
所以说因为会出现这种情况
那么我们用数学的形式来表达就是这样的一个矩阵
我们用还是用Di来表示研究者的分组结果
研究者对被试的分组结果
用Ti表示被试实际接受 treatment与否的
这样的一个记录
那么那么这个矩阵大概就是这样子的
遵从者显然是在 这是遵从者
就是d跟t是相等的
这是我们喜欢的
那么这个里面就会出现说另外这种情况他们在数学上只有
这一个表达式
但是它其实是有两种动机的人的
我们刚才前面有一个非常漂亮的运营
上学期做的这样的一个图给大家表示了那么大家想一下
即便是Di等于Ti=1
这个里面是不是也包括两种人
对不对
刚才我们看了两种人
一种是遵从者
还有一种人是always taker也在这里面
Di等于Ti等于0的也是它有遵从者
同时它有什么有never taker
也会有一些在里面
那么另外一个斜对角这个人有两种
那么这些人除了complier之外的其他这三种人
他们大家想一下
他们是随机的选择一个分组结果吗
他们显然不再是随机的了
是不是
他们是根据自己的特征
根据自己的一些特性
他们去做了决策
做了自己的行为的决策
这个时候那么我们实际的这样看到的最后的一个接受干预
的这样的一个结果
他就不是在完全他就不再是完全随机的了
是不是
因为有一些人根据自己的特征自我选择进入了
treatment还是control
遵从我们的随机分组方案呢
怎么办
那么也就是说这个时候其实我们已经在rct里面遭遇了
什么
Self selection bias
这个东西又出来了
我们再来总结一下
用 potential outcome的方程我们来
总结一下
第一个式子
这个是我们的观测值
是不是
T是观测它的结果
大家记住 t是观测它的结果
就是观测的potential outcome
我们可以把它写成这样的一个表达式
Ok
下面这个D是我们的研究者随机分组的结果
这个是我们想要的设计的这样的一个结果
这个是它对应的表达式
他们俩的区别就在于一个是t一个是d t是带有自
选择性的
d是完全随机的
因为d是我们研究者自己随机分组的
是不是
这个时候大家想到它符合什么
是不是
他就让我们想到了我们前两周努力的去攻克的Iv的
估算方法
是不是
也就是说大家可以看到说
虽然t在这里变成一个内生的
也就是有自选择性的内生的这样的一个解释变量
它跟我们的残差相关了
因为它跟我们不可看到的不可观测的这些被试的特征是
相关的
这些特征在残差里面
那么虽然Ti是一个内生的
但是Ti是不是在很大程度上它是由Di决定的
也就是遵从者
大部分遵从者他会根据他的研究者给他分的分组结果
他来去选择他是否接受处理的满足
还是有这样的人的
而且应该是比较相当大的比例是吧
因此Di又是纯外生的
因为它是研究者随机做的这样的一个分组
Di是纯外生的
Ti是内生的
Ti受到Di的影响
Di跟谁不相关
跟残差是不相关的
因为它是外生的
是不是完全符合Iv的这样的一套设计思路
这时候Di就成为我们什么
Di就成为我们的IV
是不是
所以是我们就可以引入Iv estimation
大家应该非常熟悉了
这个式子里面Ti是内生解释变量
这个式子这个是d它是一个我们叫它什么叫
reduced form
是不是
D是工具变量
那么我们可以用D来去估算Ti代入我们想要的结果式子
里面
来去估算结果
那么这个就用到了Iv estimation
过去之前我们的分组的方案就变成了Iv一个非常完美的
Iv来去解决Ti的内生性问题
好
这个顺理成章了
所以说上两周学明白了
这个地方看起来就非常的好理解了
那么当然了我们在这里不再多解释残差的问题了
这个参照我们之前讨论过了
那么我们要保证残差的计算是正确的
我们要用软件来直接计算
好
这个是关于 rct的出现cross over的
这种情况的时候
我们用分组方案做工具变量来去纠正自选择偏误
对于这样的一个解决方案
大家有没有什么问题
现在可以问
你可以打开你的麦直接来问
如果你没有问题
我们就要做练习了
有没有问题
好
没有问题
我们上练习
同学们
这个练习也是我们的reading里面的那么这个是
一个典型的cross over的问题
那么我们在这样的一个工作培训的这样的一个实验
里面
我们来看随机分成两组
一组给他发邀请
邀请他来接受一个在职的培训
来提高他的工作能力
这是Di=1的
一组我们就作为control我没给他发邀请
那么我们就来看到底有多少人来参加了
来参加了培训
就是Ti=1的
还有很多人就没有来参加培训
就是Ti=0的
那么可以看到这4个象限里面分别有1个百分比
那么也就是说对于Ti等于1的
我们分组的这些人里面只有60%的人来接受了培训
剩下40%都没来
对于我们没有发邀请的人
当然了98%他们就都没来
他们可能连信息都没有收到
但是还有2%居然就来了
也有这样的人存在
所以说这个就是一个非常典型的cross over的
问题
是不是
我们来看一下
那么这个对应的 ols和 Iv的估算
这个是三组
12列是一组
三四组
三四列是一组
五六列是一组
我们分男性女性分别做了估算
一个是单数列是没有加控制变量的一个协变量
偶数组是加了控制变量的
你们要学会这种报告的方法以后
你们要是做类似的研究
就要做这样的一些对比的报告
那么第一个是comparisons by training
status
这个是他training的
他到底没有接受treatment
第二个是cement
根据Di来去估算的
那么最后一个是Iv我们来一个解释
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM