当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.14 Q&A 3
这个
第5题不是后面那组
第5题是额外给我们做补充的一个第5题
然后这一部分内容我将讲讲述的时候在PPT上呈现解答
这道题的思路
而在最后 PPT的备注里面写了对于这些问题的回答
大家可以等到课后的时候拿到 PPT在看的时候一并
看到里面的附录
好
我就开始讲第4题
第4题问的是d怎么作为工具变量解决cross
over问题的
那么我们首先就要先知道D是什么
D指的是实际指的是你在预先分配分组的时候
预先想要把哪一些人分到控制组
哪些人分到实验组里去
而它作为哪一个自变量的工具变量指的是t,t是
你不是你在预想当中怎么分
而是在实际上最后真的分到了实验组和控制组当中的人
都是哪些
我们举一个例子来说
政府他会想要让学生们去私立学校
于是他就会发私立学校的补助
这个D就是他发了私立学校补助这些学生
而这个t指的就是实际上最终真的去了私立学校的这些人
好
我们来看下一页
至于我们刚才这个例子
我们会在之后再慢慢讲
然后我们接着来看这道题
他问的是怎么解决cross over问题的
那么我们就要回答什么是cross over问题
其实这个就是我们刚才做的那道题
想必大家基本上已经了解了
简单来说
不是每一个你分配的你想要分配到实验组的人
最后都会去实验组
他可能会跑到控制组去
然后你分配到控制组去的人
他可能最后会跑到实验组去
这是因为在在所有人里面
其实是有一类人是永远去实验组
有一类人是永远去控制组
还有一类人是你把它分配到哪里
他就去其他另外一组
这就导致了cross over问题
cross over问题的
回到这一页对
Cross over的问题实际上是因为他这样
因为他不是根据你随机分组而进入了实验组或者控制组
而是因为有一些其他因素
比如说我们所说的这些逆反心理
因为这些心理导致我们所说的自变量t它就不是一个
严格外生的自变量
它呢
它就受到了逆反心理的内生性的影响
因此我们说解释对自变量的系数的解释
β是有偏的
这就是我们为什么要解决cross over问题
那么他是怎么解决的呢
我们来看张羽老师在课上发的这张 PPT
还用刚才那个例子来说
大家可以看到这个y也就是我没有涂上颜色的y指的是最后他的
收入受到了影响
然后他收入的影响是由于他上私立学校
然后私立学上没上私立学校这个因素
也就是我们原始的自变量
也就是我们需要解决cross over的问题的
它就是这个绿色的圈
我们看到绿色的圈当中有一部分红色的内容是内生性因素
也就是说他不是你随机分配进去的
而是因为它有一些比如自己逆反心理等等因素
而影响到了最终的他的收入
所以说我们需要排除绿色圈当中红色的部分
因此我们就采用了一个和绿色圈相关
但是又没有这些外生性因素的这么一个部分
也就是我们预计接受实验的这部分人
也就是政府发了私立学校补助的这部分人
然后我们在这张图上
我们的最终的目的是要用蓝色圈当中的黄色部分来解释
绿色圈
使得排除掉这个绿色圈当中红色那一部分
然后用新的绿色的圈来解释y
因此就可以排除掉这些内生的因素
从而得出一个无偏的无偏的估计
以上是第4题
好
那么我接下来讲第5题
第5题是问的是随机分组是不是一定能够解决选择偏误的
问题
那么我们首先需要知道的是什么是选择偏误问题
选择偏误就是指个体它进入实验组还是控制组
它不是随机的
而是因为有内生因素影响
那么随机分组是不是一定能解决
不是的
因为随机分组之后还会出现cross over的问题
也就是你分组
我们刚才讲到你分到这一组
它就跑到另外一组
跑到另外一组原因就是因为他的内生因素影响
而这个影响就是选择偏误
所以说随机分组不一定能解决
那么满足什么条件就一定能解决呢
其实如果要是能够完全避免cross over的话
也就是你分配他的哪一组
他就确实去了哪一组
在这种情况下
就可以说一定能够解决这个问题
为什么说在实际当中随机分组
往往不能解决选择偏误
是因为不能够严格的要求他去哪一组
他说去哪一组
因为如果我们这么做的话
很大程度上会违反我们前面所说到的第7条也就是伦理上
的要求
在这里两害相权取其轻
我们还是更多的要避免伦理上的问题
好
那么请看下一页
那么可接受的标准是什么
也就是一般情况来说
我们从理论上和实践两个角度来进行区分
在理论上我们说随机分组的可接受标准是说它分到哪一组
这个结果不受其他的内生性变量的影响
它是一个完全随机的结果
我们可以接受
但是在实践当中我们很难说直接满足这个要求
我们一般是通过检测他的分成了两组
在各个变量上是不是在均值上进行t检验
他是不是没有显著差异
比如说我们举个例子
下一页班纳吉他在咱们的阅读材料当中有的这个图可以
看到它其实是采用了前测成绩上
实验组和控制组在均值上进行t检验
来看有没有显著差异
我们需要强调的一点就是在实践当中
我们一般都需要进行这样的t检验
来保证这两组之间没有显著差异
因为即使是随机分组
我们说比如说我们拿教研院举个例子
我们把教研院的学生分成两组
他虽然是随机分的组
也有可能是一组全是男生
一组全是女生
因此我们需要在性别
种族
前测成绩等等这些因素上
实验组和控制组之间做一个均值的检验
确保它是没有显著差异的
那么这就是我的最后一道题
谢谢大家
好
谢谢文涛
谢谢第三组同学解答的比较清楚
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM