当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 3.15 Q&A 4
首先下一题依然是一个cross over的问题
问的是用Ive去解决这个问题的时候
是不是只排除了defier那部分人引起的内生性
而never-taker和always-taker永远无法识别
出来
其实这个问题是这样的
首先实验参与者被随机地分到了实验组和对照组中
这个随机分配的状态是纯外生的
但是因为在实际的操作过程中
实验的参与者就可以分为那4类
其中never-taker always
taker和defier
他们最后实际接受干预的情况是与随机分配的状态不符的
这导致不符的原因可能就会与残差和因变量相关
因此就会出现内生性问题
导致我们估计结果的一个偏误
而且不同类型的人导致的偏误方向是不同的
但是这几种人混在一起
我们没有办法识别
这个时候用一个纯外生的分配状态去做工具变量
估算实际的干预情况
就可以解决内生问题
具体的机制就是上一组文涛刚刚解释的那样
所以Iv去解决的应该是never-taker
always-taker和defier这三者
同时引起的内生性
也就是文涛展示的图中的红色的部分
所以说虽然我们永远没有办法识别这4类人到底谁是谁
但是用Iv去解决这个问题
实际上是要排除所有的内生性问题
不知道大家对这个问题还有没有什么疑问
如果没有的话
我们就进下一道题
好
第6题主要问的是上节课的瓦尔德系数是怎么样估算的
马上翻到下一页
谢谢
对
首先它的第一个小问题是有没有考虑男女性别
我们看一下
用于计算的这一列
我们已经用红框圈出来了
最后在计算的时候我们取的是1200
其实是1117和1243的一个中间的估算值它不是
非常精确
所以是综合考虑了两种性别的
然后第二个小问是为什么取了没有协变量的而不取有协变量
的
其实两类都应该计算
但是课堂上由于时间关系
我们只计算了其中的一页
然后关于瓦尔德系数具体怎么样计算
首先我们还是从d和z的意义来解释
其实刚才文涛解释得很清楚了
Di是研究者对被试者的分类
被试者研究者期望被试者属于哪一组
而Zi是或者叫Ti不同的地方有不同的写法
就是他们实际上是否接受了 treatment
瓦尔德估计实际上是 iv估计里的2sls的
一种非常简单的情况
所以我们是希望用瓦尔德估计的方法来算出排除掉内生性
影响之后的比较准确的β值
我们来看下面右边这幅图的分子是怎么计算的
当Di等于1的时候
y可以写成β0加β1加误差随机扰动当Di等于0
的时候
y可以直接写成β0+ε
然后分子就是把这两式相减
我们可以看到减出来等于β1就是Di前面的系数
β1
所以这个应该是我们上面那张图里的表中的第三列
我们不考虑协变量的情况
所以分子的值应该取值1200
然后分母的值就在下面的左边这张图里
这个应该是非常好理解的一个两个条件概率的相减
然后最后减出来是1200÷0.6
实际上等于2000
算出来等于1800
是因为我们前面的值不是
我们前面的1200是一个估算值
它不是那么的准确
然后1800是为了跟上面图里的第5列作比较
在排除了内生性影响之后
它其实是跟瓦尔德估计其实是跟 Ive的估计值是
接近的
然后下一页谢谢
然后我在这里补充了一个例子
我也不知道设计的好不好
这是我自己想的一个题目
然后希望能够提供一个实际的例子
帮助大家来理解Itt
我们假设有200位病人随机分成ab两组
然后a组是实验组b组是对照组
a组是从第二周开始
每天给a组的每位病人喝一瓶可乐
a组和b组都在第一周不幸病逝了20位
第三周不幸病逝了10位
然后我们就会看到
如果我们要按照实际的直接用简单的ols去计算
treatment的作用的话
我们会发现 a组接受了treatment
也就是开始喝可乐的人一共是80位
因为有20位已经是不幸逝世了
所以接受了实际接受treatment的是80位
其中死亡了10位
所以a组的死亡率是0.125
么b组的死亡率是0.3
这样我们就会得出一个匪夷所思的结论
就是可乐对治病是有用的
之所以实际上就可以看出来
如果不排除内生性的影响的话
直接计算会导致β1的估计值偏高
所以为了得出更准确的结论
我们应该用瓦尔德估计只会了直接找到一个IV来排除掉
内生性影响
得到更准确的值应该是ab两组是没有差
死亡率方面是没有差异
这是第6题
不知道大家还有没有什么疑问
这个例子倒是挺好的
但是这个应该不是Itt intention to
treat
应该还是估算的一个平均处理效应
而不是 intention是
intention to treat的概念
就是说不论这个人是不是接受了治疗
吃了给的药
那么我们就按照分配方案来计算
那就相当于reduce form里面工具变量的系数
这个例子本身解释的是没有问题的
你题目 Itt这个题目可能要改成ate或者是
local ate好的
好的
下面我来说一下内部有效性和外部有效性的相关问题
首先我们要回顾一下它的定义
内部有效性是指研究人员分析某一种特定因素所造
造成的效果是一定不能把其他原因造成的效果错误的归结
到被研究的对象上
举一个例子就是说测量一种药物对心血管疾病是否有疗效
如果病情较重的人服用了药物
而病情较轻的人他没有服药
那么病情的轻重程度会对分析结论造成一定的干扰
外部有效性是指从有限样本中得出的研究结论
能够在多大的程度上推广到总体中去
比如也举个例子
某一种药它在美国的临床实验中取得了一定的效果
那么这种药在中国的临床中是否能取得效果呢
关于这个概念就是有以下几个需要注意的地方
首先就是确保内部有效性是所有研究工作的起点
在内部有效性得到保证的基础上
我们再来继续探讨研究结论的外部有效性
这里就回答了有一位同学提的二者平衡的问题
但是我们小组认为这二者之间其实并不是一种平衡的关系
内部有效性它是研究所要达到的一个基础
外部有效性的话
它是这项研究可能要做的一个延展
还有一点
一项研究它很难在内部有效性和外部有效性两方面同时
做到非常完美
那么我们如何在保证有效性的基础之上
提高内部有效性的基础之上
提高外部有效性
我们小组主要是想了以下三点
大家还有其他的也可以补充
第一点就是充足稳定的经费是非常必要的
这也是很基本的一个条件
第二点就是适当的延长treatment的时间
举个例子就是一项追踪研究的话
它是需要很长时间的
但是时间越长
它的结论就越重大越靠谱
第三点就是大范围开展增加样本的代表性
所以我们可以看出在保证内部有效性的基础之上
如果想要提高外部有效性的话
就必须花费更多的精力和更多的金钱
我对这个问题的解答有什么问题可以提
大家好
由我为大家来解答第8题
第8题一共有三个小题
那么就我们一题一题来看
首先第一题
这位同学问两个是等价的
两个方框分别如何理解
那么我们可以看到第一个式子和第二个是指从形式上来讲
都一样
其中第一个式子后面的整体的残差内容是要反映什么呢
我们可以发现它的区别就是在于前面这一个这个是怎么读
来着
阿拉伯epsilon
εij加μ0j那么我们可以发现
如果当这个j给定的时候
这个μ0j
就是一个定值
它反映的是第j组的残差
也就是我们控制组或者对照组的一个残差
但是如果当他没有给定的话
就说明这个μ0j反映的是各个组的区别
于是当他和εij放到一块的时候
它反映的就是整个组群的残差聚集残差
那么3.4这个式子同样的当它和γ00放在一块的时候
γ00本身是已知的
那么当j给定的时候
它指的就是第j组
他的截距是如何
当μ0j确定了之后
他与已经给定的这种平均截距γ00合在一块的时候
他给出了第j组的截距
那么当j没有给定的时候
它反映的就是整体的随机截距上
对
这是第8.1题
那么第8.2题
这位同学问的是在这一个随机截距项的多元多层次模型
当中
ρ组间组内差异的计算
哪些是直接给出的
哪些是导出的
那么今天老师会带着我们做workshop
实际上这三个式子都可以直接由计算得出
无论是组间差异还是组内差异
然后关于ρ得出的公式
老师课堂的PPT上已经给出来了
今天我们可以跟着老师在rct的workshop
当中来计算验证一下这个公式
下一题
8.3
这位同学问随机效应模型和固定效应模型它有什么区别
那么首先这两者最大的区别就是这个效应到底是由什么
带来的
如果说这种差异是由样本
你抽样过程当中本身就带有的随机抽样带来的差异
那么就是随机效应模型
那么如果不是的
这种差异是由于抽样个体的异质性带来的
与协变量有关
那么我们就应该采用固定效应模型
这位同学也指出来了
豪斯曼检验是用来检验随机效应模型和固定效应模型
来判断他们
但这种判断只似乎没有反映真实的样本数据研究问题与
模型设定条件等属性和特征
的确检验是基于数理的特征
但是我们在检验之前
实际上也是基于我们已经在研究设计之前已经固定好的
模型
那么在选择时我们应该考虑哪些因素以及如何做出模型
选择
那么这一点首先这个问题老师今天还会再讲
那么在我的理解和设计相关资料上
别人给的结论就是无论是随机效应还是固定效应
都可以用这种固定效应的估计方法来处理
只不过是在如果我们的模型是随机效应模型的话
那么采用随机效应的这种计算结果的更有效
显著性更加高
一般我们在平时做研究的过程当中
肯定整个模型包括数据没有那么完美
一般都是会用到固定效应的
那么究竟采不采用固定效应
我们也可以用豪斯曼检验来确定
以上就是对这位同学的解答
谢谢
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM