当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 6.24 PSM workshop Q&A 1
首先是第一个问题
说下图是ps match2的一个结果
然后首先是一个解读
第二个它主要是问了一下
从图上看没有ate的结果
然后是需要我们自己推算
还是说
ps match2的一个弊端
在于无法得出 a t e
我这只放了一个加入了ate的结果
就是我们在 outcome
后面加上一个ate
这个就会自动爆出att atu ate
然后左边这个图是这样的
然后的话就是说他这个解读的话
其实老师上课有时候他也包括
它包括number of
observations一这一次
是样本数量和卡方值p值以及调整后
的R方
然后下面的话
依次是系数和标准误
然后p值和置信区间
这个图的中间那部分表格可能相对出现
大家比较关心的一个是未匹配之前的
一个 difference
然后一一次包括att atu和ate
然后我们在命令后面加入ate
可以报出这所有的一个结果
然后这儿需要注意的一个就是
红色框里面注释部分就说
psmathc2
它是一个较早出现的非官方的命令
然后最大的缺陷在于它的标准误
不太正
标准误并不正确
然后的话就说就像红色框里面所显示的
他所提供的标准误并未考虑
得到的倾向得分是估计的
标准误的利益假设是同方差可能也不成立
然后的话具体大家可以参考一下陈强的
高级计量经济学以及四大应用第28章
然后就说解决方法就说是开发
了一系列的新的命令
就是说大家比较熟悉的 t effects
然后包括它的一个子命令t effects
p s match
然后它的优点就是说给出
了一个正确的标准误
然后所谓的ai标准误
然后下面这幅图右边这幅图所显示
的 a和i是两个人的名字
然后这是第一个小题
然后我没有说明白
大家可以随时打断
对
然后第二个小题说的是 work
shop里面给出的多种方法
进行 p s m的一个计算
在实际的研究中
是需要把这些方法都跑一遍
呈现所有的结果
还是说有所选择
就像我们课上所呈现的就是
所有的命令跑出来之后
结果其实差不多
但又不完全相等
这种情况下应该如何回报
我们首先回顾一下关于匹配方法的选择
就说首先是不存在适用于一切
情形的好方法的时候
根据具体数据选择匹配方法
在实践中就是说一个做法就是说
有一些经验法则可以来参加
比如说控制个体不多的时候
选择一个有范围的匹配
如果控制组有较多个体
可以选择一个和匹配
以提高效率
然后在实践当中最常用的一个方法
就是尝试不同的一个匹配方法
然后比较它们的结果相似则说明比较稳健
如果差异较大就要考虑其中的原因
然后关于处理效应的计算
其实和匹配方法的一个
考虑其实是差不多的
然后我们最常用的方法也会考虑
在一个尝试不同的匹配方法
然后比较它们的结果相似则说明他们健康
但是处于一个谨慎的考虑的话
我们会更多地考虑一个
IPW, r a和 aipw
因为他们一个是具有增强
具有回归调整的逆概率加权
和增强的逆概率加权
他们的结果是一个稳健的
就是说它是对结果的方程和处理
方程联合起来进行建模
只需要其中一个方程设定正确
然后它的结果就比较稳健
所以说我们是更倾向于用
后面这两个来进行一个
进行一个 p s m的计算
就是说进行一个处理效应的计算
然后这是第二个小节
如果大家有问题可以随时提
没有问题的话
下一个就***同学接着讲三第三个问题
好的
好的 是同学们大家好
我负责的是第三道题
第三道题其实有两个部分
第一部分问的是att当它不是
一个当treatment
不是一个二分变量的时候
它指的是除了选定控制组之外
其他所有组的平均处理效应
还是指向左的平均处理效应
其实这是一个比较基本的问题
我们说att它就是对指定组也就是
衰竭的group的平均处理效应
然后再看第二个问问题
问的是在这样一个命令里面
它 t level(h)
是选定实验组为h组吗
然后底下这些系数应该如何解释
看stata里面它的help一下的话
可以发现它这里说明了
control括号里面的
指的是 control group
然后t level括号里面
的是treated group
然后注意这里的treated
group和treatment是要
区分开的
它指的只是 treaty的group
然后后面我们会具体讲述一下
treated group是什么意思
我们来回顾一下att的概念
就是我们说
这一问想要问的是
是treatment不是二分变量的时候
att是会有什么变化
我们说这要回到att它的定义上来
Att就是
average treatment
effect on the
treated group
也就是说我们首先要找到
treated group是什么
用张老师课上举的例子来说的话
就是蓝色的实心点
就表示了这个
treaty的group
它的 treated之后的结果
然后绿色的空心点表示的就是
treated group在没有
take treatment
的时候的结果
也就是说ATT我们首先第一
步先找到treated group是什么
然后再找到他的反事实是什么
然后计算这两者之间的差距
也就是
蓝色时间和绿色空心之间的差值
如果说 treatment
不是一个二分变量的话
我们可以采用一样的这种
思路来表述这个结果
把它分到下一页
因为
在时代里面给大家展示的结果比较复杂
所以我建立了一个非常简单的模型
通过
比较基本的模型
可以看出来他的思路是什么
首先我们来看
假设说有4个班的同学
这4个班一般的同学成绩最好
然后工资也越高
4班同学成绩最差
工资也越低
然后成绩和工资是一个线性关系
好 请放到下一页
然后在这个情况下
我们就可以针对每一个班级的同学
他们如果不在这个班级
还是考这个分数
能够拿到什么样的工资
做出一个反事实的
一个假设
在这里面我们列出了和在
老师给的
文档里面的
小组数量一样多
都是4组
来进行一个说明
请翻到下一页
我们可以在这张图上看到
蓝色点的部分是实际上这个班
的同学的成绩所对应的工资
而绿色部分是我们
补充上的他的反事实的情况
也就是说如果
对咱们下一页谢谢
也就是说如果说这个同学他不在
这个班而取得同样的成绩的话
我们把是不是在这个班看作
一个treatment
然后他不在这个班
他同样成绩取得的工资看作是 take
treatment之后
得到一个反事实的结果
由此我们就可以算出
在
不同的control group和
treatment group情况下
它到底是一个怎么样的
一个值
随便举一个例子
假设我们春 control
group是
group two 也就是说
二班同学
我申请使用一下注释
这里看错了
Control 2的
意思就是说把二班同学
作为一个control group
然后t level3意思是说把三班同学
作为 treated group
我们说att计算的时候
首先第一步是要找到 treated
group
这里treated group是三班
所以我们看是这些数
然后在这些时候
他如果说不在三班
也就是说take了其他的
treatment的话
那么它就会相应的在这里
这个模型是一个我们说是用
怎么说
这些部分是
三班同学他在take其他的
treatment的情况下的可能
的取值
然后我们看他control的是二
也就是说这一部分是他的control
而在这里
分别是13和4对它的区别
也就是说
可以看到分别是d
e和e加f就是这三个班
的
不同的treatment 相比起
control的
treatment
的差距
然后底下的9.01不用说
它比较简单
就是这个班它的
纵轴上取值均值
不知道还有没有同学有疑问
有疑问可以提出
没有的话这道题就结束了
接下来是四
第4题是
包含三个部分
一是 I p w的一个原理
这个图是老师课上的PPT
然后我觉得也比较直观
总体当中任何一个个体都有
可能被随机选择到的概率
被选择概率是
是ω
那么备选它的权重就是取倒就是
ω分之一点的大小
也就代表了
看一下
然后麻烦下一个页
第二部分是一个stata的操作问题
这个是work shop
当中的do file的
的案
是前面的用的
前面的例子就是
母亲是否抽烟
然后对婴儿的影响的例子
然后用这个例子讲的话会比较清楚
第一行就是
对于这些
也变量进行一个预判
用了回归他们对他们进行一个预判
然后接下来是生成ps
并根据
他是否为smoker
进行对ps进行一个赋值
麻烦下一页 谢谢
然后接下来就是分别用ra
ipw的方法
跑两个回归
然后第一个 r a是一个回归
调整是对
结果来进行建模
然后 t efffects的里
默认使用的是logit
然后第二个ipw的话
它是对一个分配过程进行一个建模
然后这里它
加了一个probit的话
使用了 prohibit回归
然后再进行一个共同支撑检验
共同支撑检验的意思就是
比较通俗的理解就是说
在这个实验当中实验数据当中
它的
观测数据当中 它的
你和他的
它可以用拟合度来讲
就是它的拟合度的除了
我们关注的变量之外
它其他的同质性
同质性的
大小是不是符合我们的要求
麻烦下一页 谢谢
下一页这部分就是分别运行ipw ra
就是一个回归调整的ipw
对结果和treatment的过程都进行建模
在使用它的ipw的权重来
估计校正后的回归系数
随后来进行执行一个回归调整
然后aipw是
是一个增强
他们有
它是相当于ipw加了一个偏正的校正项
如果 treatment
的模型指定不正确
但是
结果的模型指定是正确的话
它就会进行一个自动的调整
然后nmh是
进行一个最临近匹配
ps match是
针对倾向分数来进行的倾向评分匹配
为了对比结果差异的大小来
验证方法一个是否稳健
如果差异过大的话可能需要进行调整
下一页 谢谢
第三部分是跟kernel
match的一个比较
可能是通过
构造一个虚拟的对象来匹配处理组
构造的原则是对现有的控制变量做
进行一个权重的平均权重的处
取值和处理组控制组的
评分差距成反向相关
一般按照跟核的距离跃进权重
越大的规则进行一个加权
相似的点是他们都有一个反向相关的关系
ipw是跟被选择的概率反映
然后kernel是
处理控制组的评分的差值
的差距成一个反向相关
然后他还有一个他们相同的优点
就是
样本数据基本上都能够使用不浪费
然后不同的点的话
ipw是对已观察到的个体数据加群
然后可能是多了一个
增加了一个虚拟对象的匹配
然后
然后对以观察到的和虚拟
出来的个体都进行一个加权
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM