当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 6.21 PSM workshop 5
它的报告的结果
显示了几个 第一个
它报告我们用的什么方法
还用的是treatment
effect estimation
这个是
t effects命令
那么这个estimate我们
用的具体是哪种方法呢
Regression
adjustment方法
Outcome model
是一个线性方程
然后 training model
我们没有去specify它
样本量放在这里
那么这个地方它报告了两组结果
一个是ate
a t e就是smoker跟
non smoker的差值了
对不对
这个值就报出来了
负的239
还有它的standard error
以及显著度检验
显著的
那么还报告了一个什么
还报告了一个potential
outcome的均值
po mean potential
outcome的均持
它只需要报告non smoker
的均值就可以了
non smoker的
potential outcome
大家想 non smoke的
potential
outcome并不是我们观测
到的
那些non smoker
的 outcome均值
还得把那些拟合出来的
在
smoker里面
那些人如果它也不吸烟
它的 baby birth weight是多少
我们一个拟合值也放进来
合在一起算出来的才是potential outcome
对不对的 mean它的均值
所以这个地方是这么算的
那么当然了
如果我们想算smoker的
potential
outcome mean
的话
是不是这两个值相加就可以了
它outcome的结果就报出来了
读起来也比较容易
好
我们再来看再回到 stata
我们来看一下第24行命令
24行命令用的是ipw的方法
ip w的方法
跟刚才 ra 的方法正好是
侧重点是不一样的
它不去specify outcome
方程
没有去咱们刚才说了没有去
设定 outcome model
它只需要告诉stata谁是outcome
就可以了
那么这里面就是 baby birth
weight是outcome
然后它去建模分析的是
treatment model
也就是说大家可以看到后面
是给了一个probit model
这个里面
MB smoke这个是分组变量
也就是 probit
model里面的y
那么
再加上几个变量是它的自变量
那么可以告诉大家我用的是
topic model
那么
I p w这样的一个
估算方法
它命令就是这样来去
格式是这样子的
那么大家
就来跑一下这行命令
看一下结果
可以跟23行对照一下
看看这两个结果的
一同
我们一起来看一下
如果你要是没跟上就一定要告诉我
因为我看不见你们
这个地方格式是一样的
只不过它信息变了
因为我们换了换了具体的估算方法
同样它报告出了是 a t e
和potential
outcome mean
那么分别是负的236
和3402
我们可以比较一下这两种结果
它的相似性上面这个是负的239
然后是3403
这里是负的2363402
还是非常一致的
大家可以看到两这两个结果
报告的这两个方程
方法报告的结果是非常一致的
就说明
这个数据的性质还是不错的
无论从哪个角度看呢
它都符合我们使用这个方程
的基本的条件假设
那么这个
I p w的方法
同时我们也可以做类似于 p sm
的 common
support这样的一个分析
因为是Ipw
所以它是估算的
probability的
我们看25行
它就是 overlap
命令
其实就是来做这样的一个
观察也就是两种人
它们吸烟的概率
的分布
是不是有overlap
也就是说我这个可以参照
好
那么这个图横轴是 propensity
score就是概率 propensity
score
纵轴是density
这是一个概率密度函数
类似于频数分布图
那么我们就来看
两种人蓝色的是smoker
红色是non
错了 蓝色是non smoker
红色是smoker
那么这两组人
那么我们给它估算出来的概率
它的分布是呈现这样的一个情况
那么还可以对不对
没有极端值 没有极小值
基本上0.5以上也没有极大值
没有到1的附近
所以说它的倒数还是比较稳定的
那么基本上而且都是有overlap
这个
检验命令
那么我们再讨论一下
双重稳健的估算
刚才我们看到了 r a
和Ipw这两种方法
它们是各有侧重
分别从不同的视角
来去解决自选择的问题
那么
如果我们把这两种方法合并到一起使用
把这两种视角下的
它的长处
都能够用到
那么这个可能一个是更稳健的一个做法
因为毕竟每一种方法它都有它依赖的假设
如果不满足的话就不能用
但是我们
又不知道在什么时候不满足是吧
有的时候
那么这时候我们就
来看一下双重稳健估计嵌套
的两个方法一起来使用
那么
它的
目的是说
如果
我们把 treatment
放成给设定错了
我们还可以依赖out outcome
方程 outcome
model来去估算
如果我们
把 outcome model
给设定错了
我们还可以依赖一个正确的
treatment model来
去估算
说白了只要两个方程
有一个是对的
我们就能做出一个稳健的无偏的估计
把它俩合并使用的目的
那么就是这两个命令
一个叫ra
I p w
一个叫IP w
r a
那么 I p w它就是
一个在Ipw的基础上
加了一个
organization
它是以Ipw为基础的
但是如果当Ipw
做错的时候
它就会启用 r a的这样的一个程序
那么
I p w r a是反过来
它是以ra为基础的
以ra为基础的
但是如果 r a的 outcome
方程错了的话
它就会启用 I p w的方程
如果r一的方程是正确的时候
么ipw这个位置基本上是不起作用的
在我们之前给大家
发的
workshop的文件夹里面有
stata的 menu里面写的很详细
大家回去要去看那个东西
我们就不会一点点去讲它的过程
总而言之
这个是分别以其中一个模型为基础
那么嵌套另外一种方法作为保障
当主方法
它的方程设定错的时候
它就会启用备选的方法
来去纠正
如果主方法设定没有错的话
背景方法基本上不会影响
主方法的结论就是这两个
这两个
嵌套的方法
好
我们再回到stata
咱们再回到stata
再回到stata
大家看一下
从27行到31行
我来给你们简单解读一下
我希望大家自己跑一下
然后跟你的小组成员
来讨论一下
我得给你们点自由讨论的时间
显然27行看到它的命令就是IP
这是
那么28行就是 a I p
刚才说过这两个命令
那么它的后面的方程的命令
的格式就发生变化了
跟前面不一样了
那么你们要讨论为什么分别是什么
你们可以参照刚才我们
讨论过的这两个就是
单一的估算方法
也可以用 help t
effects
来去看相应的一些说明
同时 t effects它也是可以
做matching的
前面的这种方法不叫matching
但是思想非常相似
么t effects可以做matching
它包括两种
一个是最近相邻
na matching
na match它没有去估算
propensity school
它真的就是拿这些自变量一个的去match的
那么这个时候
如果有4个自变量可以用来match
那么谁是主要的
因为有的时候可能不能保证4个自变量
同时都是最近的对不对
确实主要的它可以去定义
bias adjustment
就是定义的谁是最主要的
要优先保证它
match的变量是谁
那么接着就是 ps match
ps man是在 t120也有
而且可以用probit
和logit都可以用
那么你们也可以来看一看
这种方法算的ps match
跟我们上节课用的 ps
match软件包
它算的结果是不是一致的
我觉得大家现在完全可以自己上手来练习
所以
我现在要进行分小组
你们的名字前面一定要把组号加上
这样我分组容易一点
那么分小组之后给大家
大概10分钟的时间
你们
讨论一下
把这几个命令和它的结果讨论透
如果有问题就把它
提出来
小组解答不了
待会我们再
回到主会场之后
你们可以把这个问题提出来
我们一起来探讨一下
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM