6.24 PSM workshop Q&A 1慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

首先是第一个问题

说下图是ps match2的一个结果

然后首先是一个解读

第二个它主要是问了一下

从图上看没有ate的结果

然后是需要我们自己推算

还是说

ps match2的一个弊端

在于无法得出 a t e

我这只放了一个加入了ate的结果

就是我们在 outcome

后面加上一个ate

这个就会自动爆出att atu ate

然后左边这个图是这样的

然后的话就是说他这个解读的话

其实老师上课有时候他也包括

它包括number of

observations一这一次

是样本数量和卡方值p值以及调整后

的R方

然后下面的话

依次是系数和标准误

然后p值和置信区间

这个图的中间那部分表格可能相对出现

大家比较关心的一个是未匹配之前的

一个 difference

然后一一次包括att atu和ate

然后我们在命令后面加入ate

可以报出这所有的一个结果

然后这儿需要注意的一个就是

红色框里面注释部分就说

psmathc2

它是一个较早出现的非官方的命令

然后最大的缺陷在于它的标准误

不太正

标准误并不正确

然后的话就说就像红色框里面所显示的

他所提供的标准误并未考虑

得到的倾向得分是估计的

标准误的利益假设是同方差可能也不成立

然后的话具体大家可以参考一下陈强的

高级计量经济学以及四大应用第28章

然后就说解决方法就说是开发

了一系列的新的命令

就是说大家比较熟悉的 t effects

然后包括它的一个子命令t effects

p s match

然后它的优点就是说给出

了一个正确的标准误

然后所谓的ai标准误

然后下面这幅图右边这幅图所显示

的 a和i是两个人的名字

然后这是第一个小题

然后我没有说明白

大家可以随时打断

对

然后第二个小题说的是 work

shop里面给出的多种方法

进行 p s m的一个计算

在实际的研究中

是需要把这些方法都跑一遍

呈现所有的结果

还是说有所选择

就像我们课上所呈现的就是

所有的命令跑出来之后

结果其实差不多

但又不完全相等

这种情况下应该如何回报

我们首先回顾一下关于匹配方法的选择

就说首先是不存在适用于一切

情形的好方法的时候

根据具体数据选择匹配方法

在实践中就是说一个做法就是说

有一些经验法则可以来参加

比如说控制个体不多的时候

选择一个有范围的匹配

如果控制组有较多个体

可以选择一个和匹配

以提高效率

然后在实践当中最常用的一个方法

就是尝试不同的一个匹配方法

然后比较它们的结果相似则说明比较稳健

如果差异较大就要考虑其中的原因

然后关于处理效应的计算

其实和匹配方法的一个

考虑其实是差不多的

然后我们最常用的方法也会考虑

在一个尝试不同的匹配方法

然后比较它们的结果相似则说明他们健康

但是处于一个谨慎的考虑的话

我们会更多地考虑一个

IPW, r a和 aipw

因为他们一个是具有增强

具有回归调整的逆概率加权

和增强的逆概率加权

他们的结果是一个稳健的

就是说它是对结果的方程和处理

方程联合起来进行建模

只需要其中一个方程设定正确

然后它的结果就比较稳健

所以说我们是更倾向于用

后面这两个来进行一个

进行一个 p s m的计算

就是说进行一个处理效应的计算

然后这是第二个小节

如果大家有问题可以随时提

没有问题的话

下一个就***同学接着讲三第三个问题

好的

好的是同学们大家好

我负责的是第三道题

第三道题其实有两个部分

第一部分问的是att当它不是

一个当treatment

不是一个二分变量的时候

它指的是除了选定控制组之外

其他所有组的平均处理效应

还是指向左的平均处理效应

其实这是一个比较基本的问题

我们说att它就是对指定组也就是

衰竭的group的平均处理效应

然后再看第二个问问题

问的是在这样一个命令里面

它 t level(h)

是选定实验组为h组吗

然后底下这些系数应该如何解释

看stata里面它的help一下的话

可以发现它这里说明了

control括号里面的

指的是 control group

然后t level括号里面

的是treated group

然后注意这里的treated

group和treatment是要

区分开的

它指的只是 treaty的group

然后后面我们会具体讲述一下

treated group是什么意思

我们来回顾一下att的概念

就是我们说

这一问想要问的是

是treatment不是二分变量的时候

att是会有什么变化

我们说这要回到att它的定义上来

Att就是

average treatment

effect on the

treated group

也就是说我们首先要找到

treated group是什么

用张老师课上举的例子来说的话

就是蓝色的实心点

就表示了这个

treaty的group

它的 treated之后的结果

然后绿色的空心点表示的就是

treated group在没有

take treatment

的时候的结果

也就是说ATT我们首先第一

步先找到treated group是什么

然后再找到他的反事实是什么

然后计算这两者之间的差距

也就是

蓝色时间和绿色空心之间的差值

如果说 treatment

不是一个二分变量的话

我们可以采用一样的这种

思路来表述这个结果

把它分到下一页

因为

在时代里面给大家展示的结果比较复杂

所以我建立了一个非常简单的模型

通过

比较基本的模型

可以看出来他的思路是什么

首先我们来看

假设说有4个班的同学

这4个班一般的同学成绩最好

然后工资也越高

4班同学成绩最差

工资也越低

然后成绩和工资是一个线性关系

好请放到下一页

然后在这个情况下

我们就可以针对每一个班级的同学

他们如果不在这个班级

还是考这个分数

能够拿到什么样的工资

做出一个反事实的

一个假设

在这里面我们列出了和在

老师给的

文档里面的

小组数量一样多

都是4组

来进行一个说明

请翻到下一页

我们可以在这张图上看到

蓝色点的部分是实际上这个班

的同学的成绩所对应的工资

而绿色部分是我们

补充上的他的反事实的情况

也就是说如果

对咱们下一页谢谢

也就是说如果说这个同学他不在

这个班而取得同样的成绩的话

我们把是不是在这个班看作

一个treatment

然后他不在这个班

他同样成绩取得的工资看作是 take

treatment之后

得到一个反事实的结果

由此我们就可以算出

在

不同的control group和

treatment group情况下

它到底是一个怎么样的

一个值

随便举一个例子

假设我们春 control

group是

group two 也就是说

二班同学

我申请使用一下注释

这里看错了

Control 2的

意思就是说把二班同学

作为一个control group

然后t level3意思是说把三班同学

作为 treated group

我们说att计算的时候

首先第一步是要找到 treated

group

这里treated group是三班

所以我们看是这些数

然后在这些时候

他如果说不在三班

也就是说take了其他的

treatment的话

那么它就会相应的在这里

这个模型是一个我们说是用

怎么说

这些部分是

三班同学他在take其他的

treatment的情况下的可能

的取值

然后我们看他control的是二

也就是说这一部分是他的control

而在这里

分别是13和4对它的区别

也就是说

可以看到分别是d

e和e加f就是这三个班

的

不同的treatment 相比起

control的

treatment

的差距

然后底下的9.01不用说

它比较简单

就是这个班它的

纵轴上取值均值

不知道还有没有同学有疑问

有疑问可以提出

没有的话这道题就结束了

接下来是四

第4题是

包含三个部分

一是 I p w的一个原理

这个图是老师课上的PPT

然后我觉得也比较直观

总体当中任何一个个体都有

可能被随机选择到的概率

被选择概率是

是ω

那么备选它的权重就是取倒就是

ω分之一点的大小

也就代表了

看一下

然后麻烦下一个页

第二部分是一个stata的操作问题

这个是work shop

当中的do file的

的案

是前面的用的

前面的例子就是

母亲是否抽烟

然后对婴儿的影响的例子

然后用这个例子讲的话会比较清楚

第一行就是

对于这些

也变量进行一个预判

用了回归他们对他们进行一个预判

然后接下来是生成ps

并根据

他是否为smoker

进行对ps进行一个赋值

麻烦下一页谢谢

然后接下来就是分别用ra

ipw的方法

跑两个回归

然后第一个 r a是一个回归

调整是对

结果来进行建模

然后 t efffects的里

默认使用的是logit

然后第二个ipw的话

它是对一个分配过程进行一个建模

然后这里它

加了一个probit的话

使用了 prohibit回归

然后再进行一个共同支撑检验

共同支撑检验的意思就是

比较通俗的理解就是说

在这个实验当中实验数据当中

它的

观测数据当中它的

你和他的

它可以用拟合度来讲

就是它的拟合度的除了

我们关注的变量之外

它其他的同质性

同质性的

大小是不是符合我们的要求

麻烦下一页谢谢

下一页这部分就是分别运行ipw ra

就是一个回归调整的ipw

对结果和treatment的过程都进行建模

在使用它的ipw的权重来

估计校正后的回归系数

随后来进行执行一个回归调整

然后aipw是

是一个增强

他们有

它是相当于ipw加了一个偏正的校正项

如果 treatment

的模型指定不正确

但是

结果的模型指定是正确的话

它就会进行一个自动的调整

然后nmh是

进行一个最临近匹配

ps match是

针对倾向分数来进行的倾向评分匹配

为了对比结果差异的大小来

验证方法一个是否稳健

如果差异过大的话可能需要进行调整

下一页谢谢

第三部分是跟kernel

match的一个比较

可能是通过

构造一个虚拟的对象来匹配处理组

构造的原则是对现有的控制变量做

进行一个权重的平均权重的处

取值和处理组控制组的

评分差距成反向相关

一般按照跟核的距离跃进权重

越大的规则进行一个加权

相似的点是他们都有一个反向相关的关系

ipw是跟被选择的概率反映

然后kernel是

处理控制组的评分的差值

的差距成一个反向相关

然后他还有一个他们相同的优点

就是

样本数据基本上都能够使用不浪费

然后不同的点的话

ipw是对已观察到的个体数据加群

然后可能是多了一个

增加了一个虚拟对象的匹配

然后

然后对以观察到的和虚拟

出来的个体都进行一个加权

6.24 PSM workshop Q&A 1在线视频

6.24 PSM workshop Q&A 1课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

6.24 PSM workshop Q&A 1笔记与讨论

也许你还感兴趣的课程: