6.12 Q&A 2慕课视频播放-教育定量研究方法（高级）-MOOC慕课视频教程-柠檬大学

接下来是我来讲一下第3题和第6题

然后第三题中的第一个小问是问

psm和ols的区别在哪

我觉得主要有两个方面的区别

第一个方面是在于它的

遗漏变量的处理不同

如果是使用ols尤其是简单回归的话

在残差中会存在大量的遗漏变量

来影响我们对系数的估计

而如果使用psm估计的话

我们会先计算一个倾向性得分

而这个得分是由大量的可测变量所构成的

这样一个模型去计算得出的

这样的话

就有效减少了一些遗漏变量的存在

然后第二个区别在于它们的前提假设不同

像psm和ols它们

都有一个共同的假设

就是条件独立假设

但是psm还有两个其它的

假设是ols所没有的

一个是共同

支撑

假设就是说实验组和控制组在

整体上是要有相似的特征

另一个是平行

假设它说的是两组的特征不仅是相似的

而且在这些特征中所包含的

维度它们也应该是相似的

然后我们一起

这个地方就是 p s m

这两个不是psm的假设

而是说

matching之后

它应该满足的两个

特征

就是matching结束就是

matching之后的一个特点

一个是就是common

support

common support

不是它有相似特征而是说

它们的 score它倾向分数

控制组跟实验组

在不同的

这个分数段内

它们都有样本

是这个意思是吧

它不用相似

它只要有样本就可以

当然它在同一个分数段里

的人肯定它因为分数段是同一个分数段

那么它们的

倾向分数当然是比较相似的

这两个是检验它matching的效果的

考虑不是PSM模型的假设

好的

是不是

好

好像是

好

然后这里就举了1个例子

然后来说明一下

就是说如果我们现在想知道上

清华是否能获得更好的收入

然后我们现在有4个学生

student Thu它就是

实验组的学生

他上了清华

然后其它三个学生是没有上清华的

然后如果我们是在

而是用OLS的思想去检验上

清华是否能获得更好的收入

我们可能会用这个实验组学生

和其它三个学生去比较

但实际上学生一和学生二

他们都和学生上清华的学生不具有可比性

因为学生1他的总分和上

清华的同学并不相同

而学生2虽然总分和他相同

但是单科的成绩差别比较

所以说如果是用上清华的学生

和这两个学生去比较的话

估计出来的结果就是有偏的

但是如果我们是在偏使用PSM

这个方法去做的话

我们就会用上清华的学生

和第三个学生去比较

这两个学生他们不仅是总

很相似的

而且在单科的分数上也是相似的

所以说就可以去进行比较

来判断这个上清华是否能获得更好的收入

然后是下一问是问到 PSM

方法能不能解决内生性问题

还有能否彻底解决选择性偏误

然后这里先梳理了一下内生性

和选择性偏误这两个概念

内生性我们都不陌生

它说的就是模型中的一个或者

多个解释变量和残差相关

如果存在这种问题的话

我们对系数的估计就是有偏的

内生性它的主要来源包括遗漏和

处理效应相关的变量互为因果

还有自选择偏误

而自选择偏误是选择性偏

误的一种选择性偏误

还包括样本选择偏误

然后基于这个概念的理解

我觉得 p s m它能够一定

程度上解决内生性的问题

包括有选择性偏误中自选择偏误所引发

发的内生性问题

但是没有办法彻底解决这个问题

然后一定程度上能解决就说明了

psm这个方法它的优势所在

可以通过倾向性得分的

匹配来实现控制组和

处理组在自身特征这些

因素上面尽量的相同

这样可以减少自选择偏误的问题

但是这个方法是无法彻底解决

内生性问题的

在第5题psm存在哪些缺点中也会提到

然后这里从

就是一个是psm的假设

一个是它这个方法的特点

这两个方面去理解的

然后关于这个条件独立假设的话

其实是一个非常严格的假设

所以有的时候可能会存在一些

遗漏变量去影响倾向性得分

比如说一些不可测的变量或者

没有包含进去的可测变量

而关于共同取值范围

如果我们使用psm这个方法的时候

取值范围太小

它的对应的样本就不具有代表性

这个方法也不是完全合理的

其实但是我们可以通过提高样本量来尽量

减小这两个方面的问题所带来的负面影响

然后这就提到了第6题

有同学问到说psm对样本量要求较高

但是如果我们

无法获取到合适的样本量

我们应该做出哪些调整

我觉得可以分两个阶段来看

如果是在实验之前

我们发现样本量不够的话

我们还可以通过改进抽样设计

的方法去提高样本量

但是假如是像这个同学说的

我们没有办法获取合适的样本量

或者说我们在实验的时候才发现

我们的样本量是不够的

我觉得要看它是对哪一个方面产

产生了比较大的影响

如果说是存在一些遗漏变量

影响了我们倾向性得分的计算

也就是说

对条件独立假设这一方面有比较大的冲击

我们可以用一些其它的解决办法来

完善psm这个方法

然后这里也列到了5项

然后关于这5条它们具体怎么使用的话

可以看一看下面这个材料

但是我们可以通过这5个

5个方法

然后和ps三方

把11起使用来提高对系数估计的准确性

但是如果我们发现的是共同

取值范围太小的话

可能我们最好

还是换一个方法

因为我查到的资料说共同取

值范围是进行匹配的前提

它没有一个

特别好的改进的方法

如果这个方法特别小的

如果这一个范围特别小的话

说明你的数据可能不适合做匹配

最好还是

只放弃psm换一个更合适的方法

但是这里要注意一下

就是总样本量它不是共同

取值范围对应的样本量

所以有的时候也可能会出现总样本量很大

但是共同取值范围很小的情况

然后这个就是和后面第7题有关

我的部分就是这些

意林挺好的

回到上一页

首先我很惊讶你们的自学材料已经都是

b站的 video了是吗

超出我的认知

那么就是关于样本量的问题

虽然psm这个方法

它本身在设计的时候是

针对大样本来设计的

但是因为psm现在被越来越广泛的使用

在比如说医学的研究中

而一大家知道医学实验

的样本量一般都很少

可能就是

几十个100来个

那么所以说

其实也开始有很多的研究来去测测试 p

s m这个方法在小样本上的性能

性质

那么有一些研究也是发现它们通过

monte carlo这样的一些

拟合就发现

其实还不错

就是psm在小样本上的表现也是挺好的

所以这个样本量本身貌似

就不是一个特别值得去

担心的问题

但是确实如果小样本导致

common support

非常的窄

可能就是有问题

好咱们接着讨论

大家好

我给大家讲一下第4题和第5题

然后第4题问的是psm

和处理效应有什么关系

然后可以从处理项的定义来看

然后从心理学上还有医学上来看

处理效应就是指某个实验条件

的干预对实验结果的影响

在经济学上

通常是指希望评估某项目或者

是政策实施后的效应

然后

在我们研究里面处理效应经常是我们

要研究的一个目的就是说我们要

通过一系列的方法或者是手段

来估计出处理效应

我们一般

采用的方法

比如说之前提到过的断点回归

还有工具不亮等

都是可以来估计处理效应的

一些方法

然后在这个题里面的ps

m也是其中的方法之一

然后我们 p s m通常是

作为我们研究数据预处理的一个步骤

就是这在应用模型估计因果关系之前

有选择地进行修检单元

通过一系列的匹配方法来进行

实验组和对照组之间的匹配

来使它们具有可比性

我们使用

方法的目的就是为了减少所选的协变量

在实验组和对照组之间的不平衡

其实可以那么说处理效应

是我们的研究目的

然后psm是我们所用的方法手段之一

这个问题大家听明白了吗

下面是第5题

p s m存在哪些缺点

主要来说它psm是一种再抽样的方法

它实际上在我所选的样本之中

其实它是进行了一个数据的修剪的过程

然后它主要是有以下三方面的缺点

第一个缺点是样本容量的问题

因为我想把实验组和对照组

进行很好的匹配

那么我必须要有很大的样本容量

来达到这种匹配

然后第二个就是代表性的问题

刚刚依林也说过

PSM的假设之一

是它们两组之间是有

较大的一个取值共同的取值范围

如果没有这种取值范围的话

那么会丢失较多的观测值

这样的话一方面会导致我能

能为我所用的样本容量比较小

还有一方面导致的问题是剩下样本

它其实是不具有代表性的一个问题

然后第三个问题就是

不可测变量的选择

其实不可测变量在很多方法中都会

有这种影响

所以这种不可测变量的选择

会带来一些隐性的偏差

还有一个我找了一下一篇2015

年的一篇工作论文

然后它们

通过一些自己的研究来证实

了psm存在一些问题

因为我们

用psm的目的是为了减少

样本的一些不平衡性

削减模型的依赖性以及偏误

但是我们知道模型越复杂

假设条件越多

没有模型其实它就越脆弱

我们可以看一下老师上课讲的这张图

然后我们可以看出来这个实验组

跟对照组是用大小来进行匹配

但是我们可以换一种思路

如果实验组跟对照组会有很多不同的形状

比如说是星星三角形这种

如果按是按照形状来匹配的话

而我按照了面积大小来匹配

那么这样就会存在一些问题

回到我们上课说的例子就是说天主教跟

天主教学校跟公立学校

这两个组

然后我们选择的匹配条件

一个是家庭收入

还有一个是前测的数学成绩

但是我们这样想

如果其它条件对它有很大影响

比如说

父母的受教育程度或者父母的职业

对它肯定也有很大的影响

但是

其实父母的影响

如果

父母的影响对它们来说

不是一个主要的影响

而我把它作为一个主要的影响来进行匹配

那么就是说

就会导致这么一个问题

我在不相关或者说是需要不太无关紧要的

无关紧要的方面

我把它进行了匹配

但是我在一些特别重要

的方面没有进行匹配

这样的话

会导致一个新的不均衡的情况

所以 p s m如果就是说

你的匹配的要匹配的变量选的好的话

可能这个模型会产生一个比较好的效果

但是一旦这个ps

你选择那些匹配的力量不太怎么好

比如说是一些细枝末节的队伍

我们所要研究的 treatment

effect影响不太

怎么明显的一些变量

那么它就会导致

在细枝末节或者是一些没有很

大影响的方面上进行匹配

而忽略了一些主要的影响

所以这样的话

会导致一很多新的一些不平衡

所以研究的所估计的结果

也是有很大的偏误的

6.12 Q&A 2在线视频

6.12 Q&A 2课程教案、知识点、字幕

教育定量研究方法（高级）课程列表：

Weeks 1 & 2 Basic Econometrics

Weeks 3 & 4: Instrumental Variable

Weeks 5 & 6: Randomized Experiments - Class Size, Career Academies

Weeks 7 & 8: Natural experiment and DID

Weeks 9 & 10: Regression discontinuity

Weeks 11&12: Propensity Score Matching

Weeks 13&14: HLM

6.12 Q&A 2笔记与讨论

也许你还感兴趣的课程: