当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 6.12 Q&A 2
接下来是我来讲一下第3题和第6题
然后第三题中的第一个小问是问
psm和ols的区别在哪
我觉得主要有两个方面的区别
第一个方面是在于它的
遗漏变量的处理不同
如果是使用ols尤其是简单回归的话
在残差中会存在大量的遗漏变量
来影响我们对系数的估计
而如果使用psm估计的话
我们会先计算一个倾向性得分
而这个得分是由大量的可测变量所构成的
这样一个模型去计算得出的
这样的话
就有效减少了一些遗漏变量的存在
然后第二个区别在于它们的前提假设不同
像psm和ols它们
都有一个共同的假设
就是条件独立假设
但是psm还有两个其它的
假设是ols所没有的
一个是共同
支撑
假设就是说实验组和控制组在
整体上是要有相似的特征
另一个是平行
假设它说的是两组的特征不仅是相似的
而且在这些特征中所包含的
维度它们也应该是相似的
然后我们一起
这个地方就是 p s m
这两个不是psm的假设
而是说
matching之后
它应该满足的两个
特征
就是matching结束就是
matching之后的一个特点
一个是就是common
support
common support
不是它有相似特征 而是说
它们的 score它倾向分数
控制组跟实验组
在不同的
这个分数段内
它们都有样本
是这个意思是吧
它不用相似
它只要有样本就可以
当然它在同一个分数段里
的人肯定它因为分数段是同一个分数段
那么它们的
倾向分数当然是比较相似的
这两个是检验它matching的效果的
考虑不是PSM模型的假设
好的
是不是
好
好像是
好
然后这里就举了1个例子
然后来说明一下
就是说如果我们现在想知道上
清华是否能获得更好的收入
然后我们现在有4个学生
student Thu它就是
实验组的学生
他上了清华
然后其它三个学生是没有上清华的
然后如果我们是在
而是用OLS的思想去检验上
清华是否能获得更好的收入
我们可能会用这个实验组学生
和其它三个学生去比较
但实际上学生一和学生二
他们都和学生上清华的学生不具有可比性
因为学生1他的总分和上
清华的同学并不相同
而学生2虽然总分和他相同
但是单科的成绩差别比较
所以说如果是用上清华的学生
和这两个学生去比较的话
估计出来的结果就是有偏的
但是如果我们是在偏使用PSM
这个方法去做的话
我们就会用上清华的学生
和第三个学生去比较
这两个学生他们不仅是总
很相似的
而且在单科的分数上也是相似的
所以说就可以去进行比较
来判断这个上清华是否能获得更好的收入
然后是下一问是问到 PSM
方法能不能解决内生性问题
还有能否彻底解决选择性偏误
然后这里先梳理了一下内生性
和选择性偏误这两个概念
内生性我们都不陌生
它说的就是模型中的一个或者
多个解释变量和残差相关
如果存在这种问题的话
我们对系数的估计就是有偏的
内生性它的主要来源包括遗漏和
处理效应相关的变量互为因果
还有自选择偏误
而自选择偏误是选择性偏
误的一种选择性偏误
还包括样本选择偏误
然后基于这个概念的理解
我觉得 p s m它能够一定
程度上解决内生性的问题
包括有选择性偏误中自选择偏误所引发
发的内生性问题
但是没有办法彻底解决这个问题
然后一定程度上能解决就说明了
psm这个方法它的优势所在
可以通过倾向性得分的
匹配来实现控制组和
处理组在自身特征这些
因素上面尽量的相同
这样可以减少自选择偏误的问题
但是这个方法是无法彻底解决
内生性问题的
在第5题psm存在哪些缺点中也会提到
然后这里从
就是一个是psm的假设
一个是它这个方法的特点
这两个方面去理解的
然后关于这个条件独立假设的话
其实是一个非常严格的假设
所以有的时候可能会存在一些
遗漏变量去影响倾向性得分
比如说一些不可测的变量或者
没有包含进去的可测变量
而关于共同取值范围
如果我们使用psm这个方法的时候
取值范围太小
它的对应的样本就不具有代表性
这个方法也不是完全合理的
其实但是我们可以通过提高样本量来尽量
减小这两个方面的问题所带来的负面影响
然后这就提到了第6题
有同学问到说psm对样本量要求较高
但是如果我们
无法获取到合适的样本量
我们应该做出哪些调整
我觉得可以分两个阶段来看
如果是在实验之前
我们发现样本量不够的话
我们还可以通过改进抽样设计
的方法去提高样本量
但是假如是像这个同学说的
我们没有办法获取合适的样本量
或者说我们在实验的时候才发现
我们的样本量是不够的
我觉得要看它是对哪一个方面产
产生了比较大的影响
如果说是存在一些遗漏变量
影响了我们倾向性得分的计算
也就是说
对条件独立假设这一方面有比较大的冲击
我们可以用一些其它的解决办法来
完善psm这个方法
然后这里也列到了5项
然后关于这5条它们具体怎么使用的话
可以看一看下面这个材料
但是我们可以通过这5个
5个方法
然后和ps三方
把11起使用来提高对系数估计的准确性
但是如果我们发现的是共同
取值范围太小的话
可能我们最好
还是换一个方法
因为我查到的资料说共同取
值范围是进行匹配的前提
它没有一个
特别好的改进的方法
如果这个方法特别小的
如果这一个范围特别小的话
说明你的数据可能不适合做匹配
最好还是
只放弃psm换一个更合适的方法
但是这里要注意一下
就是总样本量它不是共同
取值范围对应的样本量
所以有的时候也可能会出现总样本量很大
但是共同取值范围很小的情况
然后这个就是和后面第7题有关
我的部分就是这些
意林挺好的
回到上一页
首先我很惊讶你们的自学材料已经都是
b站的 video了是吗
超出我的认知
那么就是关于样本量的问题
虽然psm这个方法
它本身在设计的时候是
针对大样本来设计的
但是因为psm现在被越来越广泛的使用
在比如说医学的研究中
而一大家知道医学实验
的样本量一般都很少
可能就是
几十个100来个
那么所以说
其实也开始有很多的研究来去测测试 p
s m这个方法在小样本上的性能
性质
那么有一些研究也是发现它们通过
monte carlo这样的一些
拟合就发现
其实还不错
就是psm在小样本上的表现也是挺好的
所以这个样本量本身貌似
就不是一个特别值得去
担心的问题
但是确实如果小样本导致
common support
非常的窄
可能就是有问题
好 咱们接着讨论
大家好
我给大家讲一下第4题和第5题
然后第4题问的是psm
和处理效应有什么关系
然后可以从处理项的定义来看
然后从心理学上还有医学上来看
处理效应就是指某个实验条件
的干预对实验结果的影响
在经济学上
通常是指希望评估某项目或者
是政策实施后的效应
然后
在我们研究里面处理效应经常是我们
要研究的一个目的就是说我们要
通过一系列的方法或者是手段
来估计出处理效应
我们一般
采用的方法
比如说之前提到过的断点回归
还有工具不亮等
都是可以来估计处理效应的
一些方法
然后在这个题里面的ps
m也是其中的方法之一
然后我们 p s m通常是
作为我们研究数据预处理的一个步骤
就是这在应用模型估计因果关系之前
有选择地进行修检单元
通过一系列的匹配方法来进行
实验组和对照组之间的匹配
来使它们具有可比性
我们使用
方法的目的就是为了减少所选的协变量
在实验组和对照组之间的不平衡
其实可以那么说处理效应
是我们的研究目的
然后psm是我们所用的方法手段之一
这个问题大家听明白了吗
下面是第5题
p s m存在哪些缺点
主要来说它psm是一种再抽样的方法
它实际上在我所选的样本之中
其实它是进行了一个数据的修剪的过程
然后它主要是有以下三方面的缺点
第一个缺点是样本容量的问题
因为我想把实验组和对照组
进行很好的匹配
那么我必须要有很大的样本容量
来达到这种匹配
然后第二个就是代表性的问题
刚刚依林也说过
PSM的假设之一
是它们两组之间是有
较大的一个取值共同的取值范围
如果没有这种取值范围的话
那么会丢失较多的观测值
这样的话一方面会导致我能
能为我所用的样本容量比较小
还有一方面导致的问题是剩下样本
它其实是不具有代表性的一个问题
然后第三个问题就是
不可测变量的选择
其实不可测变量在很多方法中都会
有这种影响
所以这种不可测变量的选择
会带来一些隐性的偏差
还有一个我找了一下一篇2015
年的一篇工作论文
然后它们
通过一些自己的研究来证实
了psm存在一些问题
因为我们
用psm的目的是为了减少
样本的一些不平衡性
削减模型的依赖性以及偏误
但是我们知道模型越复杂
假设条件越多
没有模型 其实它就越脆弱
我们可以看一下老师上课讲的这张图
然后我们可以看出来这个实验组
跟对照组是用大小来进行匹配
但是我们可以换一种思路
如果实验组跟对照组会有很多不同的形状
比如说是星星三角形这种
如果按是按照形状来匹配的话
而我按照了面积大小来匹配
那么这样就会存在一些问题
回到我们上课说的例子就是说天主教跟
天主教学校跟公立学校
这两个组
然后我们选择的匹配条件
一个是家庭收入
还有一个是前测的数学成绩
但是我们这样想
如果其它条件对它有很大影响
比如说
父母的受教育程度或者父母的职业
对它肯定也有很大的影响
但是
其实父母的影响
如果
父母的影响对它们来说
不是一个主要的影响
而我把它作为一个主要的影响来进行匹配
那么就是说
就会导致这么一个问题
我在不相关或者说是需要不太无关紧要的
无关紧要的方面
我把它进行了匹配
但是我在一些特别重要
的方面没有进行匹配
这样的话
会导致一个新的不均衡的情况
所以 p s m如果就是说
你的匹配的要匹配的变量选的好的话
可能这个模型会产生一个比较好的效果
但是一旦这个ps
你选择那些匹配的力量不太怎么好
比如说是一些细枝末节的队伍
我们所要研究的 treatment
effect影响不太
怎么明显的一些变量
那么它就会导致
在细枝末节或者是一些没有很
大影响的方面上进行匹配
而忽略了一些主要的影响
所以这样的话
会导致一很多新的一些不平衡
所以研究的所估计的结果
也是有很大的偏误的
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM