当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 5.13 RD workshop 2
Ok
那么同样
我们还可以画这个density
就是咱们上节课讲过 我们
RD特别担心的就是
人们会因为提前知道了政策的规定
游戏规则
来操作自己的D
对不对
那么这个时候
我们就会认为它在D的
概率密度函数上
它的频数分布图上
就会出现跳跃
这个是我们
担心的问题
上节课我们举的例子是关于
低保这样的一个情况
那么这里我们就可以对每一个RD的分析
都来做这样一个density的刻画
14行命令就是来去刻画
了这个density
大家可以
自己画一下
因为没有设定带宽
所以它就会跑出三组
会跑出三组带宽的单词题
我们随便挑一个看一下
确实不同的带宽画出来density是不一样的
我们还是用一个带宽的来看
那么这个是一个带宽的设定下
density的情况
它是画了三个图
一个是对于整个样本我画
了一个density
这是上面的一条蓝线
然后在断点两侧分别单独的
画两个density
分别是红线和绿线
那么我们可以看到
这是一个什么样的分布
这是一个双峰分布 对不对
双峰分布
那么
也就是说
在0附近的这种州是非常少的
什么意思就是说
态度不太鲜明的州在选举中态度不太鲜明
选票集中在50%上下
这种情况的州是非常少的
每一个州的态度都很鲜明
这个也确实符合现实
要么它就支持民主党
要么它就支持共和党
所以它会出现双峰
显然这个取负的它是支持的是共和党
那么
正的峰,它这一州它支持的是民主党
这个是符合现实的
也不好说
它只是一个manipulation
的结果
因为没有什么好选民没有什么必要
去manipulate
这是它们的一个整体的选举意向
但是这个做法是这样子的
大家想一下
除了我们用RD帮我们写好的
命令来去跑 density
你们自己如果是想去看一下
这个就是样本里的这些个体是不是
操纵了自己的
forcing variable
的取值
我们直接可以怎么样
我们是不是直接就可以对D做
一个频数分布图就可以了
是不是
所以大家你们自己来敲一下代码
这个是不再do file里面的
大家自己来看一下
我想看一下
这个D它的分布是什么样子的
我们其实就是很简单
我们 hist D就可以了 对不对
我们就可以看到 D的频数分布图
这就出来了
那么显然这个图跟刚才的
这张图是完全一致的
它也是一个双峰 是不是
它们
所以说其实你不需要用 RD
里面的写好的命令
你也可以
自己来去看它的density的情况
所以说
大家慢慢的要具备这种能力
有的时候一些命令是
我们可以自己来去做的
当然你要是能力强的话
你也可以自己写新的软件包出来
好 这是关于检验 density
那么接下来我们来看一个什么呢
既然选择带宽
会影响到我们的估算的结果
我们就想做一个对于带宽的分析
就是取不同带宽
这个结果
到底会有什么样的变化
我们做一个更加形象的这样的分析
我们来看一下第16行命令
大家跑一下第16号命令
这个是第16方面的 option
它其实就是把三种带宽
下
我们估算的结果把它给画出来了
大家可以看到
一个带宽是0.29
两个带宽是0.59
半个带宽是0.15
大概这三个位置
那么红色的就是点估计
这个线段就是我们的95%的置信区间
0
等等这些值,也都画在y轴上了
我们可以看到
取不同的带宽
我们点估计的差异以及它对应的95%
置信区间的大小
就可以很好把它标出来 对不对
这是一个比较
形象的一个做法
那么这种情况是我们取了三个带宽
我们还可以取更多的带宽
把图画得更加的
密实一点
大家看一下第17行
17行这个地方
看这个
命令
option我们在定义带宽的时候
mbw带宽
它是25
小括号25和300
什么意思呢
从25%个带宽
到三个带宽之间
我每隔25%个带宽
我取一次带宽的值
我来做一个RD
那么我就把这一系列的带宽下
RD的结果都把它画出来
这行命令的意思
大家跑一下第17行的命令
好
同学们是不是
跑出了像
就像啥
鱼骨是吧
跑出了这样的一个
图
那么这个就给我们提供了更多带宽下
我们的点估计跟区间估计
的这样的一个结果
当然你看到这张图的时候 可能
如果不是
对这个结果还不是如果熟悉的话
或者对于一般的第一次
看到结果的读者来讲
它不知道哪一个是一个带宽
它要有一个参照
所以我们看一下第18行命令
18行命令加了一个ox
它就把一个带宽给标出来了
大家把18号命令跑一下
这个是第18行命令跑出来的结果
我们可以看到它在一个带宽0.29
带宽下标了一条红线
我们就可以清楚知道谁是一个带宽
那么其它的就是每隔
1/4个带宽
就做一次估计
那么你们通过这张图来看的话
你们有什么感受
对于
估算结果对于带宽的影响
大家有什么感受
就是它的当
但它带宽特别小的时候
它变动了就
非常大
然后好像
后面的之后好像差不太多
就是把它
把它带宽就拉得更大了
也就是说带宽增加以后
它的结果还是比较稳定的 是不是
但是25%个带宽这个情况下
它的值跟其它的值的差别会大一些
是不是
对的
还有关于这个区间估计的精确度
我看一下
这个区间越大
是不是说明它的精确度越差
对不对 因为它区间非常大
它没有办法定义一个更小的区间
那么大家你们陈军来看一下
我们随着带宽的增加
精确度是怎么变化的
带宽越大
它的精确度就看的是
精确度就是更大了
精确度提高了对不对
因为样本量提高了
那么肯定一开始带宽样本量是非常小的
所以大家看一下
25%个带宽的情况下
这个置信区间是非常大的
虽然它这个值看上去就effects
比较大
但是它精确度非常低
所以说
也没有给我们带来更多的信息
零是不是始终的处于我们
的置信区间里面的
所以说这就是为什么我们的结果
也没有办法显著地区别于零
好 谢谢**
有没有同学还没有登陆雨科堂
你要登陆一下
这样的话就可以被点名
好
对于上面sharp RD
大家有没有什么问题
没有问题
老师
我想问一下
我想问一下默认的带宽是怎么样算出来的
我们自己可以选择
这个算法
如果你用RD命令的话是没有办法
因为这个软件包是作者写好的
它就用了一种算法
这个算法你去来用help RD
看一看它是怎么去引用的算法
你就可以找到它这个计算公式
但是这个并没有一个
最优的一个
而最后的带宽它也只是依据
了一个公式来算的
这个是
你要选择的话
你只能说在这个基础上
你选择几个带宽
就刚才我们用这种方式来调整
但是你说你换一个公式来算
那就要你自己去算
它RD它就不会再给你算出来了
好的 谢谢老师
好 下面我们来看fuzzy RD
因为这个数据本身它确实只是
一个sharp的RD的情况
因为美国选举是吧
不可能出现
fuzzy RD的情况
大家想一下这个就非常的
奇怪了
选票多的没有获胜
那么
在选举这种情况下还是很难发生的
所以它本身是一个sharp RD
那么我们做练习
我们就要去来构造一个fuzzy RD
也就是要产生一个
稍微内生一点的一个变量
那么现在
fuzzy RD这个模块
大家可以看到是从21行开始
一直到31行
其实主要是到
29行31
画图了
那么我们来看一下
这一块在干什么
现在我们把大家分到小组里
进行小组讨论
把每一行命令搞清楚
提示大家
要用help RD命令
以及你来看一下
23行它做了一个什么样的
计算
好不好
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM