当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 5.11 Validity and assumption test 2
那么带宽的选择并没有一个绝对的结论
说什么样的选择是
一定是非常好的
像这篇文章
详细的讨论了带宽的
优化的模型的问题以及实际算法的问题
我们并不要求掌握 大家感兴趣
可以找来看一下
这篇谷歌的引用已经达到了2000多次
我们 stata 里面
带的RD的命令
它带宽计算也是参考了这两位作者的算法
那么这个地方大家可能也能看到
在我们的书上也有对带宽的讨论
其中 data driven
其实是一个主要的思想
也是我们根据数据的情况
来去选择带宽
那么大体的逻辑是什么样子的呢
就是说我们
把带宽参数h
放到,就是先把它
h在哪里出现
h在这儿出现 大家看看一下
在对RD的估算里面
我们其实是有这个参数
h是在这里的
它就是规定带宽
那么我们显然可以对左右两边的函数
通过局部线性回归来求出
我们对左右两边的函数通过
局性局部的线性回归
我们可以求出这个方程的参数
比如说α和β这样的参数
它可以
在方程组的两侧不相等
我们刚才都讨论过了
我们可以求出来
求完之后这个里面还有一个参数没有求
就是h,h可以放在这个里面
这样的话我们就可以计算出 μ
hat
μ hat就是我们要的
α左和α右它的函数
这个里面它就是h的一个函数
当然大家知道α右减α左是不是
就是我们的treatment effect
所以说
μ是非常重要的一个
一个函数
那么
其实我们在构造一个
sum of squares
就是y减去μ hat的平方
当然在左侧还是在右侧
x在
断点的左侧和右侧就会分别
取不同的方程形态了
上面第一个
那么这个里面就只有一个待估参数
就是h
我们把它定义为这样的一个函数
这样的话我在求它的最小值
关于h求它的最小值
这个时候求它的h就被认为
是一个可以参考的带宽
那么这是一个比较
我认为是比较好理解的一个思路
这是一种逻辑
当然我们可以有很多种逻辑来去定义带宽
没有最优解
这里面最重要的是什么呢
最重要的就是说我们的结论
是不是对于带宽的选择是非常敏感的
也就是说
当我选择不同的带宽的时候
我的结论会有很大的变化
这个就不行
所以我们往往要做的事情是什么呢
就是说不论我们一开始用什么
方法选择了什么带宽
我们都要同时
再在带宽的基础上
我们再取带宽的一半
或者带宽的两倍
等等甚至是更多倍
我们来把不同的带宽
我们最后算出来的RD的结果
我们都算一遍来比较一下
如果它们非常稳定
那就是皆大欢喜的一个结论
如果
我们选择不同的带宽
使得我们的结果
非常的
震荡不稳定
比如说我们在选择某一个带宽的时候
这个结果是非常显著的
选择其它带宽都不显著
这种情况
非常糟糕了
那么也就是说我们的结论
对于带宽是非常敏感的
这种不就不行就有问题
所以说我个人认为选最初
的带宽选择哪一个
没有什么最优解
那么有的时候也是经验
像刚才看那个表格里面它
就直接选个±3±5
这个都没有什么
特别的理由
但是我们不能只选一种带宽
一定要选多种带宽
我们下周的workshop也会专门的
来去练习这个我们会选一组带宽
我们可能不是只选3个
我们可能选10个带宽
如果这10个带宽下
结果都很稳定
我们就不用担心了
这个结果它就是可以的
但是如果不稳定那就很有问题
也不见得有更好的结论来解释它
因为我们本身带宽就没有一个唯一的
确定的最优解
这是关于带宽的讨论
大家有没有问题
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM