当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 5.9 Fuzzy RD 3
好
那么我们来看这个是研究
中给出的回归结果
123列是ols的回归结果
大家可以看到红色框里面是它们的系数
当然因为加入了控制变量不一样
它们这个系数
我们会发现怎么样
会有很大的变化 对不对
尤其是
只有一个
regressor
只有class size
这一个变量的时候 大家看一下
它的系数是多少
找个同学回答一下好不好
光我一个人说
来
我们哪个同学愿意主动的跟我对话一下
同学们
随机点个名
**
**来
来说一下第一个例子
根据你的观察123列这个
系数具有什么样的特点
它都是一个正数
然后的话就说
如果它括号里面是标准误
然后的话可以自己算一下显著程度
然后
都是正数
这三个正数差别大不大
还挺大的
特别是
第一列的就跟第二列第三列的大的多
然后你有什么判断吗
它就是说班级规模的话
因为第二年第三年加入了很多的
它是加入的是控制变量还是什么东西
然后就说
加入控制变量
对
就是说可能加入控制变量以后
然后它效应就变小了
就说明它 OLS估计应该
说是是有很多偏差的我感觉
对 说挺好的
就是你看第一列它系数
第一个是正的对不对
也就是说
这个班额越大
它的阅读成绩越好
是不是这个意思
对
而且是显著的对吧
但是没有任何控制变量
但是当我们加入一些很
重要的控制变量之后
这个系数你应该说什么
应该是在迅速的shrink
to zero
对不对
迅速的趋近于0了
从0.3这样的一个
0.3还是挺大的一个系数
从0.3变到0.019
而且它又不显着
因为它标准误是0.04对不对
那么其实它就是跟0没有显著差异了
可以这样讲
所以我们可以看到内生解释变量的系数
它的特点是不是不稳定
然后
明显是内生的
因为我们讲了往往是一些好学校好的班级
大家都愿意往里挤
那么这个时候看上去好像是班额越大
成绩越好 是不是
好 谢谢**
那么
下面后面的从第4列到第8列
用的两阶段最小二乘法
其中四五列是用的full sample
然后678列
用的就是discontinuity
sample
也就是说我们规定了一个很小
的带宽之后来去看的
我们再找一位同学
来解释一下
你看到的
这个系数它有什么样的规律
来 随机点名
来 **
**
你观察第4列到第8列的
系数有什么样的规律
第4列到第8列的系数都是负的
然后我猜想是不是把它带进去就负负得正了
把谁带进去
两阶段这么一综合
对吧
不用猜想就想用了工具变量法
我们是为了解决什么问题
解决选择偏误的问题
对
只要我们前面的模型设定没有问题
它肯定回答的
它肯定是可以解决选择偏误问题的
是不是
是 对
不用猜要推
那么现在负的系数跟前面
OLS的正的系数
你更相信哪一组系数
其实我更相信于前面的一种
正的吗
负的就是班级越小
它的成绩越高
你 ok原因是什么
按常识
常识
常识是什么
就是什么常识
我自己猜班级规模越小
它可能表现的越好
这个“越”字儿是一个相关系
是对一个相关关系的描述
对不对
我们要的是一个因果关系
因果关系它是对一个机制的
一个描述
对吧 但是因有果
你刚才说的这个是一个相关关系
还是一个因果关系
我想表达的是因果关系
好那么比较小
所以它可能各种资源可能就
对每个同学平均的投入可能就比较多
所以因此他们的成绩
表现就越好
对
你这段话就说的是一个机制的问题
对吧
你可以说它是常识
也可以说是一个理论
对吧 你可以
理论就是一个有逻辑的故事是吧
一个解释
这个就是你对它的一个因果的关系的解释
对不对
是
好好 谢谢**
那么我们可以看到
选择不同的带宽
45列是没有选择带宽
跟
678列
选择
正负的带宽和±3更小的一个带宽
那么它们这个系数是不是
还是有一定的波动的
当然波动也跟控制变量的选取有关
但是整体它们都是负的
是不是
我们再来看一下
标准误
我们再找一个同学来看一下这个
标准误有什么样的规律
**
据你观察
第4列到第8列的标准误呈现什么规律呢
**在不在
老师听得到吗
可以了
好的
第4列的第8列标准误
我应该是一个
它更越来越大了
越来越大了
四五列是用的full sample
它的标准误
是0.092和0.113
然后后面我们用了带宽
选了带宽之后就是限制的样本量对不对
它这个标准误大家
**你觉得它是变大了对不对
对的
好好
谢谢**观察是
也是符合我们的观察的
所以大家可以看到
首先就是选择了带宽越小
样本量越少
它的标准误是会变大
第二大家可以看到
OLS这三个标准误
就是1~3列的标准误跟
后面的标准误整体来看
是不是用了工具变量法之后
它的标准误
整体是变大的
我们在工具变量法的时候讨论过
对不对
这是个系统性的变大
因为我们浪费了一些什么
我们牺牲了一些
efficiency来得到什么
来到得来得到无偏的估计
好 那么上面
我们基本上就是把
RD的整个估算
连着这个例子就一块都讨论完了
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM