当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 6.3 Standard OLS
刚才我们都提到了
**也提到了
家庭收入这个问题
那么这张图很有意思
我们来看一下
这张图把家庭收入分成三类
分成三档
中高低三档
那么这边
左侧是public school
右侧是catholic school
好 大家可以看
方块大小可能应该是代表了
sample size
所以说确实去公立学校的学生
人数肯定是比较多的
去私立学校的学生的人数是比较少的
所以说大小就比较明显
那么大家来看一下
你从这样的一张图里面观察到哪些规律
哪些特点
就是这几个变量的关系一共是
三个变量
一个是学校类型
第二个是家庭收入
第三个是成绩
我们找一位同学
都签到了真快
来**
**给咱描述一下
你从这张图里面观察到哪些特点
老师好 然后
我看一下
那个特点
公立学校它的
成绩是比上
这是一个宗教学校的成绩是
一的
然后的话
它
然后
收入越
高的话
它线的斜率是越
斜斜率越小 就说明
收入越高 受的
学校的影响是越小的
然后的话别的目前还没有看出来老师
好
谢谢叔叔观察是非常重要的
那么
当然这张表还不够明显
这张图还不够明显
就是关于收入的
分配的问题
我们下面还有表格来看
那么这个里面速度首先观察到
即便是比如说我们都看
某某一个收入等级的
比如说低收入家庭的学生
那么它也是有一些人
能够去私立学校的
大部分人去的是公立学校
那么就算在这样的一个人群里面
我们会看到一条这样的
非常明显的一条曲线
也就是说私立学校
它的平均分是高于公立学校的
好 这是一个
当然这三个都是一样都是高的
那么这里面还有什么特点呢
这三条曲线速度注意到
它这个曲线这个斜率是不是一不相等
这三条曲线的斜率是不相等的
那么为什么不相等
我们可以再再展开去讨论
那么但是它说明一点
也就是说
在同样一个收入等级内部
公立学校就是这么说
私立学校相对于公立学校
来讲 对学生的影响
这个程度是不一样的
我们叫它一种异质性影响
heterogeneous
heterogeneous
effect
好异质性影响
说了就观察到这一点了
这一点非常重要
后面我们也会讨论
那么还有一个确实大家可以看到说如果
这个是高收入家庭
是不是方块
它要比方块要大
而这边就是低收入家庭
像灰色的方块
它又比上面的要大
是不是
也就是说明什么呢
确实
低收入家庭的学生
它去公立学校的比例更高一点
去私立学校的比例更低一些
只有一个比例的差异
在这里
那么
速度其实还有一点是很明显的
就在一个学校内部
在一个学校内部
也就是我们都看左侧或者都看右侧
收入高的家庭
成绩高还是收入低的家庭成绩高
是不是收入高的家庭成绩高
我们在一个学校内部
来看
对吧 我换一个颜色
比如说我们把它劈开
我们只看
右边
这边都是私立学校
这是高收入家庭 它的平均分在这儿
这个是中等收入家庭平均分在这儿
这是低收入家庭
那么显然是高收入家庭
的学生成绩是更高的
是不是
那么同样在公立学校同样的这样一个特点
高收入家庭的学生成绩是更高的
低收入家庭的学生成绩是更低的
那么这个特点
其实很明显的 是不是
但是现在大家的头脑都已经
被训练得很复杂了
你们上来就发现了一个更加
复杂的关系
把简单的关系给
漏掉了
我们要回归
原始的这样的一个观察
所以这也是很重要的一个观察
是不是
那么还有一点很重要
虚线
实线什么实线是
一每一个收入等级内部
公立学校跟私立学校的差值
它
我们用时间来表示
这个虚线
这条虚线这个斜率它是对整个样本
就是我不去区分
不去区分它是
哪一个收入等级的都放在一起
就像在前面我们回归
咱们前面回归
简单的一元回归
那么它的斜率0.38 0.39
就是这条虚线
大家可以看到
其实这条虚线
它的斜率跟那几条实线的斜率相比有什么
区别
谁的斜率
更高一点 更陡一点
是不是虚线的斜率更陡
这个虚线大家仔细看它是
它是比它临近的这条时间要陡一点的
它比上面这个肯定要陡
它跟下面这个相比
如果拿个尺子量的话
也会发现它也是要陡一点的
也就是说
它说明一个什么问题
我们不去区分它是哪一个收入等级的
直接就是整个样本跑一个简单的回归
那么是得出来是斜率是虚线
那么我在每一个收入等级
内部相当于是个子样本
分了层了
在每一个收入等级内部
我也跑一个简单回归
那么β的斜率β这个
值就是实线的斜率
我们发现虚线比实现要斗
就说明整个样本的回归结果
β1
它要比分层跑的
两组的对比β
比它要怎么样
比它要大 是不是
那么这个差值
这个斜率的差值其实就是我们因为忽略了
收入的
差异或者是收入带来的影响
而导致的一部分的偏误
这个就是用这个虚线跟实线之间的差值
就能很清晰的看出这一点来
好 我们先
休息5分钟 咱们再接着讨论
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM