当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.7 Centering 1
我们再来说 centering
中心化这个问题
大家也越来越熟悉了
为什么我们要中心化
我们先看一看我们有哪些中心化的情况
那么第一个中心化就是说
这个斜率是不变的
截距不一样
各个组
比如各个学校他们之间的截距不一样
斜率是
是一样的
那么就是这样的一种形态
第二种情况就是说我们假设它的截距
和斜率都可以变化
那么每一组
单独画一条拟合曲线的话
那么三组人
就能够画出类似这样的一些拟合曲线
这是我们的数据结构
它能够体现出来的
所以对这样的情况我们可以分别来讨论
我们要不要中心化
以及我们怎么去中心化
好
那么这个里面最重要的一点是什么
就是为什么我们要在 hlm
里面单独的提中心化的事情
是因为
大家可以看到
我们在多层级模型里面
其实我们对于第一层的截距
我们是很重视的
我们认为第一层的截距
它因为在组间有变化
因此我在第二层把
截距
作为outcome
作为因变量
对它进行建模分析 对不对
那么这个时候我们当然希望我们
的因变量是具有实际含义的
我们希望我们分析的因变量它有实际含义
如果它没有一个实际的含义的话
我分析来分析去 我对它的解释
其实就会特别的不直观
不是会错 但是会不直观
因此我希望通过中心化使得
我第一层的产生的截距
在第二层作为因变量的时候
它有非常直观有现实意义的含义
这个是一个非常重要的动机
为什么我们要考虑中心化
以及中心化的位置
大家看这两张图
那么左边这张图是身高
那么这样这是一个拟合曲线
那么
显然就是截距
它是在x等于0的时候
y的取值这是截距
大家想我们研究的对象是不是基本上
不可能遇到身高为0的这种情况
你出生的婴儿他身高也不为0
对不对
所以这个时候如果我们不做中心化的时候
第一层产生的截距
它的含义是没有什么现实意义的
我们当然就希望去做一个中心化
使得它具备一定的意义
那么另外一种情况
比如右边这张图
它是 x它是温度这第一层的
那么大家想要温度的话
0它其实是有含义的
零度是一个非常重要的
一个温度含义
那么这个时候
它是有实际意义的
就是截距有实际拮据的意义就是
说当温度等于0的时候
那么 y的取值是多少
比如增长速度
比如说植物的生长速度什么的
那么这个时候它的含义是非常清晰的
所以他就可以直接不用中心化
放到第二层作为outcome
variable来去使用
举了一个例子
所以说我们中心化的目的
是为了让中心化之后
产生的截距
在更高一层它有实际意义
那么大家看这个就是一个
非常标准的两层的模型
我们可以对第一层的自变量x
和对第二层的自变量w
都进行中心化
我们都可以考虑中心化
那么我们怎么考虑
我们来看一下
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM