当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.8 Centering 2
我们中心话这个点
有三种
第一个就是
grand mean就是整个样本的均值
就是中心化的样本均值
这是一种中心化的方式
坐标平移
那么第二种的中心化的方式是
中心化的group mean
也就是说每一组中心化到各组的均值
比如说学校均值
这是第二种中心化的位置
那么每一组
不同组之间的中心化的点其实就不一样了
那么
第三种就是说都不是上述两种都不是
我还可以中心化到其他位置
它有的时候也是具有现实含义的
待会我们来看一下
那么就是中心化的grand mean
我们把grand mean记作 x
两个点 就是把 i和j都平均掉了
grand mean
然后它有一个bar
平均值的标志
所以说这个就是grand mean
那么我们什么时候用
中心化的grand mean
在教科书上可能都没有写
但是其实是有一个
实际的经验和基本上是一个准则
就是说当我认为
β0j和β1j就是说x的斜率
β1j它是一个固定值
是一个常数
它在第二层
不变
它等于一个常数γ10
这种情况下
我就会把xij
中心化到grand mean
因为它的β1j它
的斜率在第二层不会变
我没有必要把它搞得很复杂
我就用最简单的把它中心化 grand mean
这个时候β0j的含义是什么呢
当这个学生的分数等于
整个样本均值的时候
y的取值是多少
就是β1j的含义
它也是具有很具体含义的 它是
就是学生达到样本均值
整个样本均值的时候
y值
这个大家记住就是grand mean的时候
什么时候中心化的grand mean
我认为
β1j
是不变的
那么接着就是说
这个就是变斜率模型
斜率是可以变的
那么这个斜率可以变的时候
我们如果
把各个组的均值都中心化到
样本均值
它可能就会有问题
它的在第二层的解释上
给了更少的自由度
变化的自由度就更少了
也不太符合现实的情况
比如说这张图三个组的
差别非常大
它的斜率差别也很大
这个时候我都把它强制中心画到一个点上
样本均值上
它不灵活
限制了我们对变斜率的分析
那么这个时候
当我假设β1j在第二层是可以变化的
我就会把xij第一层的xij
中心化到
group mean
它本组的均值group mean
o k
那么这个是这样子
对于第二层的这些
对于第二层的这些变量w
我们一般如果要中心化
如果统一处理的话
我们都把它中心化的grand mean
对于一个二层的模型来讲
我们就不再探讨了
因为它不可能在第三个变化了
我们就两层
那么所有w就是中心化的
grand mean就可以了
你不做中心化呢
本质上也没有什么问题
那么作为一个统一处理
就可以这样处理一下
这个
怎么选取grand mean
和group mean
那么当我们的自变量
有dummy的时候
还有dummy variable的时候
我们怎么选取中心化的点
我们仍然可以
当然我就可以选0和1
我比如说选了0可能就是说
性别为
某一种性别的时候
那么这y的取值它是这个含义
当然我们也可以选择
还是选择均值
选择均值的含义它就是这个比例
就是说
在给定它
这个比例的时候
那么y的取值是多少
那么变成这样的一个含义
所以这个也是根据大家的研究兴趣
你是选择01还是选择均值
它都可以具备一定的含义
但是要搞清楚它到底是什么意思
所以这个地方就简单总结一下
中心化并不复杂
我们为什么要中心化 希望
我们在第二层甚至更高层的分析的时候
我们的截距是有含义的
有现实意义的
那么如果我们认为x的斜率不变
那么我们就把它中心化的grand mean
如果我们认为它的斜率在第二层会变
那么我们就在第一层把它中心化的group mean
如果我们有一些其他的特殊的位置要选择
我们就选择其他特殊的位置
待会我们讲增长模型的时候
我们可以看到
我们就会选择一个特殊的位置
它既不是group mean也不是grand mean
那么这个就是对中心化的一个简单的讨论
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM