当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 7.10 Growth model 2
那么下面我们来看
二次项的这样的一个增长曲线
因为
当我们提到增长的问题的时候
往往它不是一个线性增长
它往往是一个
二次函数的一个增长
比如说增长速度越来越慢
或者增长速度越来越快
它往往是这样子的
有个加速度的问题
所以我们就可以去引入二次项
来去分析
在这里大家可以看到
这个地方就加入了二次项
同时这个地方
也非常清晰的标出了一个
中心化的点是l这个l
当然是一个时间点
我希望以什么时间点
为起点
如果我不愿意初始值为起点
我可以以其它地方的点
比如说一岁等等这样的一些
时间点也是可以的
那么这个只是作为一个一般形式放在这里
那么这个地方我们看到加入了二次项的
形式
那么这个地方就强调了一点什么
其实这些孩子
他们被测量的次数和被测量
的时间可以是不一样的
因为当我们假设它就是沿着
同一条曲线来去走的时候
其实他到底是在曲线上哪几个点
去重复测量
这个关系不大
只要能够估算出这个方程形态就可以了
所以它其实是可以在不同的时间间隔
不同的点上来去测量的
就要强调这里
我们可以看到
如果有三个小孩
那么我们通过二次二次函数
对它的增长曲线第一层的
模型分别进行拟合的话
我们就可以画出三条拟合曲线
每一个孩子有一条单独的
增长曲线
这个很有意思 大家可以看到
确实它们具有不同的速度和加速度
就能够体现出
我们在第二层进行建模的必要性
也可以看出个体的差异还是
还是蛮明显的
因此
我们就会在第二层引入三个参数
分别是π0i
π1i和π2i
因为
加入了二次项
所以我们就增加了一个
π2i
那么它就会对应三个参数
和三个
方差分别是这样来对应的
好
那么这个就是一个回归结果
我们一起来看一下
这样大家就会熟悉从公式
到这个结果的这样的一个
一个关系
首先我们可以看到这是点估计
除了
对β00截距项进行估计之外
我们还有这个点估计β10
跟β20的点估计
他们分别是速度
和加速度
第二个就是我们对刚才说的这三个残差
的方差
我们可以分别进行估算
并且进行假设检验
看看他到底
是不是有变化
大家可以看到
其实我们
有两个方差
它卡方检验是不显著的
另外一个是微弱显著
比如说当我们加入了一个二次项之后
它方差的结构的重新的估算
给我们带来一些不同的这样的信息
那么这个是什么原因
我们要来看
那么
这个地方大家可以看到
好像是有一点
挡住了
那么
事实上
这三个变量
π0i
π1i和π2i
它是线性相关了
高度相关
Correlation大家
可以看到这里露出一点来
我不知道为什么显示是这个样子
那么这个线性相关系数非常高了
负的0.9
看到了吧
下面这个是0.8
负的0.8
所以说这个绝对是线性相关了
共线了不是线性相关
是共线了多重共线
因此我们不能同时
把这三个变量都放在这里
这个就是问题所在
所以在这里我们把截距给扔掉了
这个方程里面没有截距
因为它们相关共线
所以就扔掉一个
大家可以看到刚才我们对共线的判断
直接看相关系数
没有什么其他的方法
就是看相关系数是不是
非常高
一般是高于0.7
我们就要谨慎
高于0.8是绝对是
不能接受
那么
我们现在就只剩下一次项和二次项
重新进行估算
那么这个时候它的结果
相对来看是比较平稳合理的
那么一次项和二次项的方差
假设检验也都是
显著的
那么他也是就是说在
跟我们刚才看到的图直观的图就比较
一致了 刚才
显然
不一致了
那么对第一层的模型设定
我们就进行了调整
大家可以看到当你加入二次项的时候
其实要考虑的事情就变得很多了
那么
这样的话我们就在第二层
可以考虑建模
还是我们刚才说的问题
虽然我们认为
π1i跟π0i
他在第二层都可以变化
但是
我们
到底在第二层要放多少
自变量
这个是要谨慎的
就是说我们放多了
说白了这个方程可能跑不出来
可能估算不出来
在这个地方大家可以看到
就在我们其实对π1i
没有做太多的要求
我们就认为它是一个
就是一个随机变量
我没有去解释它
反倒是我只是对π2i它的加速度
要进行建模
这个就是省了很多
简化了很多模型
否则的话就是在第二层有两个带入方程
会非常复杂
我们并不关心
它这个里面的变量的含义
当然也很容易看到
那么这个就是一个建模的这样的
思路
当然你说为什么要这样子
肯定是因为我们这个研究兴趣以及
已有的依据让我们去这样建模的
如果你对π1i更感兴趣
对π2i不太感兴趣
你就得π1i建模π2i
你就不见得说非要去建模解释它
因为
兴趣
ok那么就是这样的一个分析结果
大家可以看到
当我们对π2i进行建模分析的时候
我们就会得到所有的待估参数的估算值
这些都是来去解释π2i的
以及我们对随机干扰项残差的
方差的成分的估算
我们都可以对它进行重新的估算
那么
增长模型的这样的一个思路
大家可以看到
在
多层级线性模型这样的一个估算的框架下
根据我们的研究兴趣研究增长问题
我们是可以非常轻松的
把
重复测量问题
转换成一个组内
就是说学生个体内部
和组间就是学生个体之间
这样的一个概念结构
然后按照多层及线性模型的建模方式
来建模分析
这里面
对于某这个方程的设定最重要的考虑
就是说你是用线性模型还是二次项
一般我们不增加到三次项了
没有必要
那么我们一般会对这些
这个斜率假设它是会变化的
否则我没有必要去建模去分析
当然了我们要经得起假设检验
一般我们还要画图
增长曲线是一个非常直观有意义的
这张图是要画一下的
那么还有要考虑
这些多重共线的问题
以及我们的
在第二层上到底对哪些变量进行
更加充分的这种建模分析
要有一个权衡取舍
不要
一般不要去建full model
full model对每一个第一层
的参数在第二层都建模分析
除非你有特别强的一个数据来支撑
所以有的时候不见得是一个最好的选择
根据研究目的
来去取舍一下
那么这个就是对于增长函数
的一个简单的介绍
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM