当前课程知识点:教育定量研究方法(高级) > Weeks 13&14: HLM > HLM > 2.5 Idea of IV 2
好
那么这个就是关于工具变量的 idea
非常朴素机械
直白
有问题的可以现在提出来
*问的问题
工具变量是否要跟因变量相关
*问的问题很重要
大家想
我们是不是就要用z
抠出来的x来去解释y
那么如果通过z扣出来的x
跟y没有重叠的话
它就解释不了y了 是不是 所以
肯定本质上z跟y是要相关的
我想问一下
直接问 很好 *
不是说这是通过x才能跟y相关的吗
如果再和y直接相关的
那不就是
内生性问题了吗
好问题
Z通过x跟y相关
这个是说它们的一个从理论上的作用机制
就是z变量在理论上
它只能影响x
在理论上它跟y
是没有任何关系的
这是理论上的这种因果关系
是这么来说的
Z通过影响x来影响y
但是在统计上
因为统计它只去计算两个变量的相关系数
对不对
它不考虑是因果关系还是相关
还是说是一个随机的偶然的相关
它
统计本身是没有一个理论假设的
它只是对变量的一种关系的计算
那么在这种情况下
大家想如果z跟x相关
x跟y相关
z它是不是也是跟y是相关的
在统计上这两个变量是相关的
但是相关的变量并不见得
都有具体的含义
是不是
这个关系可能是没有任何的理论去解释的
这个是可以的
是不是 *
好
z
很重要
*问得很好
z跟y相关
并不等于说z是一个外生变量
大家想x跟y相不相关
X跟y是相关的
当x跟残差不相关的时候
我们叫把x叫做什么
叫做外生解释变量
但即便x是一个外生解释变量
它是不是跟y还是相关的
因为如果它要跟y不相关的话
它怎么去解释y呢
是不是
好好 谢谢*
对
所以说我们说变量
我们说的内生和外生本质上都在讨论
自变量我们本质上不讨论因变量
刚才那个问题只是帮大家去
剖析一下这个问题的本质
那么一般来讲我们说内生
外生全说的是自变量
那么自变量是内生还是外生呢
唯一的一个判断标准就是
它跟残差是不是相关
不是跟y相不相关
所有的自变量都跟y相关
如果这些自变量跟y不相关的话
在数学上在统计上跟y不相关
它在理论上
跟y相关也行
对吧
因为它是跟理论上跟y相关
或者在理论上的x解释的一
部分y,影响了一部分y
我们才会在建模的时候
把 x放到方程里面
对不对
所以说
所有的x都是在理论上
要跟y是相关的
然后能解释y的,它会在我的模型里面
但是跟y相关并不能说明
它是一个内生变量
它必须跟residual相关
它才是一个内生变量
所以这也是一样的
Z我们说它外生不是说
它跟y
不相关
是它跟残差
不相关
好
我们来看刚才同学们问题非常好
把这些问题澄清了
后面才能够讨论起来会更加的清楚
那么我们来看
那么这个就是形象的来去解释
我们怎么样通过z来去得到一个x
的无偏的一个估计系数β
那么大家看
红色阴影面积还是
x跟y跟残差的重叠的这一部分
这个是不好的
这一块不健康的
那么
我们找到的z,深蓝色的椭圆
它是能够解释 x的一部分
variation
而且它跟
残差整个残差,不光是红色面积了
包括剩下那部分残差
都是不相关的
那么这个时候我们可以想象是不是
如果是x对z跑一个回归的话
那么x的拟合值就是x hat
是不是 这时候x就变成因变量了
z是自变量
x hat就是绿色阴影面积
所代表的这一部分是不是
这一部分
第一个
它跟y还是要相关的
对不对
它跟y是有一部分重合的
是吧
它重合的面积是哪儿呢
是不是这一部分是x hat
跟y的重合的这一部分
variation
那么同时
整个x绿色阴影面积这一部分
它跟残差是不是不相关
剩下这部分残差都是不相关的
所以这个时候
就可以了
那么显然这个地方就是有两步回归在里边
是不是
X跟对y对z做回归
得到x hat
然后是y对于x hat在做回归
x hat的就是我们通过z抠
出来的那一块健康的面包
对 这个就是刚才解释过的
就详细的再说了一下
好
就是一个形象的
怎么去
用工具变量来去一步步的来
实现我们的估算的目标
得到 x的无偏估计
系数β
那么
有没有问题
这是一个大的 idea
非常形象
我们后面就开始用这个数学公式
把它严谨的再表达一遍
-1.2 Why do we use regression 1
-1.3 Why do we use regression 2
-1.4 Conditional expectation function 1
-1.5 Conditional expectation function 2
-1.6 Classical assumption of OLS
-1.8 How to use matrix calculation to solve OLS
-1.11 FAQs of regression:practice
-1.12 FAQs of regression:discussion
-1.13 Maximum Likelihood Estimatio
-Basic Econometrics
-2.1 Classical assumptions of OLS
-2.2 Omitted variable bias and endogeneity
-Weeks 3&4 readings and workshop
-Instrumental Variable
-3.6 Threats to the validity of RCT
-3.17 Random-effecrt and Fiexed-effect model
-3.18 Statistic power analysis
-Weeks 5&6 readings and workshop
-Randomized Experiments - Class Size, Career Academies
-4.6 DID with multiple periods 1
-4.7 DID with multiple periods 2
-4.9 Synthetic control methods
-Week7&8 readings and workshop
-Natural experiment and DID
-5.10 Validity and assumption test 1
-5.11 Validity and assumption test 2
-Regression discontinuity
-6.1 Review of causal inference model
-Propensity Score Matching
-HLM