当前课程知识点:管理定量方法 > 第五章 多变量定量研究 > 第十六节 问卷的结构效度——探索性因子分析(二) > 第十六节 问卷的结构效度——探索性因子分析(二)
同学们大家好
欢迎来到管理定量方法课程
我是今天的主讲老师
杨老师
第16节
我们讨论问卷的结构效度
探索性因子分析的第二个部分
在第15节里
我们已经讨论过
因子分析
factor analysis
是一组主要用于数据提炼
与概括的分析方法的统称
它是用分析相依型变量
interdependent variable
的方法的一个总称
这一类研究
可能会涉及到大量的变量
其中大部分的变量是相关的
因此需要将变量的数目
缩减到合适的水平
以便进一步进行分析
所以我们可以看到
大量相互关联的变量之间的关系
我们用几个潜在的因子
表示出来
所以因子分析
特别适合于问卷的结构效度的检测
按照其基本的性质
我们可以把因子分析分为
探索性因子分析EFA
和实证性因子分析
CFA两大类
我们重点给大家介绍的是
探索性因子分析
和IBM SPSS软件
关于因子分析的操作过程
因子分析的主要的步骤
有以下的7步
第一步
我们需要看一看
问卷的样本量是否适合做因子分析
一般的情况下
问卷的样本数量
至少是问卷测量条目的4~5倍
第二步
计算并检验数据的
相关系数矩阵
这里边我们给大家讲到了
巴特利特球形检验
和KMO测度值的应用
第三 我们选择了
探索性因子分析
还是使用验证性因子分析
一般我们重点给大家介绍的就是
探索性因子分析的基本过程
第四步
如何确定因子的数目
我们讲了三个方法
第一 可以看一看
因子的特征值EV的大小
特征值超过1
是值得保留的因子
另外 我们可以看一看系统
SPSS软件给出的因子
对于概念的方差解释力度
来保留因子的个数
第三 软件会帮助我们
跑出来一张碎石图
也可以根据碎石图的情况
来决定因子的数目
第五 我们可以对因子的数据结构
进行一个因子旋转
我们给大家讲述了
VARIMAX这种因子旋转的方法
它可以帮助我们
把因子结构看得更清楚
第六 我们可以得到因子的得分
用于保留所有的潜在变量
或者是因子
以便进行其他模型的分析
第七
我们可以讨论一下模型的适合度
因子代表的具体含义是什么
这是因子分析的主要步骤
下面我们给大家
举一个应用的实例
有一个研究
是关于中国企业入驻科技园动机的调查
在这个研究里边
我们开发了一份问卷
来调查中国企业
利用国内科技园区资源
进行研发的基本问题
问卷的目的
是在调研的过程中
了解国内的企业
入驻我国建立的科技园区的运行机制
以便完善国家的有关的政策
在问卷的表头
我们调研了
被试者的基本情况
第一 被试者的基本职务
第二 被试者所在企业的基本信息
比如 企业的规模
企业所在的行业细分
第三 企业的基本性质
第四 企业目前进入了
哪一家国内的科技园
第五 企业进入科技园区的
基本性质是什么
我们为了调查企业入驻科技园的动机
采取了访谈的方式
做了一些典型的案例
查看了一些相关的文献
自己制定了出一套
测量企业入驻科技园动机的量表
通过定性的案例
和文献的研究
我们开发了一个
企业入驻科技园动机的测量量表
这个量表一共有15个问题
我们采用了
1~7分度的
里克特量表来进行度量
其中企业入驻科技园的动机
包括以下的15个问题
第一 获取技术资源
第二 获得资金的支持
第三 从科技园内竞争公司
合作公司处
获得战略支持
第四 强化公司的竞争形象和声誉
第五 扩大公司的市场规模
第六 加强搜寻国内市场需求
和交易信息的能力
第七 获得我国政府的支持
第八 获得地方政府的支持
第九 国内科技园区减免税收等
相关优惠政策
第十 获得高质量的专业性人才
第十一 获得低成本的人力资源
第十二 规避地区贸易壁垒
直接投资进入市场
十三 吸收研发成果
从技术中转移学习
第十四
为其他地区子公司
提供产品工艺
等方面的技术支持
第十五
应对竞争和实施公司的发展战略
我们采用了主成分分析的方法
提取因子
并对原始的因子载荷
采取了最大方差垂直旋转交换的方式
VARIMAX
因子提取的最终个数
以特征值超过1作为判断的标准
有效性的指标
选择了KMO测度
和巴特利特球形检验
根据统计准则的要求
KMO测度值
大于0.5
是进行因子分析的最低要求
KMO数值
为0.8以上
表明因子分析的效果良好
此处我们的计算过程中
KMO测度为0.850
巴特利特球形检验的卡方值为
2152.788
其自由度为105
达到了显著性水平
p值小于0.001的前提条件
适合做因子分析
我们在文中
保留了因子载荷超过0.5的测量条目
初始的15个条目
全部被保留
提取的三个因子的
解释方差的变异累积数是
66.652%
其具体的结果可以看下表
我们提取了三个因子
分别为
技术获取动机
市场渗透动机
和政策获取动机
对因子分析的命名
是看所有潜在的
测量条目中的
中文的含义和指向
保留了那些
超过因子载荷
超过0.5以上的测量条目
来对因子进行命名
而且测量了
所有潜变量的克隆巴赫阿洛系数
均在0.79以上
显示了很好的问卷信度
问卷总体的信度
克隆巴赫阿洛系数为0.923
下面我们给大家用IBM SPSS软件
来模拟一下数据的分析过程
给大家进行详细的展示
和讲解
我们打开
企业入驻科技园动机的数据
一共15个测量条目
可以看到
D1一直到D15
15个测量条目
我们先看一下
样本量够不够
往下拉
我们可以看到一共
218份有效的样本
符合样本量的规定
因子分析的样本量
需要达到
测量指标的4~5倍
下面我们开始做因子分析
点分析
然后降维的第一个方法就是因子
打开对话框
因为D1到D15
都是分析企业入驻
动机的测量指标
可以全选
CTRL A全选
然后点入变量值
点变量值之后
我们不要马上点击确定
我们需要去确定几件事
第一件事
点描述
我们要做一个KMO测度值的运算
和巴特利特球形检验的度量
点继续
第二 我们点提取
提取因子的标准
是因子的特征值
需要超过1
系统已经帮我们设置好了
另外利用主成分分析
输出一张碎石图
碎石图的结果展示
可以帮助我们来判断
因子需要保留的数量
点继续
第三 我们点一下旋转
采用最大方差
VARIMAX的方法
来进行因子旋转
可以帮助我们
把因子结构看得更清楚一些
点继续
第四 点一下得分
因子得分
可以帮助我们把潜变量保存下来
通过回归的方式
这种方法实际上
就是把因子作为因变量y
把量表中的测量指标作为自变量
做一个回归模型
回归系数
为各个测度指标的因子载荷
这样潜在变量的数据就可以保留了
点继续
最后点选项
我们可以
点一下
排除小系数
排除的是
因子载荷比较小的数据
前面我们已经讲过
我们需要有一个统计的经验和标准
如果
测量的数目比较多的情况下
我们可以规定
因子载荷超过0.5以上
这些测度指标给予保留
我们可以改变一下
因子载客的绝对值
设置为0.5
这样就可以帮助我们来识别
这些测度条目
指向的是哪些公共的因子
点继续
点确定
因子分析的最终的结果
可以看到
KMO测度
和巴特利特球形检验表
这项研究的KMO测度值是0.850
显示了较好的拟合的效果
KMO测度的最低标准是0.5
这项研究是符合标准的
巴特利特球形检验
是一个近似的卡方分布
其卡方分布是
2152.788
自由度是105
显著性p值是0.000
也就是可以拒绝零假设
生成条目的
相关系数矩阵不是一个单位阵
数据适合做因子分析
第二张表
也是非常有用的
我们看一看
第二张表叫做
总方差解释表
总方差解释表里
主成分分析
帮我们生成了一共
15个主成分
特征值超过1
是值得保留的因子
我们可以看到
第一个因子的特征值
是7.334
值得保留
第二个因子的特征值
是1.607
也是值得保留的
第三个因子的特征值是
1.057
也是值得保留的
所以系统建议保留三个因子
这三个因子旋转之后的结果
旋转后的载荷平方和
第一个因子
一共可以解释了
入驻动机这个概念的32.276%的信息量
第二个公共因子
可以解释这个概念的17.682%的信息量
第三个因子
可以解释整个入驻动机概念的
16.694%的信息量
后面做了一个累计的信息量解释力度
那么三个因子一共解释了
入驻动机概念的66.652%的信息量
有同学可能会问
为什么不能够解释
概念的100%信息量
因为开发的问卷中
提炼了三个公共因子
还有一些公共因子
由于特征值小于1没有被提炼
另外这个量表中的15个问题
不可能把所有的企业入驻动机信息都问出来
所以说
一般量表的
总的因子方差解释力度
是不可能超过100%的
但是一般我们有一个统计的经验
一个好的量表
解释的新概念的信息力度
应该累计解释超过50%以上
这才是一个比较好的量表
我们看
系统画了一张碎石图
碎石图横轴表示的是因子保留的个数
纵轴表示是因子的特征值
当特征值等于1的时候
对应的就是这个曲线的拐点处
所投影到横轴的数量3
就是系统建议保留因子的个数
我们再看看旋转之后的
因子的矩阵的成分
这张表是没有旋转的因子成分
可以看到
有很多的指标
都对第一个因子有测度
但是对第二个因子
和第三个因子
没有测度
为什么
是因为后面两个因子
被第一个因子遮盖住了
为了更好的
去看因子的基本结构
我们做了一个
VARIMAX的因子旋转
可以看到
旋转之后的
因子的
矩阵成分
第一个因子
是由D1 D2 D3
D11 D12 D13 D14
D15来测度的
这些因子载荷
都是超过0.5以上的
第二个因子
是由D5 D6
D9 D10
来进行测度的
因子载荷也是超过0.5的
第三个因子
是由D4 D7 D8
来测度的
也是超过0.5的因子载荷
这样我们就可以
根据问卷中的信息
来去讨论因子的具体含义
把因子分析的结果
可以关掉
我们再看一看
把原始的数据往后拉
你可以看到
生成了三列数
第一列数是FAC1_1
第二列数是FAC2_1
第三列数是FAC3_1
这就是新生成的三个潜在的变量
三个潜在因子的因子得分
因子得分
可以用于帮助我们
去讨论其他的模型
因为潜在变量
以前是不存在的
我们通过因子分析的方式
帮助大家萃取出来三个潜变量
对于我们
后续进行复杂模型的讨论
是非常有帮助的
好 这节课就讲到这里
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题