当前课程知识点:管理定量方法 > 第五章 多变量定量研究 > 第十五节 问卷的结构效度——探索性因子分析(一) > 第十五节 问卷的结构效度——探索性因子分析(一)
同学们大家好
欢迎来到管理定量方法课程
我是今天的主讲老师
杨老师
第十五节
我们给大家介绍
问卷的结构效度
探索性因子分析第一部分
首先我们讨论一下
探索性因子分析应用的实例
考虑以下几个例子
一个全球500强的企业总经理
想了解自己公司
在消费者心目中的形象
心理学家
想要研究人的认识
信仰 态度
和能力
某个产品的营销经理
希望了解爱国主义情结
和消费者
对进口产品的选择嗜好
是否存在一定的关系
这三个例子都有一个共同的特征
研究公司形象
人们的认识
信仰 态度 能力
消费者的爱国主义情结
这些变量都有一个共同的特征
都是属于潜在变量
我们在前面的课程里
已经给大家介绍
潜在变量量表的开发
通过建立多项目域的量表
来测量这些不可直接观测的变量
是管理学研究中一种特殊的方法
因子分析
就是一组
主要应用于数据提炼
与概括的
分析方法的统称
它是一种相依性的方法
(Interdependent)
特别适合于
对于量表进行结构效度的检验
因此
在管理学研究中
可能涉及到大量的
潜在变量
其中大部分的测量条目
是相关的
因此需要将测量条目的数目
缩减到合适的水平
尤其是问卷中的量表结构分析
大量相互关联的测量条目之间的关系
可以用几个潜在的因子
来进行表示
在应用因子分析的过程中
按照其性质
可以分为
探索性因子分析EFA
和实证性因子分析CFA
我们今天给大家介绍的是
如何使用IBM SPSS软件
进行常见的
探索性因子分析的操作过程
一般的因子分析
主要步骤有七步
第一 确定样本量是否足够
在研究和分析量表的时候
若要将因子分析
需要的样本量
有一定的规定
样本量至少是
我们的测量条目的4~5倍
才符合具体的统计建模要求
第二 计算并检验相关系数矩阵
这部分内容
可以帮助我们来回答
数据是否适合做因子分析
这里面我们可以选择
探索性因子分析
还是验证性因子分析
这里只给大家介绍
探索性因子的应用过程
第三
确定因子的数目
我们会有三种方法供大家来选择
第一 使用IBM SPSS软件
生成的因子的特征值EV
第二 使用方差解释力度
来确定因子的数量
第三 我们应用IBM SPSS软件
给出的碎石图来进行判断
第四 如果想把因子结构看得更清楚
我们可以采用IBM SPSS软件中
提供的因子旋转的计算方法
来对因子结构进行合理的检测和解释
第五 确定因子的得分
对研究的结果进行科学的解释
第六 讨论模型的适用程度
这就是因子分析的主要步骤
每一步具体的研究内容
我们给大家简单的加以分析
我们尽可能
忽略了具体的算法
让大家掌握因子分析的具体过程
第一 数据是否适合做因子分析
我们给了大家两个非常重要的检验
一个是巴特利特球形检验
巴特利特球形检验
使用巴特利特统计量
这个统计量符合一个卡方分布规律
从检验整个相关系数矩阵出发
其零假设为
相关系数矩阵
是单位阵
如果相关系数矩阵
为单位阵
则需拒绝零假设
第二个计算的过程是KMO测度值
KMO测度值
观测变量间
简单相关系数
和偏相关系数
大小的关系
KMO测度值
越接近于1
模型的拟合效果越好
这里有一个统计的经验
探索性因子分析的KMO测度
需要超过0.5以上
模型的拟合效果才是可以接受的
第二步 进行因子分析模型的运算
一般我们会采用主成分的分析方法
来进行因子分析的萃取过程
主成分分析法
就是把给定的
每一组相关变量
通过线性变换为
另一组不相关变量
使得到的第一组变量
具有最大解释方差
称之为第一主成分
第二组变量的解释方差次之
以此类推
第一主成分变量
解释的信息量达到最多的方法
可以得到不同的因子结构
这是我们最常用的
因子分析模型的运算方法
第三步
需要确定因子的个数是多少
因子个数的确定
可以采用三种方法
第一种方法
IBM SPSS软件
会帮助我们
确定出每一个因子的特征值EV
如果因子特征值大于1
主成分作为初始的因子是合适的
系统会建议我们
放弃特征值小于1的主成分
第二 根据特征值的准则
系统会帮我们生成一张
碎石图来进行检验
碎石图曲线变平缓开始的前一个点
为提取的最大因子的数量
第三 我们也可以去看
IBM SPSS软件
给出的建议
IBM SPSS软件
会告知我们
每一个因子解释潜在变量
信息的解释力度
来确定因子保留的个数
我们给出了一张碎石图
碎石图的横轴代表的是
保留因子的个数
纵轴是每一个主成分因子特征值的大小
我们可以看到
根据统计的经验
特征值等于1的时候
正好对应这条曲线的拐点处
拐点处对应的横轴
就是我们可以确定的因子的个数
这张图是可以帮助我们来判断
因子保留的个数
三种方法互相印证
可以把因子结构看得更清楚一些
第四步
往往在因子分析计算的过程中
由于很多因子的主成分特征值比较大
会把一些主成分特征值
比较小的因子遮盖住
如何把因子结构看得更清晰
IBM SPSS软件提供了一种方法
方差最大法
VARIMAX
这种方法
从简化因子负载矩阵的每一列出发
使得每个因子
有关的负载的平方和
方差最大
这样解释的因子结构
最简单
最清晰
最具备解释性
是我们常用的一种
把因子结构看得更清楚的因子旋转方法
第五步
如何去解释因子分析结构的具体含义
利用因子旋转
我们可以清晰的解释
每个因子的具体含义
IBM SPSS软件
会帮助我们
生成一个因子载荷分析矩阵
我们看一下这张PPT
f1和f2分别表示
因子分析所生成的两个公共因子
因子1
和因子2
x1x2x3x4x5
代表量表的5个测量的题项
或者是条目
这些条目
会对公共因子有一个解释力度
这个解释力度
在公式里边
表现为f1
和f2前面的系数
这个系数
就是所谓的
因子载荷
FACTOR LOADING
因子载荷越趋近于1
代表测量指标x
和公因子的关系越紧密
一般情况下
我们会有一个统计的标准
统计的标准是研究者可以自己来设定的
如果量表的测量条目较多的情况下
我们可以设置为
因子载荷需要超过0.5以上
才是这个条目
对公共因子的解释力度
比较高的测度指标
这样可以讨论因子的解释方差
贡献率和累计的解释贡献率
后面的μ表示的是测量的误差
当然 测量误差前面的系数
也可以用因子载荷
来进行表示
这里有一个案例
关于因子分析的一个具体应用
有一家食品制造商
生产早餐的麦片
他们非常关心
为什么燕麦片卖的不好
便开发了一份问卷
问卷中询问消费者
对于购买麦片的
25个非常重要的信息
比如说
麦片的成分
天然性
纤维度
甜度 脆感
营养性等等
希望能够去解释
消费者是否
购买这个品牌早餐燕麦片的
一个具体的原因
根据这个案例
给出的数据
利用因子分析开发出的公共因子
公共因子
经VARIMAX旋转之后
得到了四个公共因子
第一个公共因子
称之为健康
第二个公共因子
称之为人工合成
第三个公共因子
称之为流行度
即品牌度
第四 叫做有趣
所生成的
因子分析的负载矩阵如下
左边的这些
都是问卷中询问的一些测量的条目
一共得到4个公共因子
Factor1
Factor2
Factor3
和Factor4
每一行的数字都表示测度指标
对于公共因子的一个解释力度
即所谓的因子载荷
因子载荷
有正有负
我们不必考虑正负号
只考虑因子载荷的绝对值就可以
我们设置一个统计的经验值
当因子载荷超过0.35的时候
我们把这个因子载荷挑出来
那么超过0.35的因子载荷的测量指标
才是对公共因子贡献比较大的测度指标
我们把这些条目
通过横线的方式画出来
来体现因子的具体结构
这是我们给大家举的一个实例
后面的课程
我们将会利用IBM SPSS软件
跑一个实际的因子分析模型
帮助大家来简单的了解
探索性因子分析的
基本建模过程
好 这节课就讲到这里
同学们再见
-第一节 管理学研究概述
-第二节 研究的有效性
-第一章 习题
--第一章 习题
-第三节 数据的采集(一)
-第四节 数据的采集(二)
-第五节 问卷与访谈
-第二章 习题
--第二章 习题
-第六节 变量的测量(一)
-第七节 变量的测量(二)
-第三章 习题
--第三章 习题
-第八节 数据的描述
-第九节 概率与随机变量(一)
-第十节 概率与随机变量(二)
-第十一节 抽样分布
-第十二节 参数估计
-第十三节 假设检验(一)
-第十四节 假设检验(二)
-第四章 习题
--第四章 习题
-第十五节 问卷的结构效度——探索性因子分析(一)
-第十六节 问卷的结构效度——探索性因子分析(二)
-第十七节 聚类分析(一)
-第十八节 聚类分析(二)
-第五章 习题
--第五章 习题
-第十九节 相关和回归分析(一)
-第二十节 相关和回归分析(二)
-第二十一节 相关和回归分析(三)
-第二十二节 相关和回归分析(四)
-第二十三节 相关和回归分析(五)
-第二十四节 违背基本假设的回归(一)
-第二十五节 违背基本假设的回归(二)
-第二十六节 违背基本假设的回归(三)
-第二十七节 多重共线性的诊断和修正(一)
-第二十八节 多重共线性的诊断和修正(二)
-第六章 习题
--第六章 习题
-第二十九节 硕士学位毕业论文指导(一)
-第三十节 硕士学位毕业论文指导(二)
-第七章 习题
--第七章 习题