当前课程知识点:医学统计学(高级篇) > 第十七章 判别分析 > 第二节 判别分析-Fisher判别 > Video
同学们好
我是中南大学
湘雅公共卫生学院王乐三老师
今天我们来学习Fisher判别
Fisher判别它是用于指标为
定量指标的两类判别
也可以用于多类判别
Fisher判别的一个原理
已知AB2类观察对象
A类有NA例
B类有NB例
分别记录了X1X2到XM个观察指标
这些观察指标
我们在判别分析中间
就称为判别的指标或者变量
Fisher判别法就是要找出一个线性的组合
使得这么一个线性的组合
使得这么一个综合指标Z
在A类的均数
A类的均数ZA
与在B类的均数ZB
他的这么一个差异
要尽可能两类
综合指标Z的变异
变异我们变异这个标准差
来进行表达
SA的平方
加SB的平方尽可能小
也就是说使得这样一个
这个要尽可能大尽可能小
使得它最大
这么一个原则
我们把它叫做是一个Fisher的准则
fisher这么一个准则下面
我们可以求出它的判别系数
可以通过对 求导
由这么18-3所给出的这么一个公式
来方程组来进行一个求出来
其中我们也这里有DJ
它是分别是A类和D类的
DJ个指标的一个均数的这么一个均数
他们这么一个差异
SAJ是X1X2XM的合并的
一个斜方差阵的一个元素
这是它的一个
这么一个计算的一个公式
我们求出来之后
建立判别函数后
我们可以按照公式
18-1来逐列计算判别的函数值ZA
进一步可以求ZA的两类均数
ZA ZB 于总均数Z
按照公式18-5
来计算它的这么一个
判别的界值
我们的判别规则
根据我们前面求出的建立
这么一个求系数的一个方程
如果得到这个值大于它
我们判为A类
如果ZA小于
ZC我们判为B类
ZA等于ZC我们判为任意一类
这是我们用两个指标
来给大家介绍一下
Fisher判别的这么一个内容
我们知道这里有一个X1这里X2
如果通过这有两类
这两类的话
我们在这么一个直角坐标系中间
有任何一个指标
它们之间重叠比较大
从这个指标来看
他们的重叠也比较大
我们希望能够
建立这么一个
这两个指标的一个线性组合
找到一个线性组合
线性组合如果我们找到一个适当的
这么一个Z
这个时候我们能够比较好的
把这两类把它区分开
这是我们讲两个指标的
这么一个判别分析它的这么一个示意
我们来看一个例题
例题的是18-1
收集了22类肝硬化患者的三个指标
这个指标是根据专业上面
来考虑有腹水量
肝长径 肝短径
这三个指标的中心化
标准化和的资料
我们列入表示8-1
其中前期患者就是A类有12类
晚期患者B类有10例
我们希望能够做一个判别分析
判别分析的话
能够根据这三个指标
能够比较好的
能不能够做一个比较好的一个预测
这是我们表
22类患者三项指标的一个观察结果
观测结果的话
我们分成A类和B类
这是它的三个指标
但三个指标我们进行了一个中心化
和一个标准化
这是它的这么一个原始资料
我们希望通过这么一个
这三个判别指标
这么一个两类
通过我们分析的准则
能够建立一个
定的一个判别的一个函数
这个函数就是Fisher函数
我们根据前面的一个内容
计算变量的类均数
及类间的均数差Dj
这是我们计算出来的
A类B类
A类的例数是12例
A类的均值是这么多
第一个指标的均值
第二个指标的均值
第三个指标
这是B类的例数
第一个指标的均值
第二个指标均值
第三个指标均值
我们类间的均数差
在这里我们是用A类减掉B类
这个是我们得到的这么一个值
所以这里的话我们是用-3再减掉四
所以我们这个值是负7
我们是用A类减掉B类的
这个是用4来减掉-5
所以它是一个九正九
在用-1来减掉这么一个一
所以它是一个-2
这是我们类间的均值差
同样的我们可以计算合并的协方差矩阵
按照我们公式18-4可以进行
例如第一个指标的
那就把两类的
他们的这么一个
类均差的一个平方和
这下面是它自由度的
这么之和
最后我们可以得到合并协方差在这
然后我们可以得到这么一个方程
通过这样一个方程
那我们可以解出
他的这么一个系数
所以我们可以得到这么一个判别函数
通过这个判别函数
我们可以逐列的
来计算它的一个判别函数数ZA
我们可以列出在
这么一个这个表在这里
同时我们可以计算出
这一次在A类的这么一个均值
在B类的均值以及一个总的均值
然后我们要确定界值
进行两类的判别
按公式18-5来计算
我们可以得到
它的这么一个界值
我们得了界值之后是-0.147
根据我们的判别的一个准则
将ZI大于负的0.147
我们就判为A类
它小于-0.147就判为B类
通过这么一个内容
我们的结果
就判断这个表的最后一例
这一类的话
我们可以看到有四例错判
这是我们
通过前面我们求出了它的一个判别函数
把每一列的这么一个值
把它带到这么判断函数里面去
我们可以得到这么一个相应的Z值
这次之后
我们根据我们确定的这么一个界值
来进行判断
像这个值
那么是大于-0.147的
所以我们把它判为A类
其他的以此类推
从这里我们可以看到
编号为四的
原来还是属于这个属于A类的
属于A类的
但是通过我们这么一个判别函数之后
最后把他判为B类了
所以这个是一个错误了
同样的我们还有
自己的错误
我们可以看到
在A类里面
我们有这个有两例
有两例是A类
原来是正确分的应该是A类
但是把它判为B类的
我们同样的在B类里面
在B类里面
也有两例
把它判为A类了
这属于错判
四列错判
所以我们对这么一个判别的函数
我们第二步我们要去对它一个效果要评价
刚才我们讲了评价的指标
我们用误判的概率来进行衡量
我们这类误判的错误的率
有四列中间
整个22例有四类中间
一个错误了
所以它是18.2%
这是它的一个错判率
我们这里是对原来的这么一个
我们建立判别函数的这么一个
样本进行一个
回带的一个检验
所以回顾性的误判概率估计
往往是夸大判别效果
一般而言
我们在建立这个判别函数前
要将样本随机分成两个部分
分别占总样本的85%和15%
前者用于建立判别函数
我们把它叫做训练样本
后者用于考核判断函数的一个
判别效果
这属于前瞻性的一个考核
对于这样一部样本
我们把它叫做是一个
验证样本
用验证样本计算的误判概率
作为前瞻性的误判概率估计
前瞻性误判概率估计是比较客观的
有时候可能这么一个样本的量比较少了
我们实际上还可以通过这样一种内容
那就叫刀切法
这个刀切法
或者叫做交叉合适法
它的话还是属于一个前瞻性的
他怎么来做
我们顺序踢除一个样品
用余下的的N-1个样品
假设我整个的样品的是有N1个
我先一个把它剔除
用余下的n-1个样品
来建立一个判别函数
建立的过程
就是我们上面介绍的过程
然后用判别函数来判别剔除的样品
重复上面两步
A1次我们来计算概率
那么它的优点就充分利用了样本的信息
建立和验证判别函数
我们这一列的话
误判的这么一个概率的一个刀切法
它的估计值
就为6÷22
等于27.3%
这是一个
这就是刀切法
我们看看这么一个软件的一个操作
在SPSS软件里面
没有直接的分析这么一个判别一个过程
我们可以用二次回归判别法
来作为它的一个实现的过程
二次回归判别法
与Fisher判别法完全是等价的
我们看一下
首先我们建立这么一个数据的文件
建立数据文件有这么一个三个变量
有A类和B类
这里要做一个内容
要计算一个新的变量
这么一个新的变量
完事对于A类的话
我们通过这么一个转换
对一个B类的话
我们通过这样一个转换
这么使得整个这么一个
一个均值就会等于0
然后我们就调用前面
我们给大家介绍的这么一个
回归的分析方法
在回归的分析方法里面
那我们就把这么一个
这个G作为它的这么一个因变量
自变量我们可以选择三个
然后我们选择它预测值
我们可以得到这么一个结果
最后我们可以得到它的这么一个
预测的一个结果
预测这么一个结果之后的话
我们根据这么一个结果的一个判断
如果是这样的
预测值大于零
我们就判为A类
预测值小于零
我们就把他判为B类
预测值等于0
暂不归类
这是它的这么一个
判断的这么一个结果
当然这个也是对于这样一个过程
实际上我们还可以利用
回归的方法来对这么一个判别的指标
来进行一个这么一个筛选
我们也可以用
两分类的非条件的
logistics一个回归的方法
来对两类进行一个判别
两个一个判别
同样的我们也是建立这么一个数据的文件
我们相应的有数据的文件
我们把A类
用1那么B类有0来进行一个指代
指代之后我们可以调用
非条件的逻辑的一个回归的这么一个模型
这个模型之后
我们用G来作为它的这么一个因变量
这三个作为它的这么一个自变量
然后我们在这个里面中间
我们在这个里面也可以
在方法里面也可以全部进入
也可以对我们的判别指标在这里用
可以用这个筛选
在一些对话框里面
我们可以选择它的
这么一个预测值
因为我们知道logistics回归
它主要是一个概率的一个模型
概率模型
这是它的这么一个结果
这个结果的话
我们可以根据logistics回归的
一个分析方法
如果他的预测概率大于0.5
那我们就把它归为A类
小于0.5
那就到B类
等于0.5
可以
暂不归类
这是归类之后的话
对于原来的这么一个样品进行一个回带
这么一个情况
这个情况的话是我们可以看出
最后看出它的这么一个
这么一个归类的一个正确性
这是我们原来的
原来的属于A类和B类的
这是我们已经进行预测的
和A类和B类的
我们可以看到有四列是这个错误了
属于他的正确率
在这一块
这是表示的是一个正确率
但这个里面我们也同样的可以
对四个变量
它的这么一个作用
有没有统计学意义来进行一个检测
好
我们今天的内容就到这里
-1. 医学统计学概述
--Video
-2.统计学的几个基本概念
--Video
-3.医学统计工作的基本步骤
--Video
-第一章 绪论--章节测试
-1.频数分布表与频数分布图
--Video
-2.集中趋势描述
--Video
-3.离散趋势描述
--Video
-4.正态分布
--Video
-5.医学参考值范围的制度
--Video
-6.常用相对数
--Video
-7.应用相对数的注意事项
--Video
-8.率的标准化法
--Video
-第二章 计量资料统计描述及计数资料统计描述--章节测试
-1. 均数的抽样误差与标准误差
--Video
-2.t分布
--Video
-3.总体均数的估计
--Video
-4.假设检验的基本原理与步骤
--Video
-5.t检验
--Video
-6.假设检验的注意事项
--Video
-第三章 章节测试
-第一节 方差分析的基本思想及应用条件
--Video
-第二节 完全随机设计资料的方差分析
--Video
-第三节 随机区组设计资料的方差分析
--Video
-第四节 多个样本均数间的多重比较
--Video
-第四章 多个样本均数比较的方差分析--章节测试
-5-1 卡方检验——卡方检验的基本思想
--Video
-5-2 卡方检验——独立样本四格表资料的卡方检验
--Video
-5-3 卡方检验——配对四格表资料的卡方检验
--Video
-5-4 卡方检验——四格表资料的确切概率法
--Video
-5-5 卡方检验——行×列表资料的卡方检验
--Video
-5-6 卡方检验——卡方检验的多个样本率间的多重比较
--Video
-5-7 卡方检验——卡方检验用于拟合优度检验
--Video
-第五章 x²检验--章节测试
-6-1二项分布的概念
--Video
-6-2二项分布的特征
--Video
-6-3二项分布的应用—总体率的区间估计
--Video
-6-4二项分布的应用—率的假设检验
--Video
-6-5泊松分布的概念与特征
--Video
-第六章 几种离散型变量的分布及其应用--章节测试
-第一节 秩和检验概述
--Video
-第二节 Wilcoxon符号秩检验
--Video
-第三节 Wilcoxon秩和检验
--Video
-第四节 Kruskal-Wallis H检验
--Video
-第五节 Friedman M检验
--Video
-第七章 秩转换的非参数检验--章节测试
-第一节 统计表
--Video
-第二节 直条图和直方图
--Video
-第三节 圆图和百分条图
--Video
-第四节 线图和半对数线图
--Video
-第五节 散点图与统计地图
--Video
-第六节 箱图
--Video
-第八章 统计表与统计图--章节测试
-第一节 -概述
--Video
-第二节 直线回归
--Video
-第三节 直线回归中的统计推断
--Video
-第四节 双变量回归与相关-直线相关
--Video
-第五节 回归与相关中的注意事项
--Video
-第六节 秩相关
--Video
-第九章 双变量回归与相关--章节测试
-第一节 多因素试验
--Video
-第二节 两因素析因设计资料的方差分析01
--Video
-第三节 两因素析因设计资料的方差分析02
--Video
-第四节 三因素析因设计资料的方差分析
--Video
-第五节 正交设计与方差分析
--Video
-第六节 嵌套设计资料的方差分析
--Video
-第七节 裂区设计资料的方差分析
--Video
-第十章 章节测试
-第一节 重复测量资料的反差分析
--Video
-第二节 重复测量数据的两因素两水平分析
--Video
-第三节 重复测量数据的两因素多水平分析
--Video
-第四节 重复测量数据的多重比较
--Video
-第十一章 章节测试
-第一节 协方差分析的基本思想和步骤
--Video
-第二节 完全随机设计资料的协方差分析
--Video
-第三节 随机区组设计资料的协方差分析
--Video
-第十二章 章节测试
-第一节 多变量数据的统计描述
--Video
-第二节 多变量数据的统计推断-单组比较
--Video
-第三节 多变量数据的统计推断-两组比较
--Video
-第四节 多变量数据的统计推断-多组比较
--Video
-第五节 重复测量设计的多变量分析
--Video
-第十三章 多变量数据的统计描述与统计推断--章节测试
-1.多元线性回归模型
--Video
-2.多元线性回归模型的假设检验
--Video
-3.多元线性回归模型自变量的选择
--Video
-4.多元线性回归模型应用及其注意事项
--Video
-第十四章 多元线性回归分析--章节测试
-1Logistic 回归分析——logistic回归分析的概述
--Video
-2Logistic 回归分析——logistic回归分析的概念
--Video
-3Logistic 回归分析——成组(非条件)logistic回归分析
--Video
-4回归分析—— 配对(条件)logistic回归分析
--Video
-5Logistic 回归分析—— logistic回归的应用
--Video
-第十五章 logistic回归分析--章节测试
-第一节 生存分析中的基本概念
--Video
-第二节 生存率的估计与生存曲线
--Video
-第三节 生存率的比较
--Video
-第四节 Cox比例风险回归模型
--Video
-第十六章 章节测试
-第一节 判别分析-概论
--Video
-第二节 判别分析-Fisher判别
--Video
-第三节 判别分析-最大似然和Bays公式判别法
--Video
-第四节 判别分析-Bayes判别法与逐步判别
--Video
-第十七章 章节测试
-第一节 聚类分析-概论
--Video
-第二节 聚类分析-系统聚类法
--Video
-第三节 聚类分析-动态样品聚类
--Video
-第十八章 聚类分析--章节测试
-第一节 SPSS-概述
--Video
-第二节 SPSS-数据文件的建立
--Video
-第三节 SPSS-数据文件的管理
--Video
-第四节 SPSS-计量资料的统计分析-描述性统计量
--Video
-第五节 SPSS-计量资料的统计分析-均数比较-t检验
--Video
-第六节 SPSS-计量资料的统计分析-均数比较-完全随机设计资料的方差分析
--Video
-第七节 SPSS-计量资料的统计分析-均数比较-随机区组设计资料的方差分析_医学统计学
--Video
-第八节 SPSS-计量资料的统计分析-均数比较-拉丁方设计资料的方差分析
--Video
-第九节 SPSS-计量资料的统计分析-均数比较-交叉设计资料的方差分析
--Video
-第十节 SPSS-计数资料的统计分析-样本率与总体率比较
--Video
-第十一节 SPSS-计数资料的统计分析-样本率比较
--Video
-第十二节 SPSS-配对计量资料比较的秩和检验
--Video
-第十三节 spss-两独立样本比较的秩和检验
--Video
-第十四节 spss-多个独立样本比较的秩和检验
--Video
-第十五节 spss-随机区组设计资料的秩和检验
--Video
-第十六节 SPSS-直线相关回归分析
--Video
-第十七节 spss多元线性回归
--Video
-第十八节 spss-logistic回归
--Video
-第十九节 spss-条件logistic回归
--Video
-第二十节 spss-有序logistic回归
--Video
-第二十一节 spss-无序多分类logistic回归
--Video
-常用综合评价方法
--Video
-第二十章 章节测试
-量表的研制方法
--Video
-第二十一章 章节测试
-医学文献的系统综述与Mata分析
--Video
-第二十二章 章节测试


