当前课程知识点:遥感数字图像处理理论与方法 > 第七章 遥感图像计算机分类 > 第二讲 > 7.2.6 分类结果精度评价
我们来学习
如何开展分类结果的精度评价
任何图像分类过程中
都会有误差
通常
造成分类误差的原因
是多样的
例如
所研究区域内
土地覆盖类型
与自然景观的多样性
遥感数据本身的影响
如分辨率 数据质量等
所采用的分类系统
与数据资料的匹配程度
以及计算机分类所采用的
算法与处理步骤等
总的来说
误差主要有两类
一类是位置误差
即各类别边界的不准确
另一类是属性误差
即类别识别错误
精度评价
对于遥感分类
很重要
因为一幅分类图像的精度
直接影响遥感图像的制图
以及其它数据分析的有用性
合理性
在分类结果精度评价中
图像精度是指
一幅不知道其质量的图像
和一幅假设准确的图像(参考图)
之间的吻合度。
如图
左图是待评价图像
即分类结果图像
右图是参考图像
从该图像上
我们可以准确地确定
各地物类别
精度评价
必须客观地通过
某种方法
定量地将一幅图像
和另一幅同一区域的参考图像
或其它参考数据进行对比
在多数情况下
我们很难取得一整幅
精确的参考图
因此大多数精度评价
都是对图像采样的
一部分像素进行评价
即抽样调查评价
其参考类别
可以通过野外考察
更详细的航空像片
或者其它来源的分类图上得到
我们来看看如何开展抽样调查
由于遥感观测涉及的空间广大
类型复杂
如何设计既有可靠的统计理论基础
又能在实践中可行的采样方法
是进行精度评价的关键
在抽样调查过程中
我们要解决两个问题
第一
不同类别
分别如何采集检验样本
第二
每个类别采集多少样本
总样本多少
采样设计应当采用概率采样
以确保样本的代表性和有效性
使利用样本估计总体参数
建立在可靠的基础之上
如图
在分类结果图上
均匀采集一定数量的样本点
或者随机采集一定数量的样本点
采用这些样本点
来评估分类结果的精度
这种采样方式合理吗
很明显
如果分类结果图上的
树木
草地
水域
人工建筑物
和裸露地表
等各种类型像元
所占比例差别不大
这样随机采样方式
可确保样本的代表性和有效性
反之
则要考虑其它采样方法了
我们来学习采样方法
常用的采样方法包括
简单随机采样
分层采样等
不同的采样方法
所采用的参数估计形式
和计算公式不同
具体采用哪种方法
应考虑分类系统和应用的影响
依据精度评价的目的而定
首先
我们来看一下简单随机采样法
这种采样方法
在分类结果图像二维空间上
随机地采集一定数量的像元
注意是绝对随机
不使用任何强制性规则
看看“简单随机采样”示意图
这种方法
在分类图上随机地
选择一定数量的像元
所有样本空间中的
单元被选中的概率都是相同的
因此
在此基础上
计算出的
有关总体的参数估计
也是无偏的
如果所研究区域内
各种类型分布均匀
且面积占比差异不大
则简单随机采样
应予以优先考虑
相反
如果地域内类型的
空间分布不均匀
或出现空间上稀少
并群集的类型
采用简单随机采样
就有可能遗漏这些类型
或抽取不到足够数量的样本
我们来学习分层采样法
分层采样往往是为保证
在采样空间或类型选取上的
均匀性及代表性所采用的方法
分层的依据可因精度评价的目标而异
常用的分层有
地理区
自然生态区
行政区域
或分类后的类别等
当图像中某些类别
占的数量很小时
随机采样往往会
丢掉这些类别
为了保证每个类别
都能在采样中出现
可以用分层采样
即分别对
每个类别进行随机采样
看看“分层均衡随机采样法”示意图
这种方法
分别对每个类别进行随机采样
可以看出
类别1 类别2 类别3
每个类具有相同数量的采样点
看看“分层比例随机采样法”示意图
这种方法
分别对每个类别进行随机采样
每个类别点数
与类别像元数成比例
可以看出
类别1 类别2 类别3
每个类的采样点数
是和该类别的像元数量
成比例关系的
我们需要采集多少样本
才能满足精度评价的要求
用于精度评价的像元数量
通常难以统一决定
但是对每个类别应
有一定的数量保证
一般情况下
精度评价的每个类别
至少有50个像元
当区域很大
或者分类类别较多时
每类的最小数量
应增加到75~100个
当然
这个数量需要根据每个类别
各占多少而有所调整
根据Jensen 提供的公式
可估算一下需要采集样本的数量
估算公式为
在公式中
N 抽样数
p 准确度期望值(%)
Z 按一定概率在标准正态分布
双侧分位数表中查到值
e期望值的允许偏差(%)
例如
期望准确度为85%
而允许期望值偏差5%之内
并且对估计的
准确度的置信水平为95%
即概率水平为0.95
那么可从双侧正态分布表中
查得Z为1.96
这样就可以代入公式
计算得到抽样数量
公式计算出为196
因此
理论上
需要至少采集196个样本点
我们来看看如何开展
分类精度的定量评估
样本是分类精度评价的
基本单元
可靠的样本数据
将给计算统计和精度评价
提供必要的基础资料
在有了可靠的样本数据后
便可进行精度分析
最常采用的是
建立误差矩阵
或称混淆矩阵
以此计算各种统计量
并进行统计检验
并最终给出对于总体的
和各种类别的分类精度值
误差矩阵是用来表示
样本像元分类精度的
一种标准格式
它是n行n列的矩阵
如表格所示
在示例表格中
每行表达为参考图像的类型
分别为1 2… n类
每列表达为
待评价分类图像的类型
分别为1 2… n类
这里展示了一个误差矩阵实例
被评价图像上
分类类别为
居住区
空地
植被
道路
共4种类型
从误差矩阵可以看出
共采集了500个样本像元
根据参考图像
判定样本像元的类别
这500个样本像元中
居住区262个
空地14个
植被148个
道路76个
在被评价图像上
这些采集的样本像元中
图像分类结果是
居住区244个
空地16个
植被172个
道路68个
很明显
误差矩阵的对角线上
就是每个类别的
正确分类像元数量
即居住区181个
空地1个
植被96个
道路62个
总体分类精度
就是指
分类正确样本数
和全部样本数的比值
所以
根据这个误差矩阵
可以计算得到
总体分类精度为69.4%
我们来看看如何计算
其它精度评价指标
用户精度
是指从分类结果中
任取一个随机样本
其所具有的类型
与实际类型相同的条件概率
制图精度
是指相对于参考图像的
任意一个随机样本
分类图上
同一地点的分类结果
与其相一致的条件概率
大家来看看表格
根据指标定义
从误差矩阵
可以计算得到
居住区类别的
用户精度为74.18%
空地类别的
用户精度为6.25%
植被类别的
用户精度为55.81%
道路类别的
用户精度为91.18%
居住区
制图精度为69.08%
空地制图精度为
7.14%
植被制图精度为
64.86%
道路制图精度为
81.58%
另外
和用户精度
制图精度相对应的是
错分误差
漏分误差
我们来看看如何计算
Kappa系数
在对误差矩阵进行分析
得出其总体精度
用户和制图精度后
我们往往仍需要一个
更客观的指标来评价分类质量
比如两幅图之间的吻合度
Kappa分析产生的评价指标
Kappa系数
是一种测定
两幅图像之间
吻合度或精度的指标
Kappa系数既考虑到了
对角线上被正确分类的像元
同时也考虑到了
不在对角线上
各种漏分和错分误差
从误差矩阵
可以计算得到
Kappa系数
具体计算过程为
Kappa系数计算结果为
48.5%
这个结果如何评判精度呢
我们这里有一个Kappa系数
和分类质量的大致对应关系
看表格
48.5%大致位于
分类质量“好”这个级别
-第一章习题
-第一讲
-第二讲
-第二章习题
-第三章习题
-第一讲
--4.1.1 概述
--最小二乘法原理
-第二讲
-第四章习题
-第一讲
-第二讲
-第五章习题
-第六章习题
-第一讲
-第二讲
-第七章习题
-第八章习题