当前课程知识点:遥感数字图像处理理论与方法 > 第七章 遥感图像计算机分类 > 第一讲 > 7.1.4 监督分类
这小节我们学习
图像分类中的监督分类方法
监督分类又称训练分类法
也就是选择具有代表类型的训练样本
用已知地面各类地物样本的光谱特性
来“训练”计算机
确定识别各类地物的判别函数
或形成识别各类地物的模式
如均值 方差 判别域等
并以此对待分遥感图像的像元
进行模式识别
将待分像元分别归入到
已知具有最大相似度的类别中
从而完成遥感图像的计算机分类
这里展示了监督分类法的技术流程
主要步骤包括训练样本采集
分类算法选择
样本质量评价
图像分类处理等
在样本评价环节
如果先前采集的样本达不到质量要求
则需要返回到采集样本步骤
修改 补充完善训练样本
直至满足图像分类的要求
我们看看训练样本采集过程中
应该注意哪些问题
监督分类对地物属性的先验知识
有较强的依赖性
在选择训练样本时
要充分考虑某类具体地物类型的
光谱特性 分布特征
训练样本的选择
需要分析者对要分类的图像
所在的区域
有所了解
或进行过初步的野外调查
或研究过有关图件
和高精度的航空照片
最终选择的训练样本
应能准确地代表整个区域内
每个类别的光谱特征差异
这里展示了
IKONOS 多光谱图像样本先验知识
我们需要依据
图像光谱特征 纹理特征 地物形状特征等
充分了解分类图像的各类别
比如
1-3 新居民区
4-9 老居民区
二者之间的纹理特征差异
显示了新老居民区的差异
10-12 市中心商业
13-15 郊区购物中心
从地物形状和光谱特征差异区分
是可以判定
市中心和郊区购物中心差异的
16-18 工业区
19-21 研究所
也是存在纹理差异的
22-24 高尔夫球场
25-27 森林 植被组合类型
存在差异
可以作为区分标致
28-30 玉米
31-33 大豆
34-36 收割地
光谱特征差异太小
这就需要到现场验证了
当你对遥感图像熟悉后
已经储备好相应的先验知识
这时才能开展训练样本采集工作
这里展示了
在Landsat TM图像上
基于种子增长算法采集训练样本示例
建立在采样人员先验知识基础上
使用种子像元识别方法
从示例图上采集了水体 植被
和人工建筑物三种类型样本数据
除了种子像元识别方法以外
还有自选多边形法
自选多边形法的优点是可控制性较高
缺点是
可能高估了类别之间的差异 耗时长
种子像元识别方法的优点是
自动选取 耗时短
缺点是可能会低估了类别之间的差异
另外
训练样本在采集过程中
还需要注意几点
(1)训练区也就是训练样本
必须具有典型性和代表性
(2)同一类别训练样本
必须是均质的
不能包含其它类别
也不能是和其它类别之间的
边界或混合像元
(3)训练区的大小 形状和位置
必须能同时在
图像和实地
或其它参考图容易识别和定位
(4)训练样本的数目
至少能够满足
建立分类所用判别函数的要求
以克服各种偶然因素的影响
另外
在选择训练样本时
还必须考虑
每一类别训练样本的总数量
作为一个普遍的规则
如果图像有N波段
则每一类别应该至少有
10*N个训练样本
才能满足一些分类算法中
计算方差及协方差矩阵的要求
采集的训练样本能否达到质量要求呢
我们需要对其进行质量评价
计算各类训练样本的特征信息
通过训练样本的统计值
如均值 标淮方差 最大值 最小值
方差 协方差矩阵 相关矩阵等
检查训练样本的代表性
评价训练样本的好坏
并选出
用于图像分类的最合适的波段
如图所示
这里展示的是
我们从Landsat TM图像上采集的
水体 植被 人工建筑物
三类训练样本
对应的在B3 B4 B2
也就是4 3 2波段组成的
三维特征空间中
三类训练样本的类别分离性
是可以评价的
这里展示的示意图上
三类样本之间是明显分开的
所以是符合样本要求的
我们来看看
常用的分类算法有哪些
首先学习一下
平行多面体分类法(parallelepiped classifier)
也称为盒式分类法(box classifier)
多级切割法(multi-level slice classifier)
它根据
各个不同类别在特征空间的集群范围
在各轴上设定不同类别的数值区间
分割多维特征空间
这种算法选取不同类别的样本
以助于详细了解
待分类图像的类别的特征
并设定每个分类类别的
在各轴上的一系列分割点
也就是不同类别的光谱特征
上限值和下限值
以构成特征子空间
对于一个待分像素来说
其分类结果取决于
它落入哪个类别特征子空间
这里展示了由三维特征空间组成的
平行六面体分类法分类示意图
可以看出
城区 农地 森林 水域 裸地 沙滩等
都各自构成了一个平行六面体
只有落入该六面体的像元才能判入此类中
那么
该算法有哪些优点和缺点呢
首先它的优点
1 快捷简单
因为对每一个模板的
每一波段与数据文件值进行对比的
上下限都是常量
2 能将大多数像元划分到一个类别
这对于一个
首次进行的跨度较大的分类来说
是比较有利的
这一判别规则可以很快缩小分类数
从而避免了更多的耗时计算
节省了处理时间
较小的平行多面体
使之更加逼近实际的概率密度分布
从而提高分类的准确性
但同时它也有一些缺点
比如平行多面体有“角”
因此像素在光谱意义上
与模板的平均值相差很远时也被分类
2 另外 当类别较多时
各类别所定义的区域容易重叠
出现两类互相重叠 混淆不清的情况
在对多维特征空间进行分割时
该算法
要求分割面总是与各特征轴正交
如果
各类别在特征空间中不是正交
呈现倾斜分布
就会产生分类误差
如示意图所示
我们来看看最小距离分类法
最小距离分类法(minimum distance classifier)
计算待判别像元向量
与每一个样本模板的
平均向量的光谱距离
哪类距离它最近
就把它归属于那类
最小距离分类法的判别函数
是建立在地物光谱特征
在特征空间中
是按集群方式分布为前提的
它不像贝叶斯判决函数那样
偏重于集群分布的统计特性
而是偏重于几何位置
在监督分类过程中
我们常用到的最小距离测度值有
绝对值距离 欧氏距离 马氏距离等
看图
在二维空间中待分向量X
和类别A B C中心之间的距离
dA dB dC进行比较
由于dB最小
因而将待分向量X归入B类中
在二维空间中
A B C三类之间的分割线
在图上用虚线表示
用分割线就可以区分
也就是最小距离分类法的判别函数
将空间分割为三部分
最小距离分类方法有哪些优点呢
它的主要优点包括
首先 由于每一个像元
总归有一个样本平均值
与之最为靠近
因此不存在不分类的像元值
第二个方面
计算量小
只计算均值参量
而且矩阵计算也比较简单
因此这种方法节省计算机机时
另外 这种方法只用均值一个参数
避免用协方差矩阵
这就可以避免在样本数较少的情况下
协方差矩阵计算不准确而引起的误差
但是
最小距离分类法也存在缺点和不足
比如
有些不应该分类的像元
可能被分类
另外 没有考虑到类型的变化性
像土地覆盖分类中的城市类型的像元
其差异很大
可能与样本的平均值之间的距离
就要大些
如果用这种判别规则
有些本属于城市类型的像元
则可能被误分
相反
对于内部变化较小的类型
如水体就可能出现分类像元过多
把本不属于这类的像元归入进来
因为属于该类的像元
它与平均值的距离
肯定比不属于该类的像元
与平均值的距离近
但是
这些问题可以通过
采用马氏距离得以缓解
马氏距离判别函数
可以考虑到样本类型的内部变化
在需要考虑统计指标的场合
比绝对值距离 欧式距离更有用
但应用马氏距离分类时
在协方差矩阵中使用较大的值
容易导致对模板(signature)过度分类
如果在聚类组成训练样本中
像素的分布离散程度较高
这时候协方差矩阵中就会出现大值
计算起来比最小距离法慢
另外
马氏距离是参数形式的
意味着每一输入波段的数据
必须是正态分布的
如果不符合该条件则可能带来误分
我们再来看最大似然分类方法
最大似然分类法(MLC)
是应用最广泛的监督分类方法
分类中所采用的判别函数
是每个像元值属于
每一类别的概率或可能性
用最大似然法分类
具体分为三步
首先确定各类的训练样本
再根据训练样本
计算各类的统计特征值
建立分类判别函数
最后
逐点扫描影像各像元
将像元特征向量代入判别函数
求出其属于各类的概率
将待判断像元归属于
判别函数概率最大的一组
最大似然分类器
被认为是一种
稳定性 鲁棒性好的分类器
我们再来看一下最大似然分类方法的
特点和应该注意问题
主要特点是
计算量较大
另外
对先验概率信息有较大的依赖性
同时有效地解决了边界问题
那么我们在分类过程当中
应该注意哪些方面问题呢
首先
如果波段相关性很强
方差 协方差矩阵的逆矩阵就不存在
或非常不稳定
这时候
最好采用主成分分析法
把维数减到仅剩相互独立的波段
第二
假定条件
要注意
我们假定训练区地物的光谱特征
和自然界大部分随机现象一样
近似服从正态分布
利用训练区可求出
均值 方差以及协方差等特征参数
从而可求出总体的先验概率密度函数
比如像SAR图像
它反映的是地物后向散射系数
就不一定服从正态分布
当总体分布不符合正态分布规律时
不适于采用以正态分布假设为基础的
最大似然分类法
在实际运用过程中
可将不同监督分类算法进行组合
提高图像分类效率
如图所示
待分像元在分类处理过程中
既可以选择参数规则
也可以选择非参数规则
如果选择前者的参数规则
比如像最大似然分类
最小距离分类算法
对于待分像元来说
采用参数规则
都可以得到一个分类类别的指派
如果选择后者像非参数规则
如平行六面体分类法
对于待分像元来说
存在三种可能性的判别结果
也就是落入某一类别范围
=1
或者说
落入到几个不同类别的重叠区
我们用>1来标识
还有就是
落入所有类别的间隙区
我们用=0来标识
那么对于后二者
也就是>1和=0两种情况
我们可以再采用其他的参数规则
或者不分类
或者按照次序指派分类结果等不同方案
这就是现在一些常用的商用软件
所采用的组合的方案
本章我们就学习到这里
谢谢
-第一章习题
-第一讲
-第二讲
-第二章习题
-第三章习题
-第一讲
--4.1.1 概述
--最小二乘法原理
-第二讲
-第四章习题
-第一讲
-第二讲
-第五章习题
-第六章习题
-第一讲
-第二讲
-第七章习题
-第八章习题