当前课程知识点:现代图像分析 > 第七章 图像分割 > 7.6 聚类分割法 > 7.6.1 k-means聚类法学习视频
同学们好,今天我们给大家介绍第七章
图像分割中的另一类方法,是基于聚类的图像分割算法
我们知道聚类分析是统计模式识别中
无监督模式分类的一个重要分支
它试图根据数据集的内部结构
将数据集分成不同的几个子类
使得在同一类的样本尽可能的相似
在不同类的样本要尽可能的相异
分类和分割问题本质上是一致的
都是按照某种准则来获得样本的类别标记
同时,由于图像分割的无监督性和图像质量评价的主观性
使得聚类算法特别适合于图像分割问题
而k-means算法,我们也把它称作是k平均或者是k均值
它是一种应用最为广泛的聚类算法
它是将各个聚类子集内的所有数据样本的均值
作为该聚类的代表点
这种算法主要思想是通过迭代的过程
把数据集划分成不同的类别
而使得评价聚类性能的准则函数达到最优
从而使生成的每个聚类内部是紧凑,内间是独立的
那么k-means算法面临了三个核心问题
其中的第一个核心问题就是如何度量数据间的相似性
我们来看这样的一个例子
我们在这儿给了大家16张扑克牌,这16张扑克牌
我们看是J、Q、K、A这是它的花色
然后,有黑桃、红桃、梅花和方片
我现在要求大家把这16张扑克分组
怎么样来分组呢?首先我们考虑一下
我可以按照花色把它分为4,也就说我可以把它分成
黑桃、红桃、梅花和方片,按照花色把它分成4组
同时,我也可以按照这个扑克上的符号把它分成4组
也就是说,我们把所有的J分成一组,Q分成一组
K分成一组,A分成一组
另外我们也可以按颜色把它分成两种
比如说我可以把它分成红色的是一组,黑色的是一组
那么这个例子就告诉我们
如何定义相似度的度量是非常重要的
第二个核心问题就是
需要选择评价聚类性能的一个准则函数
在k-means算法中,它的准则函数就是要使得每一类的样本
到它的聚类中心的距离平方和要达到最小
用这个距离平方和来评价聚类性能
距离平方和越小说明聚类的效果是越好的
这是它的准则函数
第三个问题就是如何更新聚类中心
在k-means中,我们的聚类中心的更新方法
就是采用的是平均值的方法,所以给它起名叫k-means
那么k-means算法的主要步骤
我们首先给大家简单的介绍一下
首先,第一步就是要随机的确定k个聚类中心
然后,把所有的对象分配到这k个子集中
第二步,计算每个子类的平均值
并且用这个平均值代表相应的子类
也就是说我们要得到一个新的聚类中心
第三步,根据每一个样本到聚类中心的距离重新分配新的子类
第四步,计算每个子类的平均值
这个过程不断的重复,直到满足某个准则函数才停止
那么一般情况下,这个准则函数有两种
第一种就是迭代的次数
达到预先设定的最大的迭代次数的时候,我们的迭代就终止
第二种就是我们的聚类中心不再变化
也就说算法稳定了,那么这个时候也可以终止计算
这里,我们给出了一个用k-means进行图像分割的示例
左上角是原始图像 b、c、d这三个图像分别是
我们把它分割成两类、三类和四类的结果
那我们可以看到就是当我们的聚类类别数越多的时候
图像分割实际上是越精细的
那k-means算法,它是解决聚类问题的一种经典算法
具有简单、速度快的这样的一个优点
那么第二个它的优点就是对于处理大数据集
这个算法相对来讲效率是比较高的,因为它的复杂度比较低
第三个优点就是当它的子类是密集的
而子类和子类之间区别比较明显的时候
k-means算法效果是比较好的,这是它的主要优点
当然,这些算法也存在一个明显的不足,这个不足就是
第一当子类的平均值只有在被定义的情况下才能够使用
有时候我们的样本,它的这个特征比如说是类属性质的
那么这个时候呢k-means算法就不起作用了
第二个就是必须要事先给定这个k,也就是说
我必须要事先知道这个图像分成几个区域,或者说要聚成几类
并且k-means算法对初始是非常敏感的
我们对于不同的初始值可能会导致不同的聚类结果
第三个缺陷就是它对噪声和孤立点数据是比较敏感的
那么这个噪声和孤立点有时候我们也把它叫做野值点
一些少量的这种野值点
能够对我们的平均值产生一个很大的影响
这是我们说k-means算法的一个不足
并且我们知道,早期的基于聚类的分割算法中
待分析的样本就是图像中的像素的点数
因为我们是要把像素点进行分类
那么特征就是像素的灰度
比如说一幅512乘512的图像
那么分类的数目就可以达到将近26万
对于遥感图像来讲,这些尺寸更大的图像
我们样本的这个数目将会更多
从而影响了分割过程的一个实时性
那么既然分类的特征是灰度,所以人们就希望
直接把灰度和它出现的频度作为带分类的样本
与聚类算法相结合
就形成了灰度直方图加权的聚类分割算法
这样对给定的灰度图像分类的样本数呢
不随着图像尺寸的增大而增大,比如说对于256级的灰度图像
不管尺寸多大,那么分类的样本只有256个
从而大大提高了分割效率
好,今天的主要内容就给大家介绍到这里
谢谢大家 再见
-1.1 图像及图像的基本概念
--1.1.2 图像及图像的基本概念作业
-1.2 数字图像处理的起源
--1.2.2 数字图像处理的起源作业
-1.3 数字图像处理的步骤和方法
--1.3.2 数字图像处理步骤和方法作业
-1.4 数字图像处理系统的组成
--1.4.2 数字图像处理系统的组成作业
-1.5 数字图像处理主要应用领域
--1.5.2 数字图像处理主要应用领域作业
-2.1 色度学基础
--2.1.3 色度学基础作业
-2.2 人的视觉特性
--2.2.1 人的视觉特性作业
-2.3 图像数字化
--2.3.2 图像数字化作业
-2.4 数字图像特点
--2.4.2 数字图像特点作业
-3.1 图像变换的基本概念
--3.1.2 图像变换的基本概念作业
-3.2 图像的几何变换
--3.2.2 图像的几何变换作业
-3.3 图像的离散傅立叶变换
--3.3.2 图像的离散傅立叶变换作业
-3.4 图像变换的一般表示形式
--3.4.2 图像变换的一般表示形式作业
-3.5 图像的离散余弦变换
--3.5.2 图像的离散余弦变换作业
-3.6 图像离散沃尔什-哈达玛变换
--3.6.2 图像离散沃尔什-哈达玛变换作业
-3.7 K-L变换
--3.7.2 K-L变换作业
-4.1 图像的对比度增强
--4.1.2 图像的对比度增强作业
-4.2 直方图修正
--4.2.3 直方图修正作业
-4.3 图像平滑
--4.3.4 图像平滑作业
-4.4 同态滤波
--4.4.2 同态滤波作业
-4.5 图像锐化
--4.5.2 图像锐化作业
-4.6 图像的彩色增强
--4.6.2 图像的彩色增强作业
-5.1 退化模型及常见退化模型
--5.1.2 退化模型及常见退化模型作业
-5.2 图像的无约束恢复
--5.2.2 图像的无约束恢复作业
-5.3 图像有约束最小二乘恢复
--5.3.2 图像有约束最小二乘恢复作业
-6.1 概述
--6.1.1 概述作业
-6.2 图像编码基本理论
--6.2.2 图像编码基本理论作业
-6.3 无损编码理论
--6.3.2 无损编码理论作业
-6.4 霍夫曼编码
--6.4.2 霍夫曼编码作业
-6.5 算数编码
--6.5.2 算数编码作业
-6.6 预测编码
--6.6.2 预测编码作业
-6.7 正交变换编码
--6.7.2 正交变换编码作业
-7.1 图像分割的定义及依据
--7.1.2 图像分割的定义及依据作业
-7.2 边缘点检测
--7.2.2 边缘点检测作业
-7.3 边缘线跟踪
--7.3.3 边缘线跟踪作业
-7.4 门限化分割
--7.4.2 门限化分割作业
-7.5 区域分割法
--7.5.2 区域分割法作业
-7.6 聚类分割法
--7.6.3 聚类分割法作业
-8.1 像素间的基本关系
--8.1.2 像素间的基本关系作业
-8.2 目标物的边界描述
--8.2.2 目标物的边界描述作业
-8.3 目标物的区域描述
--8.3.2 目标物的区域描述作业
-8.4 图像的几何特征
--8.4.2 图像的几何特征作业
-8.5 特征描述子
--8.5.4 特征描述子作业
-9.1 图像匹配
--9.1.2 图像匹配作业
-9.2 图像分类
--9.2.2 图像分类作业
-9.3 图像识别
--9.3.2 图像识别作业
-9.4 模式识别分类专题
--9.4.4 模式识别分类专题作业
-中国天网
-车道检测
-期末测试
--期末测试