9.3.1 图像识别学习视频慕课视频播放-现代图像分析-MOOC慕课视频教程-柠檬大学

同学们好这节课的内容是关于图像的识别方法

随着计算机技术和图像处理技术的不断发展

模式识别逐渐形成它自有的一个体系

那么到底什么是模式呢广义的说

存在于时间和空间中可观察的物体都可以称它为模式

模式不是事物的本身而是所获取的一种信息

那么它的直观特性体现在可观察可区分和相似性上

对于人和动物来说模式识别是一种本能

而对于计算机来说却非常的困难

模式识别在学术领域历史悠久

早在1929年 Tonscheck就发明了阅读机

能够阅读0到9的数字

那么在30年代 Fisher就已经提出了统计分类理论

奠定了统计模式识别的基础

到了四五十年代rosenblat设计制作的感知机

它是一种多层的神经网络

这项工作首次把人工神经网络的研究

从理论探讨付诸了工程实践

而到了六七十年代统计模式识别得到了飞速的发展

但正是由于被识别的模式越来越复杂

那么也出现了模式识别中的一大难题维数灾难

80年代 Hopfield网络和bp网络为代表的神经网络模型

又让神经网络得到了一轮非常广泛的应用

而到了90年代随着小样本学习理论的发展

特别是支持向量机发展的非常迅速也受到了广泛的应用

与此同时国际和国内也有众多的学术组织和机构

成立了相关的协会举办了相关的会议

来推动模式识别的不断发展

下面我们来看一下困扰模式识别界的难题维数灾难

维数灾难一直是模式识别中的难题

早期能够提取的特征较少

我们仅能通过基本特征对图像进行分类识别

这往往难以得到理想的识别结果

随着图像处理技术的不断发展能够获取的特征越来越多

那么这么多的特征我们都加到分类器里面去

是不是我们分类器的性能就会越来越好呢

答案是让人有些沮丧

我们可以看一下下面的这幅图

当特征数量达到一定的值之后

分类器的性能反而是在下降的

这就是我们说的维数过高就会导致一定的问题

那么如果继续增加特征数量样本的力度就会更加稀疏

那么虽然我们能够更容易找到超平面将训练样本分开

但是当我们将高维空间的分类结果映射到低维空间的时候

就会出现一个严重的问题我们可以看一下

如果我们将三维特征空间映射到二维特征空间的时候

很显然这些小猫和小狗的图像全都混在了一起

没有办法进行区分

尽管在高维特征空间训练样本线性可分

但映射到低维空间后结果却正好相反

事实上增加特征数量使得高维空间线性可分

相当于在低维空间内训练了一个复杂的非线性分类器

但是这个非线性分类器太过聪明仅仅学到了一些特例

如果将它用来辨别那些未曾出现的训练样本的话

那么效果就不太理想了

这就是我们在机器学习中所说的过拟合问题

也是维数灾难最直观的一个体现

如果我们用两个特征来代替三个特征进行分类器的学习

又会怎样呢

我们可以看到如果用两个特征代替三个特征

采用两个特征的线性分类器学习到的不只是特例

而是一个整体的趋势

对于那些未曾出现过的样本也可以比较好的判别出来

换句话说通过减少特征数量可以避免出现过拟合问题

从而避免维数灾难

但是事实上我们说在避免维数灾难的时候

我们还要考虑我们所采用的分类器到底是哪一种形式

那么假如我们采用的是需要精确的非线性决策边界的分类器

比如神经网络 KNN和决策树的时候

我们就要很慎重的来考虑这个特征的数量

那么对于泛化能力较好的这类分类器呢

我们就可以适当的增加特征的数量

比如naive Bayesian和线性分类器等等

那么如果给定了n个特征

我们又该如何从中选出m个最优的特征呢

最简单粗暴的方法当然是尝试所有特征的组合

然后再从中挑选出m的最优的特征

但这个代价太大了

不断计算非常耗时而且会走很多的冤枉路

事实上我们已经有一些成熟的算法来进行特征的选择

而交叉验证呢

也是常常被用于检测来避免过拟合这个问题的一种方法

那么接下来我们来介绍模式分类的主要方法

统计模式识别结构模式识别模糊以及神经网络模式识别方法

统计模式识别是最基本的识别技术之一

那么它的主要过程如图所示

也就是将原始图像变换成有利于提取图像特征的形式

在此基础上呢进行学习和分类得到最终的识别结果

我们来看一下

比如这个图所示的两类线性分类器

那么通常我们选择线性判别函数作为线性分类器的判别函数

根据预知类别属性的训练样本

训练所得到的不同类别下的全值系数

我们可以将待判别的样本提取的特征向量

作为线性分类器的输入

分别产生根据不同类别权重系数所得到的判别函数

再通过两个判别函数之差

得到最后的输出确定它的类别属性

那么统计模式识别呢

它的理论基础主要以概率和数理统计为基础

主要方法包括了非线性分类Bayes决策等等

相对来说它的技术已经是比较成熟了

并且对于识别模式基元它的能力是较强的

但是对于比较复杂的模式来说呢

它抽取特征是比较困难的

并且它没有办法反映结构特征

也很难从整体角度来考虑识别问题

好接下来我们看一下结构模式识别

结构模式识别顾名思义是将目标分解为若干个基本的单元

在用它们之间的结构关系来描述目标的方法

典型的结构识别系统的框架可以如这个图所示

那么主要包括了三个部分

预处理模式的描述和句法的分析

对于预处理来说呢

它是对样本数据进行消噪增强和缺损复原

接着呢模式描述对样本单元进行抽取然后完成模式的分割

而文法推理则类似于统计模式识别中的

监督学习和统计分类中的监督分类

通过已知类别的一组样本推断出描述该类模式的文法

最后再进行句法分析

那么相应的这里也给出了结构模式识别的理论基础

主要方法以及它的主要优缺点

接下来我们介绍一下模糊模式识别

模糊模式识别事实上是在模糊数学的基础上建立起来的

模糊数学是1965年由查德教授首次提出的

我们说相对于模糊就是我们的精确数学

精确数学的方法常常会忽略对象的一般特性

它更注重的是对象的数量空间形式和几何形状

但是在现实世界中

有很多的现象并不能用精确数学的方法来进行解决

例如著名的悖论问题秃头悖论

如果我们用精确的方法来判断秃头

首先我们要有一个精确的定义

也就是说要给出一个预值n

那么这个n为多少的时候我们来判断这个人是否为秃头呢

对于精确数学来说如果我们定义了n

头发根数小于n时我们认为它不是秃头

那么当头发根数恰好为n加1的时候

我们又该怎样来进行判断呢

我们可以看到有这样的两种选择

假如我们就承认精确的方法严格的来进行这样的判定

也就是说只要n是预值多一根头发

那么它就不是秃头而有m根头发的才是秃头

这样显然是不合理的因为不合常理

那么假如说我们站在生活常识的角度来说

多一根头发也是秃头那么依此类推多两根也是

再往下类推为n加k的也是秃头

那么这样就会产生头发很多的人也是秃头这样的一个悖论

所以说这样的问题我们就需要从模糊数学的角度来进行解释

模糊模式识别它的理论基础主要就是模糊数学

它的主要方法包含了模糊领域相关的一些基础的方法

那么它能够解决一些精确数学难以描述的问题

但实际当中准确的隶属度函数是很难建立的

这也是它的应用被限制的原因

那么最后我们来介绍一下神经网络识别

神经网络识别是一种非常重要的模式识别方法

它以人脑神经细胞的工作模式作为参考

研究神经系统的信息处理过程

人脑神经细胞又称神经元

这些神经元之间相互连接进行信息交换来实现老的分析功能

对于最初的人工神经网络结构我们可以看到

我们设一个处理单元也就是一个人工神经元

将接受的信息x0到xn减1 通过用w0到wn减1来表示的互联强度

以点集的形式合成为输入

并把它和我们设定的阈值来作比较

经过某个函数f的变换就可以得到我们处理单元最后的输出

那么这里θ就是阈值

下面的图9.3.5是我们常用的三种非线性变换函数

其中c图所示的Sigmoid函数

是目前神经网络中用的最为广泛的一种

我们可以看到处理单元的输入和输出之间的关系

跟我们刚才所看到的示意图是完全一致的

那么这里xi就是我们的第i个输入元素

wi就是我们第i个输入和处理单元间的互联权重

而θ就是我们处理单元的内部阈值

可以看出学习是神经网络最重要的特征之一

神经网络能够按照训练规则自适应的调节神经元之间的连接关系

从而得到与期望更接近的分类器

但这种分类方式我们说对于一些非常复杂的模式

或者说模式不断增加的过程中来说呢

它能够识别的类型还是不够多的

那么以上也给出了它相关的理论基础和主要的方法

如BP模型 HOP模型等等

好这节课我们就到这里

谢谢大家再见

现代图像分析课程列表：

第一章绪论

-1.1 图像及图像的基本概念

--1.1.1 图像处理基本概念学习视频

--1.1.2 图像及图像的基本概念作业

-1.2 数字图像处理的起源

--1.2.1 数字图像处理的起源学习视频

--1.2.2 数字图像处理的起源作业

-1.3 数字图像处理的步骤和方法

--1.3.1 图像处理步骤和方法学习视频

--1.3.2 数字图像处理步骤和方法作业

-1.4 数字图像处理系统的组成

--1.4.1 图像处理系统组成学习视频

--1.4.2 数字图像处理系统的组成作业

-1.5 数字图像处理主要应用领域

--1.5.1 图像处理应用领域学习视频

--1.5.2 数字图像处理主要应用领域作业

第二章数字图像处理基础

-2.1 色度学基础

--2.1.1 色度学基础学习视频

--2.1.2 颜色模型学习视频

--2.1.3 色度学基础作业

-2.2 人的视觉特性

--2.2.1 人的视觉特性学习视频

--2.2.1 人的视觉特性作业

-2.3 图像数字化

--2.3.1 图像的数字化学习视频

--2.3.2 图像数字化作业

-2.4 数字图像特点

--2.4.1 数字图像特点学习视频

--2.4.2 数字图像特点作业

-第二章讨论题

第三章图像变换

-3.1 图像变换的基本概念

--3.1.1 图像变换的基本概念学习视频

--3.1.2 图像变换的基本概念作业

-3.2 图像的几何变换

--3.2.1 图像的几何变换学习视频

--3.2.2 图像的几何变换作业

-3.3 图像的离散傅立叶变换

--3.3.1 图像离散傅立叶变换学习视频

--3.3.2 图像的离散傅立叶变换作业

-3.4 图像变换的一般表示形式

--3.4.1 图像变换的一般表示学习视频

--3.4.2 图像变换的一般表示形式作业

-3.5 图像的离散余弦变换

--3.5.1 图像离散余弦变换学习视频

--3.5.2 图像的离散余弦变换作业

-3.6 图像离散沃尔什-哈达玛变换

--3.6.1 沃尔什-哈达玛变换学习视频

--3.6.2 图像离散沃尔什-哈达玛变换作业

-3.7 K-L变换

-- 3.7.1 K-L变换学习视频

--3.7.2 K-L变换作业

-第三章讨论题

第四章图像增强

-4.1 图像的对比度增强

--4.1.1 图像的对比度增强学习视频

--4.1.2 图像的对比度增强作业

-4.2 直方图修正

--4.2.1 直方图均衡化学习视频

--4.2.2 直方图规定化学习视频

--4.2.3 直方图修正作业

-4.3 图像平滑

--4.3.1 图像空域平滑法学习视频

--4.3.2 图像频域平滑法学习视频

--4.3.3 图像中值滤波学习视频

--4.3.4 图像平滑作业

-4.4 同态滤波

--4.4.1 同态滤波学习视频

--4.4.2 同态滤波作业

-4.5 图像锐化

--4.5.1 图像锐化学习视频

--4.5.2 图像锐化作业

-4.6 图像的彩色增强

--4.6.1 图像彩色增强学习视频

--4.6.2 图像的彩色增强作业

-第四章讨论题

第五章图像恢复

-5.1 退化模型及常见退化模型

--5.1.1 退化模型学习视频

--5.1.2 退化模型及常见退化模型作业

-5.2 图像的无约束恢复

--5.2.1 图像的无约束恢复学习视频

--5.2.2 图像的无约束恢复作业

-5.3 图像有约束最小二乘恢复

--5.3.1 有约束最小二乘恢复学习视频

--5.3.2 图像有约束最小二乘恢复作业

-第五章讨论题

第六章图像压缩编码

-6.1 概述

--6.1.1 概述学习视频

--6.1.1 概述作业

-6.2 图像编码基本理论

--6.2.1 图像编码基本理论学习视频

--6.2.2 图像编码基本理论作业

-6.3 无损编码理论

--6.3.1 无损编码原理学习视频

--6.3.2 无损编码理论作业

-6.4 霍夫曼编码

--6.4.1 霍夫曼编码学习视频

--6.4.2 霍夫曼编码作业

-6.5 算数编码

--6.5.1 算术编码学习视频

--6.5.2 算数编码作业

-6.6 预测编码

--6.6.1 预测编码学习视频

--6.6.2 预测编码作业

-6.7 正交变换编码

--6.7.1 正交变换编码学习视频

--6.7.2 正交变换编码作业

-第六章讨论题

第七章图像分割

-7.1 图像分割的定义及依据

--7.1.1 图像分割定义及依据学习视频

--7.1.2 图像分割的定义及依据作业

-7.2 边缘点检测

--7.2.1 边缘点检测学习视频

--7.2.2 边缘点检测作业

-7.3 边缘线跟踪

--7.3.1 局部边缘连接法及光栅扫描跟踪法学习视频

--7.3.2 Hough变换学习视频

--7.3.3 边缘线跟踪作业

-7.4 门限化分割

--7.4.1 门限化分割学习视频

--7.4.2 门限化分割作业

-7.5 区域分割法

--7.5.1 区域分割法学习视频

--7.5.2 区域分割法作业

-7.6 聚类分割法

--7.6.1 k-means聚类法学习视频

--7.6.2 谱聚类分割法学习视频

--7.6.3 聚类分割法作业

-第七章讨论题

第八章图像描述

-8.1 像素间的基本关系

--8.1.1 像素间的基本关系学习视频

--8.1.2 像素间的基本关系作业

-8.2 目标物的边界描述

--8.2.1 目标物的边界描述学习视频

--8.2.2 目标物的边界描述作业

-8.3 目标物的区域描述

--8.3.1 目标物的区域描述学习视频

--8.3.2 目标物的区域描述作业

-8.4 图像的几何特征

--8.4.1 图像的几何特征学习视频

--8.4.2 图像的几何特征作业

-8.5 特征描述子

--8.5.1 特征描述子SIFT学习视频

--8.5.2 特征描述子HOG学习视频

--8.5.3 特征描述子BOW学习视频

--8.5.4 特征描述子作业

-第八章讨论题

第九章图像分类识别

-9.1 图像匹配

--9.1.1 图像匹配学习视频

--9.1.2 图像匹配作业

-9.2 图像分类

--9.2.1 图像分类学习视频

--9.2.2 图像分类作业

-9.3 图像识别

-- 9.3.1 图像识别学习视频

--9.3.2 图像识别作业

-9.4 模式识别分类专题

--9.4.1 经典分类方法学习视频

--9.4.2 SVM分类器学习视频

--9.4.3 神经网络学习视频

--9.4.4 模式识别分类专题作业

课程思政讨论

-中国天网

-中国天网思政讨论题

西电学子实践作品分享（会持续更新）

考试

-期末测试

--期末测试

9.3.1 图像识别学习视频在线视频

9.3.1 图像识别学习视频课程教案、知识点、字幕

现代图像分析课程列表：

第一章绪论

第二章数字图像处理基础

第三章图像变换

第四章图像增强

第五章图像恢复

第六章图像压缩编码

第七章图像分割

第八章图像描述

第九章图像分类识别

课程思政讨论

西电学子实践作品分享（会持续更新）

考试

9.3.1 图像识别学习视频笔记与讨论

也许你还感兴趣的课程:

9.3.1 图像识别学习视频在线视频

9.3.1 图像识别学习视频课程教案、知识点、字幕

现代图像分析课程列表：

第一章 绪论

第二章 数字图像处理基础

第三章 图像变换

第四章 图像增强

第五章 图像恢复

第六章 图像压缩编码

第七章 图像分割

第八章 图像描述

第九章 图像分类识别

课程思政讨论

西电学子实践作品分享（会持续更新）

考试

9.3.1 图像识别学习视频笔记与讨论

也许你还感兴趣的课程:

第一章绪论

第二章数字图像处理基础

第三章图像变换

第四章图像增强

第五章图像恢复

第六章图像压缩编码

第七章图像分割

第八章图像描述

第九章图像分类识别