当前课程知识点:刑侦视频图像处理 >  第6章 图像检索技术 >  6.2词袋(BOW)特征描述 >  6.2词袋(BOW)特征描述

返回《刑侦视频图像处理》慕课在线视频课程列表

6.2词袋(BOW)特征描述在线视频

下一节:6.3VLAD特征编码

返回《刑侦视频图像处理》慕课在线视频列表

6.2词袋(BOW)特征描述课程教案、知识点、字幕

今天我们来学习

刑侦图像检索技术的

第二部分内容

词带特征描述

这一部分内容

主要包含三个知识点

第一是图像的特征提取

第二个是视觉单词的生成

第三是词带模型BOW的基本概念

首先图像特征提取

图像包含很多特征

比如说是最基本的属性特征

颜色直方图 颜色距

还有一类是纹理特征

比如说LBP GLCM

还有小波变换这样的纹理特征

第三类是空间关系特征

比如说是金字塔或者说是分块

第四类是形状特征

形状特征是目前图像特征里面

使用最普遍也是最广泛的一类特征

它包含的细节更丰富

比如说是下面这个图里面

给出了这个形状特征的一些典型的算法

然后在形状特征里面

有一类特征区域特征

里面的一个的SIFT特征

也就是尺度不变特征变换

SIFT它是在计算机视觉里面

目前 应用最为广泛 也最为稳定

也最为普遍的一类特征

SIFT特征是图像的一个局部特征

它对旋转尺度缩放亮度变换都具有不变性

同样它对视角仿射变换噪声也具有一定的稳定性

所以它被广泛使用

一个SIFT的特征的话

它是一个长度1*128维的一个向量

下面这个大雁塔图提取出来了

它里面的SIFT的特征

可以看出 每一个圆圈 都是一个SIFT的特征

所以说一幅图像里面 可以包含成千上万个SIFT特征

然后第二个知识点 就是视觉单词生成

我们知道一个文本的话 是由大量的单词来组成的

而一个单词 它描述的是一个文本语义

比如说下面这一首诗它有很多单词

比如说你 快乐 眉头 人生这样的一个单词来组成

类似的 一个图它是由很多图块组成的

而每个图块其实都可以用一个SIFT的特征来组成

类似的 其实我们就可以理解为

这样的一个图块就类似于我们文本里面的一个单词

我们把这样的图块称之为视觉单词

如果说是我们要去描述一个文档

我们就用很多单词来去把它组成起来

(同样)我们描述一个图

我们也可以用很多视觉单词来组成

所以说视觉单词的话对于描述图像就比较关键了

那么我们怎么去提取这样的一个视觉特征呢

下面就是第三个概念

视觉单词的生成是怎么生成的

视觉单词的生成的话 它一般是用聚类方法来产生的

比如说是这上面的一个图

图里面有好多的这样的一个局部的图像块

我通过聚类方法处理完之后

我们可以发现好多类似的内容

都可以聚集成一簇一簇

那么这么一簇的 他们的中心

就是相当于是我们的一个视觉单词

然后这样的聚类方法也很多

但是最典型的我们用K-Means来做聚类

对吧 K-Means的话是一个无监督的学习方法

它是根据数据的相似性将数据分为分到不同的组内

然后K-Means它使用簇内的均值向量来描述每个簇

我们假设给定样本的集D由X1到Xm组成

我们将这么多的样本分为K个簇

也就是K个类 那么K-means的目的就是

使簇类所有的样本到簇的质心

每一个小的聚集块之间的一个距离(和)最小

写成这样的一个目标函数的话就是

E等于求和的X-ui的这样的一个二范数最小化

然后K-Means的话它是一个迭代的过程

相当于说是 它初始化几个质心

然后对于所有的样本都去计算到质心的最近距离

然后去通过迭代更新使质心发生变化

最终达到质心稳定地到达每一个簇的中心

比如下面这个就是我用仿真的一个数据

三个 有三个视觉单词的这样的一个样本

我们初始化之后 初始化的质心可以是随机的

可以看到它不在簇的中心

我经过 K-Means的迭代更新之后

最终达到稳定 所有的质心都在簇的中心了

然后簇的中心的话

其实就是可以来描述图上的一个视觉单词

下一个概念就是

我们来通过视觉单词怎么去描述图像

这样都引出来一个概念词袋模型

我们也称之为BOW 词袋模型的话

它是指将图像表示成视觉单词的一个统计直方图

我们通过前面的这样的一个处理

我们可以将大量的图像块聚集成一个一个视觉单词

那么对于 女人 的图像

它是由很多图像块组成的

其实这一个图像块

都可以是用一个视觉单词来去描述它

我们把这个图里面的图像块

通过它对应的视觉单词来进行一个直方图的统计

就可以通过视觉单词的直方图来描述图像的内容

我们就相当于是把这个图像最终转化成一个直方图

这样的一个降维处理

对于不同的这样的一个图像

我们得到的直方图是不一样的

比如下面三个例子

分别是妇女 还有一个自行车 还有一个吉他

可以看出它们直方图的不同

是因为他们内容的不同

这样的话 我们通过直方图来去比对

就可以去得到 我们是什么样本

不同内容的图像

它所构成的这样的一个视觉单词的直方图是不同的

好的 今天我们讲的词袋模型就到此为止

刑侦视频图像处理课程列表:

第1章 绪论

-1.1 绪论(上)

--1.1绪论(上)

-1.2 绪论(下)

--1.1.2绪论(下)

-第1章测试

第2章 视频图像清晰化处理技术

-2.1 光照不良图像增强处理(上)

--2.1 光照不良图像增强处理(上)

-2.2 光照不良图像增强处理(下)

--2.2 光照不良图像增强处理(下)

-第2章习题

第3章 图像超分辨率重建技术

-3.1图像超分辨率重建技术概述

--3.1图像超分辨率重建技术概述

-3.2基于插值的图像超分辨率重建

--3.2基于插值的图像超分辨率重建

-3.3基于深度学习的图像超分辨率重建之神经网络

--3.3基于深度学习的图像超分辨率重建之神经网络

-3.4基于深度学习的图像超分辨率重建

--3.4基于深度学习的图像超分辨率重建

-3.5基础知识介绍

--3.5基础知识介绍

-3.6压缩感知与超分辨率重建

--3.6压缩感知与超分辨率重建

-3.7基于压缩感知字典学习的超分方法

--3.7基于压缩感知字典学习的超分方法

-第3章测试一

-第3章测试二

第4章 高动态范围(HDR)成像技术

-4.1引言-什么是HDR图像

--4.1引言-什么是HDR图像

-4.2 概述-HDR图像处理的研究内容

--4.2 概述-HDR图像处理的研究内容

-4.3HDR图像获取—多曝光融合

--4.3HDR图像获取—多曝光融合

-4.4色调映射基础

--4.4色调映射基础

-第4章测试题

第5章 图像水印技术

-5.1图像水印技术概述

--5.1图像水印技术概述

-5.2图像单水印技术

--5.2图像单水印技术

-5.3图像双水印技术

--5.3图像双水印技术

-第5章测试题

第6章 图像检索技术

-6.1图像检索概述

--6.1图像检索概述

-6.2词袋(BOW)特征描述

--6.2词袋(BOW)特征描述

-6.3VLAD特征编码

--6.3VLAD特征编码

-6.4PCA降维

--6.4PCA降维

第7章 监控视频高效编码技术

-7.1 监控视频编码的作用

--7.1 监控视频编码的作用

-7.2 监控视频编码的标准

--7.2 监控视频编码的标准

-7.3 监控视频编码标准

--7.3 监控视频编码标准

-第7章测试

第8章 视频目标检测与跟踪技术

-8.1运动目标检测

--8.1运动目标检测

-8.2运动目标跟踪

--8.2运动目标跟踪

-第8章测试题

第9章 刑侦高光谱图像处理

-9.1高光谱图像基础知识

--9.1高光谱图像基础知识

-9.2高光谱图像的应用

--9.2高光谱图像的应用

-9.3高光谱图像处理

--9.3高光谱图像处理

-第9章测试题

第10章 现勘三维现场重建

-10.1现勘足迹的基本知识

--10.1现勘足迹的基本知识

-10.2现勘足迹提取方法

--10.2现勘足迹提取方法

-10.3结构光测量技术概况

--10.3结构光测量技术概况

-10.4结构光提取原理

--10.4结构光提取原理

-10.5现勘三维现场重建技术

--10.5现勘三维现场重建技术

-10.6基于二维图像的三维现场重建

--10.6基于二维图像的三维现场重建

-10.7基于深度信息的三维现场重建

--10.7基于深度信息的三维现场重建

-10.8应用案例

--10.8应用案例

-第10章测试题

第11章 现勘图像检索技术

-11.1研究背景与意义

--11.1研究背景与意义

-11.2图像预处理技术

--11.2图像预处理技术

-11.3基于LBP纹理的鞋印检索

--11.3基于LBP纹理的鞋印检索

-11.4基于SIFT特征的鞋印检索

--11.4基于SIFT特征的鞋印检索

-第11章测试题

第12章 刑侦案件智能串并

-12.1什么是案件的智能串并?

--12.1什么是案件的智能串并?

-12.2实现智能串并案的机遇与挑战

--12.2实现智能串并案的机遇与挑战

-12.3智能串并案的实现策略与方案

--12.3智能串并案的实现策略与方案

-12.4真实案件智能串并的实现

--12.4真实案件智能串并的实现

-第12章测试题

第13章 刑侦模拟画像

-13.1刑侦模拟画像概述

--13.1刑侦模拟画像概述

-13.2 刑侦模拟画像计算机辅助系统

--13.2 刑侦模拟画像计算机辅助系统

-13.3刑侦模拟画像计算机辅助系统:两维三维画像辅助

--13.3刑侦模拟画像计算机辅助系统:两维三维画像辅助

-第13章测试题

6.2词袋(BOW)特征描述笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。