当前课程知识点:Introduction to Artificial Intelligence >  Chapter 6 Convolutional Neural Network >  6.3 Pooling Layer >  Video 6.3

返回《Introduction to Artificial Intelligence》慕课在线视频课程列表

Video 6.3在线视频

下一节:Coureseware 6.3

返回《Introduction to Artificial Intelligence》慕课在线视频列表

Video 6.3课程教案、知识点、字幕

大家好

在上一节中

我们介绍了

卷积层

在本节中我们将讨论池化层

卷积神经网络中的

卷积层

系统地将学习到的过滤器

应用于输入图像

来创建可以总结输入中

这些特征的存在的特征图

卷积层

被证明是非常有效的

在深度模型中堆叠卷积层

可以使靠近输入的层

学习低层特征

而在模型深处的层

可以学习高阶

或更抽象的特征

例如形状

或特定对象

卷积图层的特征图

输出的局限性在于

它们会记录输入中特征的精确位置

这意味着输入图像中特征位置的

微小移动

将导致不同的特征图

重新裁剪,旋转,移位以及对输入图像

进行其他较小更改时

可能会发生这种情况

解决信号处理中此问题的

常用方法

称为下采样

通过改变

图像上卷积的步幅

可以使用卷积层

实现下采样

但是更健壮

和通用的方法

是使用池化层

池化层是在卷积层之后

添加的新层

具体地

在非线性之后

通常将ReLU

应用于卷积层输出的

特征图

例如

模型中的各层

可能如下所示

输入层

卷积层

ReLU层

和池化层

在卷积层之后添加池化层

是用于

对卷积神经网络内的

各层进行排序的常见模式

该模式可以在给定模型中重复一次或多次

为什么要使用池化层呢

首先,使用池化层

来缩小特征图的尺寸

因此,它减少了要学习的参数数量

以及网络中执行的计算量

第二,池化层汇总了

由卷积层生成的

特征图区域中存在的特征

因此,对摘要特征

执行进一步的操作

而不是对卷积层生成的

精确定位的特征进行操作

这使模型对

输入图像中

特征位置的变化

更加鲁棒

在池化层中

创建输入信号的

较低分辨率

版本

该信号仍然包含大型或重要的结构元素

而抛弃了那些对任务没有帮助的精细细节

池化操作是指定的

而不是通过学习的

下面显示了两个常用的池化层

最大池化

最大池化是一种池化操作

可从过滤器覆盖的

要素图区域中

选择最大元素

让我们看一个例子

有一个经过校正的功能图

现在正在通过池化层

我们使用2x2过滤器和2步幅

设置最大池

因此我们将精简后的特征图

缩小为2x2的池化特征图

如何计算呢

在这种情况下

我们将过滤器设为2

并得到4个值

2、3、9和4

在这4个值中

最大值为9

所以我们选择9

我们需要在整个图像上移动过滤器

该过程与上面的过程完全相同

我们需要对整个图像重复该过程

因此,最大池化层之后的输出

将是一个

包含先前特征图

最突出特征

的特征图

平均池化

平均池化计算存在于过滤器覆盖的

特征图区域中的元素的

平均值

因此,虽然最大池化在特征图的特定面片中提供了最突出的特征

但平均池化却提供了面片中存在的

特征的平均值

合并操作或过滤器的大小小于特征图的大小

具体而言

几乎总是

以2像素的跨度

应用2×2像素

这意味着

池化层

将始终把每个特征图

的大小减小2倍

例如每个尺寸减半从而将每个特征图中

的像素或值的数量

减少到四分之一

例如

将池化层应用于6×6的特征图

将导致输出池化的特征图为3×3

of 3×3

池化层减少了要学习的参数数量

以及网络中执行的计算量

特征提取后

有一层或几层是完全连接的层

完全连接的层

是传统人工神经网络中的

一个基本的层

全连接层中的

每个节点将每个输入

乘以可学习的权重

并在应用激活函数之前

输出添加到可学习的

偏差中的节点的总和

层之间的连接数

由输入层中节点数

与连接层中节点数

的乘积

来一起确定

完全连接层的目的

是获取

卷积或池化的结果

并使用它们将图像分类为标签

我们应该将矩阵展平为

向量

这一过程中的这一步骤称为展平

展平的作用是

将所有池化的特征图

生成的二维数组

转换为单个的长连续线性向量

然后将展平后的矩阵

作为输入

输入到完全连接的层

以对图像进行分类

众所周知

每个卷积和池化层

在其输出处都包含一个

整流的线性激活层

我们始终在最终完全连接的层之后

应用软最大激活功能

软最大层

是多类分类问题不可或缺的部分

软最大

激活功能

输出其输入的规范化形式

通过这样做

可以确保

其输出的总和

完全等于1

这允许多类分类

选择软最大激活后

具有最大值的节点的索引

作为

最终的分类预测

我们以一个例子来说明

使用卷积神经网络识别图像的

完整过程

卷积神经网络

准确识别鸟类的方法如下

来自图像的像素

被送到执行

卷积操作的

卷积层

生成卷积图

卷积图应用于ReLU函数

以生成

校正后的特征图

使用多个卷积

和ReLU层

对图像进行处理

以定位特征

具有各种过滤器的

不同池化层

用于识别图像的

特定部分

将池化后并的特征图展平并送到完全连接的图层

以获取最终输出

这一节我们就讲到这

感谢收看,欢迎进入下一节的学习

Introduction to Artificial Intelligence课程列表:

Chapter 1 Overview of Artificial Intelligence

-1.1 What is artificial intelligence

--Video 1.1

--Courseware 1.1

--Exercise 1.1

-1.2 The History of artificial intelligence

--Video 1.2

--Courseware 1.2

--Exercise 1.2

-1.3 Applications of Artificial Intelligence

--Video 1.3

--Courseware 1.3

--Exercise 1.3

-1.4 Machine Learning and Deep Learning

--Video 1.4

--Courseware 1.4

--Exercise 1.4

Chapter 2 Machine Learning

-2.1 What is Machine Learning

--Video 2.1

--Courseware 2.1

-2.2 Supervised Learning

--Video 2.2

--Courseware 2.2

-2.3 Unsupervised Learning

--Video 2.3

--Courseware 2.3

-2.4 Construction of Development Environment

--Video 2.4

--Courseware 2.4

Chapter 3 Regression

-3.1 What is Regression

--Video 3.1

--Courseware 3.1

--Exercise 3.1

-3.2 Linear Regression

--Video 3.2

--Courseware 3.2

--Exercise 3.2

-3.3 Logistic Regression

--Video 3.3

--Courseware 3.3

--Exercise 3.3

-3.4 Practical Case

--Practical Case

Chapter 4 Classification

-4.1 What is Classification

--Video 4.1

--Courseware 4.1

-4.2 Naive Bayes

--Video 4.2

--Courseware 4.2

-4.3 Support Vector Machine

--Video 4.3

--Courseware 4.3

-4.4 Practical Case

--Practical Case

Chapter 5 Deep Learning

-5.1 Introduction to Deep Learning

--Video 5.1

--Courseware 5.1

--Exercise 5.1

-5.2 What is Neural Network

--Video 5.2

--Courseware 5.2

--Exercise 5.2

-5.3 Neural Network Basics

--Video 5.3

--Courseware 5.3

--Exercise 5.3

-5.4 Practical Case

--Practical Case

Chapter 6 Convolutional Neural Network

-6.1 What is Convolutional Neural Network

--Video 6.1

--Courseware 6.1

-6.2 Convolution Layer

--Video 6.2

--Courseware 6.2

-6.3 Pooling Layer

--Video 6.3

--Coureseware 6.3

-6.4 Classical Convolutional Neural Network

--Video 6.4

--Courseward 6.4

Chapter 7 Computer Vision

-7.1 What is Computer Vision

--Video 7.1

--Courseware 7.1

--Exercise 7.1

-7.2 Image Classification

--Video 7.2

--Courseware 7.2

--Exercise 7.2

-7.3 Introduction to TensorFlow

--Video 7.3

--Courseware 7.3

--Exercise 7.3

-7.4 Practical Case

--Practical Case

Chapter 8 Natural Language Processing

-8.1 What is Natural Language Processing

--Video 8.1

--Courseware 8.1

-8.2 Basics of NLP

--Video 8.2

--Courseware 8.2

-8.3 Recurrent Neural Network

--Video 8.3

--Courseware 8.3

-8.4 Practical Case

--Practical Case

Video 6.3笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。