Video 7.2慕课视频播放-Introduction to Artificial Intelligence-MOOC慕课视频教程-柠檬大学

大家好

在上一节中

我们介绍了什么是计算机视觉

在节中

我们将讨论图像分类

在本节中

我们将介绍图像分类问题

该问题

是从一组固定的类别中

为输入图像分配一个标签的任务

是计算机视觉的核心问题之一

尽管它很简单

却具有多种实际应用

此外

许多其他看似不同的计算机视觉任务

例如对象检测、分割

可以简化为图像分类

例如

在此图像中

图像分类模型处理一幅图像

并给4个标签{ 猫，狗，帽子，杯子}

分配概率

如图中所示

对于计算机而言

图像表示为一个大型三维数字数组

在此示例中

猫图像的宽度为248像素

高度为400像素

并具有红色，绿色和蓝色三个颜色通道

因此

图像由248 x 400 x 3个数字

或总共297,600个数字组成

每个数字都是0到255之间的整数

我们的任务是将这些数字

变成一个单独的标签

例如“ 猫”

由于识别视觉概念的任务

对于人类而言相对来说是微不足道的

因此值得从计算机视觉算法的角度

考虑所涉及的挑战

图像分类面临的挑战如下

视点变化

对象的单个实例可以相对于相机以多种方式定向

尺度变化

视觉类的尺寸经常发生变化

是真实世界中的尺寸

而不仅仅是图像的大小

形变

许多我们关注的对象不是刚体

并且可能以极端方式变形

遮挡

焦点对象可能会被遮挡

有时，只有一小部分物体可见

照明条件

照明的影响在像素级别上非常明显

背景混乱

焦点对象可能会混入其环境中

从而使其难以识别

类内变异

焦点类别通常可以相对广泛

例如主席

这些对象有许多不同的类型

每种都有自己的外观

一个好的图像分类模型

必须对所有这些变异的叉积不变

同时又要保持对类别间变异的敏感性

一般而言

对于单标签图像分类

可以分为三类

跨物种语义图像分类

所谓跨物种语义图像分类是指

在不同物种级别识别不同类型的对象

例如猫和狗的分类

由于每个类别属于不同的物种或类别

因此此类图像分类

通常具有较大的类别间差异

Cifar-10数据集是一个经典示例

Cifar-10数据集包含10类

分别是飞机、汽车、鸟

猫、鹿、狗、青蛙、马、船和卡车

其中

飞机、汽车、船、卡车都是运输工具

鸟、猫、鹿、狗、青蛙、马都是动物

这可以被认为是两大类

车辆和动物是完全不同的物种

这些都是语义上可区分的对象

因此，cifar-10的分类任务

可以看作是跨物种语义图像分类问题

类之间的差异很大

而类内部的差异很小

子类细粒度图像分类

细粒度图像分类低于跨物种图像分类

它通常是同一类别中子类别的分类

例如不同鸟类的分类

不同狗的分类

以及不同汽车模型的分类

我们以不同鸟类的细粒度分类任务为例

加州技术鸟类学会数据库-2011是一个鸟类数据集

包含200个类别的11,788张图像

同时

每个图像提供15个局部区域位置

1个标签框

和语义级别分割图

以啄木鸟为例

在此数据集中

总共包含6个类别

我们选取两个类别的图片

从图片中可以看出

两只鸟的质地和形状非常相似

只能用头部的颜色和纹理区分它们

因此

为了训练这样的分类器

必须能够识别这些区域

这比跨物种语义分类的图像分类

更为困难

实例识别

如果我们要区分不同的个人

而不仅仅是对象类型或子类别

那就是识别问题

或称实例级图像分类

最典型的任务是面部识别

This is the end of this section

感谢您的观看，欢迎来到下一个阶段

Introduction to Artificial Intelligence课程列表：

Chapter 1 Overview of Artificial Intelligence

-1.1 What is artificial intelligence

--Video 1.1

--Courseware 1.1

--Exercise 1.1

-1.2 The History of artificial intelligence

--Video 1.2

--Courseware 1.2

--Exercise 1.2

-1.3 Applications of Artificial Intelligence

--Video 1.3

--Courseware 1.3

--Exercise 1.3

-1.4 Machine Learning and Deep Learning

--Video 1.4

--Courseware 1.4

--Exercise 1.4

Chapter 2 Machine Learning

-2.1 What is Machine Learning

--Video 2.1

--Courseware 2.1

-2.2 Supervised Learning

--Video 2.2

--Courseware 2.2

-2.3 Unsupervised Learning

--Video 2.3

--Courseware 2.3

-2.4 Construction of Development Environment

--Video 2.4

--Courseware 2.4

Chapter 3 Regression

-3.1 What is Regression

--Video 3.1

--Courseware 3.1

--Exercise 3.1

-3.2 Linear Regression

--Video 3.2

--Courseware 3.2

--Exercise 3.2

-3.3 Logistic Regression

--Video 3.3

--Courseware 3.3

--Exercise 3.3

-3.4 Practical Case

--Practical Case

Chapter 4 Classification

-4.1 What is Classification

-4.2 Naive Bayes

-4.3 Support Vector Machine

--Video 4.3

--Courseware 4.3

-4.4 Practical Case

--Practical Case

Chapter 5 Deep Learning

-5.1 Introduction to Deep Learning

--Video 5.1

--Courseware 5.1

--Exercise 5.1

-5.2 What is Neural Network

--Video 5.2

--Courseware 5.2

--Exercise 5.2

-5.3 Neural Network Basics

--Video 5.3

--Courseware 5.3

--Exercise 5.3

-5.4 Practical Case

--Practical Case

Chapter 6 Convolutional Neural Network

-6.1 What is Convolutional Neural Network

--Video 6.1

--Courseware 6.1

-6.2 Convolution Layer

-6.3 Pooling Layer

-6.4 Classical Convolutional Neural Network

--Video 6.4

--Courseward 6.4

Chapter 7 Computer Vision

-7.1 What is Computer Vision

--Video 7.1

--Courseware 7.1

--Exercise 7.1

-7.2 Image Classification

--Video 7.2

--Courseware 7.2

--Exercise 7.2

-7.3 Introduction to TensorFlow

--Video 7.3

--Courseware 7.3

--Exercise 7.3

-7.4 Practical Case

--Practical Case

Chapter 8 Natural Language Processing

-8.1 What is Natural Language Processing

-8.2 Basics of NLP

-8.3 Recurrent Neural Network

--Video 8.3

--Courseware 8.3

-8.4 Practical Case

--Practical Case

Video 7.2在线视频

Video 7.2课程教案、知识点、字幕

Introduction to Artificial Intelligence课程列表：

Chapter 1 Overview of Artificial Intelligence

Chapter 2 Machine Learning

Chapter 3 Regression

Chapter 4 Classification

Chapter 5 Deep Learning

Chapter 6 Convolutional Neural Network

Chapter 7 Computer Vision

Chapter 8 Natural Language Processing

Video 7.2笔记与讨论

也许你还感兴趣的课程: