当前课程知识点:Introduction to Artificial Intelligence > Chapter 7 Computer Vision > 7.2 Image Classification > Video 7.2
返回《Introduction to Artificial Intelligence》慕课在线视频课程列表
返回《Introduction to Artificial Intelligence》慕课在线视频列表
大家好
在上一节中
我们介绍了什么是计算机视觉
在节中
我们将讨论图像分类
在本节中
我们将介绍图像分类问题
该问题
是从一组固定的类别中
为输入图像分配一个标签的任务
是计算机视觉的核心问题之一
尽管它很简单
却具有多种实际应用
此外
许多其他看似不同的计算机视觉任务
例如对象检测、分割
可以简化为图像分类
例如
在此图像中
图像分类模型处理一幅图像
并给4个标签{ 猫,狗,帽子,杯子}
分配概率
如图中所示
对于计算机而言
图像表示为一个大型三维数字数组
在此示例中
猫图像的宽度为248像素
高度为400像素
并具有红色,绿色和蓝色三个颜色通道
因此
图像由248 x 400 x 3个数字
或总共297,600个数字组成
每个数字都是0到255之间的整数
我们的任务是将这些数字
变成一个单独的标签
例如“ 猫”
由于识别视觉概念的任务
对于人类而言相对来说是微不足道的
因此值得从计算机视觉算法的角度
考虑所涉及的挑战
图像分类面临的挑战如下
视点变化
对象的单个实例可以相对于相机以多种方式定向
尺度变化
视觉类的尺寸经常发生变化
是真实世界中的尺寸
而不仅仅是图像的大小
形变
许多我们关注的对象不是刚体
并且可能以极端方式变形
遮挡
焦点对象可能会被遮挡
有时,只有一小部分物体可见
照明条件
照明的影响在像素级别上非常明显
背景混乱
焦点对象可能会混入其环境中
从而使其难以识别
类内变异
焦点类别通常可以相对广泛
例如主席
这些对象有许多不同的类型
每种都有自己的外观
一个好的图像分类模型
必须对所有这些变异的叉积不变
同时又要保持对类别间变异的敏感性
一般而言
对于单标签图像分类
可以分为三类
跨物种语义图像分类
所谓跨物种语义图像分类是指
在不同物种级别识别不同类型的对象
例如猫和狗的分类
由于每个类别属于不同的物种或类别
因此此类图像分类
通常具有较大的类别间差异
Cifar-10数据集是一个经典示例
Cifar-10数据集包含10类
分别是飞机、汽车、鸟
猫、鹿、狗、青蛙、马、船和卡车
其中
飞机、汽车、船、卡车都是运输工具
鸟、猫、鹿、狗、青蛙、马都是动物
这可以被认为是两大类
车辆和动物是完全不同的物种
这些都是语义上可区分的对象
因此,cifar-10的分类任务
可以看作是跨物种语义图像分类问题
类之间的差异很大
而类内部的差异很小
子类细粒度图像分类
细粒度图像分类低于跨物种图像分类
它通常是同一类别中子类别的分类
例如不同鸟类的分类
不同狗的分类
以及不同汽车模型的分类
我们以不同鸟类的细粒度分类任务为例
加州技术鸟类学会数据库-2011是一个鸟类数据集
包含200个类别的11,788张图像
同时
每个图像提供15个局部区域位置
1个标签框
和语义级别分割图
以啄木鸟为例
在此数据集中
总共包含6个类别
我们选取两个类别的图片
从图片中可以看出
两只鸟的质地和形状非常相似
只能用头部的颜色和纹理区分它们
因此
为了训练这样的分类器
必须能够识别这些区域
这比跨物种语义分类的图像分类
更为困难
实例识别
如果我们要区分不同的个人
而不仅仅是对象类型或子类别
那就是识别问题
或称实例级图像分类
最典型的任务是面部识别
This is the end of this section
感谢您的观看,欢迎来到下一个阶段
-1.1 What is artificial intelligence
--Exercise 1.1
-1.2 The History of artificial intelligence
--Exercise 1.2
-1.3 Applications of Artificial Intelligence
--Exercise 1.3
-1.4 Machine Learning and Deep Learning
--Exercise 1.4
-2.1 What is Machine Learning
-2.2 Supervised Learning
-2.3 Unsupervised Learning
-2.4 Construction of Development Environment
-3.1 What is Regression
--Exercise 3.1
-3.2 Linear Regression
--Exercise 3.2
-3.3 Logistic Regression
--Exercise 3.3
-3.4 Practical Case
-4.1 What is Classification
-4.2 Naive Bayes
-4.3 Support Vector Machine
-4.4 Practical Case
-5.1 Introduction to Deep Learning
--Exercise 5.1
-5.2 What is Neural Network
--Exercise 5.2
-5.3 Neural Network Basics
--Exercise 5.3
-5.4 Practical Case
-6.1 What is Convolutional Neural Network
-6.2 Convolution Layer
-6.3 Pooling Layer
-6.4 Classical Convolutional Neural Network
-7.1 What is Computer Vision
--Exercise 7.1
-7.2 Image Classification
--Exercise 7.2
-7.3 Introduction to TensorFlow
--Exercise 7.3
-7.4 Practical Case
-8.1 What is Natural Language Processing
-8.2 Basics of NLP
-8.3 Recurrent Neural Network
-8.4 Practical Case