当前课程知识点:智能控制 > 第六章 典型神经网络 > 6.1 感知器 > 6.1.1 感知器的数学模型.
下面我们讲第六讲
典型神经网络
主要包括两个内容
感知器
BP神经网络
首先我们来看一下感知器
感知器是一种最简单的
人工神经网络模型
这是一个单层单神经元感知器
这是它的输入
所谓的输入就是它的特征输入向量
比如说我们人
为什么能够迅速地判断
水果是苹果还是橘子
那是因为我们会通过观察它的特征
来进行判断的
比如我们可以怎么区分的
比如我们发现苹果一般是红色的
而橘子一般可能是黄色的
这是从颜色上可以进行区分
第二个不同特征
我们可以从表面是否光滑
还是粗糙的角度来进行区分
苹果一般是光滑的
而橘子一般是粗糙的
第三个特征
我们可以判断一下它的重量
稍微判断一下
一般地来说苹果是比较重的
橘子是比较轻的
我们可以通过这些
颜色是否光滑
还有它的重量是较轻还是较重
这些不同的特征
来判断它是属于苹果
还属于橘子
那么显然人在判断这些水果类别的时候
我们是将刚才这些颜色还有形状
它可能是圆形
然后椭圆形的也不一样
颜色、形状
表面是光滑、粗糙的
它可能较轻还是较重
等等不同的特征
人是提取了这些特征
作为人判断水果的类别的
是有输入的
那么人工神经网络
也就是感知器
作为最简单的人工神经网络
它也是这么做
我会事先提取一些特征向量作为输入
那个可能是各种各样的特征
x1、x2、x3、x4…xn
那么它的取值可能是0、1
或者是其它的取值
这也作为它的
感知器的输入
那么这个不同的输入
n个不同的输入
它们对应的权值也不一样
ω1、ω2…ωn
就是它们对应的权值
那么加权求和之后
跟一个阈值θ相比较得到的u
也就是(见公式)
求和之后减去阈值θ
如果把阈值看作第0个输入
它一直等于1的话
x0等于1
那么它对应的权值ω0等于多少
-θ
这样的话就可以把
前面这n项减去θ合并成n+1项
也就是i从0到n
(见公式)
加权求和的结果
那么这时候对应的第0个输入
x0等于1
ω0的权值是-θ
也就是阈值的相反数
那么加权求和之后
得到了u
再经过一个激励函数f变换
得到了y
那这个f就叫做激励函数
这里面输入特征向量
也就是X等于x0、x1到xn
n+1个输入特征向量
权值是可以调整的
ω1到ωn是通过学习算法来进行调整
这样就建立了
从若干个输入特征向量x1、x2到xn
到输出变量y之间的这种
非线性映射关系
那么简而言之就是加权求和取函数
得到了y
建立了若干个特征输入向量
到输出y之间的一种非线性映射关系
那么这个函数称为激励函数
Activation Function
那么最简单的激励函数是一种
硬限幅函数Hard-Limiting
也就是说当输入u大于等于0的时候
y是等于1的
否则的话y等于0
类似一个阶跃信号
那么这种输出
可以明显地区分两个模式的分类问题
比如说区分一个水果是苹果还是橘子
那么这是硬限幅函数就很方便
但是我们知道有很多问题
它的输出不一定是0和1
比如模糊控制里面有个什么概念呢
叫做隶属度
隶属度的取值范围
可以在0到1之间取值
这个时候就需要采用Sigmoid函数
也叫S型激励函数
这是它的表达式
(见公式)
β是一个大于0的参数
控制它的陡峭度的
我们看到随着β这个参数的不断增大
它的曲线变得越来越陡峭
而当β趋于无穷大的时候
其实S型激励函数就趋近于硬限幅函数
这样的话它就是一个硬限幅函数
我们可以观察得到
当u趋于负无穷大的时候
因为β是大于0的
所以y是趋于0的
当u趋于正无穷大的时候
y是趋近于1的
这就是S型和硬限幅函数
那么S型激励函数
显然可以很方便地描述
它的输出
神经网络的输出
是一个闭区间0到1之间的数
当然还有概率的问题
它输出也是0到1之间
所以这是两种典型的激励函数
那么对于一个
两个模式的分类问题
用一个输出就可以解决
用一个输出
定义为1和0分为两类
很多时候我们需要解决
多个模式的分类问题
比如我要区分一个水果
是西瓜、葡萄、香蕉、梨子还是苹果
这时候我们就不仅要考虑
两个模式的分类问题
苹果和橘子
还要考虑多个模式分类的问题
这时候我们可以把
感知器的输出弄成多个
构成这样一个单层的多神经元感知器
那么对于每一个感知器来说
都是加权求和取函数
这里面权值就构成了n+1列m行
这样一个权矩阵W
那么写成向量的形式就是
(见公式)
在经过激励函数f变换得到了输出y
那么输入特征向量X等于x0到xn
输出向量就是按照不同的特征分类的结果
y等于y1到ym
权矩阵W是可以调整的
这是由学习算法来决定
那么有的时候
用单层的神经元感知器
还不能解决一些问题
还需要用到多层多神经元感知器
那么这就是它的模型
这是它的输入层
输出层
那么从输入层到输出层
中间称为隐含层
从左到右依次称为
第一隐含层、第二隐含层
这样构成了一个
从多个输入特征向量x0到xn
到多个输出y1到ym之间的
一种非线性映射关系
多层多神经元感知器
这是它的一个结构图
我们如果考虑输出层的话
它就是一个四层的感知器网络
如果不考虑输出层的话
也有的书把它称为三层感知器网络
-开篇
--开篇
-1.1课程考试方式
-1.2 数据、信息、知识与智能
-1.3传统控制面临的挑战
-1.4 控制科学发展过程
-1.5 智能控制的多元论
--1.5
-1.6 控制策略的渗透与融合
--1.6
-1.7 智能控制与传统控制的联系与区别
--1.7
-1.8 智能控制的类型之分级递阶智能控制系统
--1.8
-1.9 智能控制的类型之专家控制系统
--1.9
-1.10 智能控制的类型之模糊控制系统
--1.10
-1.11 智能控制的类型之神经网络控制系统,智能控制的类型之基于规则的仿人智能控制系统,集成智能控制系统,组合智能控制
--1.11
-1.12智能控制系统的类型之基于规则的仿人智能控制系统,集成智能控制系统,组合智能控制
--1.12
-1.13本章小结
--1.13
-第一章测试
-2.1基于搜索的问题求解
-- 2.1.7 均一代价搜索
-- 2.1.10 A星算法
-2.2 专家系统简介
- 2.3 专家PID
-第二章测试
-3.1 模糊控制概述
-3.2 模糊集合
-3.3 隶属函数
--3.3隶属函数.
-3.4 模糊关系及其运算
-第三章测试
- 4.1 模糊自适应整定PID控制原理
-4.2 基于FF的模糊PID控制试验验证
-第四章测试
- 5.1 神经网络简介
- 5.2 神经网络的发展简史
-5.3 神经网络的基本概念
- 5.4 神经网络的分类
-5.5 神经网络的学习算法、基本特征和研究领域
-第五章测试
-6.1 感知器
--6.1.2.1 感知器应用实例分析(实现逻辑运算与或非)
- 6.2 BP神经网络
--6.2.2.1 BP神经网络应用实例分析之一:逻辑运算异或实现
--6.2.2.2 BP神经网络应用实例分析之二:非线性函数拟合
-第六章测试
- 7.1 什么是遗传算法
-7.2 遗传算法的特点
-7.3 遗传算法的基本操作之复制
-7.4 遗传算法的基本操作之交叉与变异
-第七章测试
-8.1 遗传编程工作原理
-8.2 遗传编程基本操作之复制
-8.3 遗传编程基本操作之交换和突变
- 8.4 遗传编程的工作步骤及实例分析
-第八章测试
-期末测试