当前课程知识点:计算思维导论 > 第九单元 > 9.10 连接主义Ⅱ > Video
大家好
这一节我们介绍连接主义
我们先看一个简单的
解决带伞问题的人工神经网络
每个神经元都有一个阈值
当神经元的每个输入信号相加
如果总量大于或等于阈值
神经元就被激发
产生输出信号
否则就处于闲置状态
这个图就展示了这么一个神经网络
用以处理这么一个简单的带伞问题
在图的左边
有三个兴奋性输入信号
你可以把这些输入信号
想象为大脑通过眼睛
耳朵等器官
触发并发送到
脑部神经元网络中的感觉输入
如果客观情况是真的
那么每个输入信号都为1
比如 如果现在多云
那么被标记为多云的输入
会发送一个强度为1的兴奋性信号
反之
它也就相当于一个强度为0的信号
这个网络只有两个神经元
每个神经元的阈值都不同
湿度和云量输入的神经元
他的阈值为2
也就是当两个输入都为1时才激活他
而另一个神经元的阈值为1
只要输入之一为1就能被激发
大家看这个图
你能看到最终输出
是如何根据输入变化而变化的
我们再看一个例子
针对一个低分辨率
人脸照片的数据库
库中每张照片的人脸角度不一样
有些人直视镜头
有些人的头仰着
有些人看向左边或右边
还有一些人戴着太阳镜
为简单起见
我们假定每张照片的分辨率
为30×30像素
我们的目标
是通过人工神经网络
来判定一张人脸是否戴太阳镜
看看这个简化了的神经网络
中间有三个神经元
N1,N2和N3
它们从输入图像接收输入信号
并向神经元N发送输出信号
如果图像含有太阳镜
最右边的那个神经元N就输出1
反之则输出0
由于从输入图像的每个像素
到神经元网络的每个神经元
都有连接
连接数相当庞大
对于分辨率为30×30的照片
包含着900个像素
也就是说
这个网络的左边总共有2700个连接
为了达到预期目的
我们还需要对该网络做一些调整
1取像素的亮度作为输入信号值
一个全白的像素值为1
一个全黑的像素值为0
不同灰度会对应地取0~1之间的值
2每个连接给他赋一权值
其实就是一个系数
权可以是正的也可以是负的
计算一个神经元的输入总和时
每个输入信号值乘以权值后再求累加和
3输出可以是0到1之间的任意值
当然也包括0和1
当输入总和远低于阈值时
输出接近于0
当输入总和远高于阈值时
输出接近于1
当输入总和阈值相近时
约输出0.5
对于这个例子
如果输出接近1
则强烈暗示带太阳镜
如果输出接近0
则强烈暗示不带太阳镜
我们不妨看看
单个神经元的输入与输出
在这个例子中
这个神经元接收来自三个像素的输入
一个明亮像素
信号强度0.9
一个中等明亮的像素
信号强度0.6
和一个颜色较深的像素
信号强度0.4
这三个像素跟神经元连接的权重
分别是10、0.5和-3
这些信号先和权重
相乘然后再相加
得到这个神经元的输入信号
总强度为8.1
因为8.1要远大于神经元的阈值2.5
因此输出非常接近于1
那么接下来的问题是
网络中每个连接的权值
以及神经元的阈值如何确定呢
这是一个非常关键的问题
因为只有确定了正确的权值和阈值
网络才有可能输出正确的结果
这个值的确定过程就叫机器学习
刚开始
这些值可以是随机值
然后给它一个训练样本
也就是一张照片
根据这个样本
网络会产生一个
0和1之间的输出值
因为这个样本是训练样本
我们事先就知道网络理应输出的值
如果跟预期的结果不一样
就设法调整网络的权值和阈值
使网络的输出更接近于我们想要的目标值
网络以这种方式一个接一个地
通过样本进行训练
一旦训练完所有样本
网络的参数
就会被调整到合理的值
从而完成机器学习过程
学习过程中如何调整网络的参数
相当重要
但这需要一些超出本课程范围的数学知识
比如多变量微积分等等
显然
这又是数学思维与工程思维的有机融合
不难理解
神经网络的学习阶段相当耗费精力
涉及对所有权重和阈值的反复调整
直到网络在训练样本上运作良好
不过所有这些都能被计算机自动完成
而结果就是一个能
简单高效地对样本进行分类的网络
针对这个例子
人们用包含约600张
照片的数据库进行测试
将其中的400张图片用于网络学习
用剩余的200张照片测试网络的效果
结果表明
这个网络的精确度竟然高达85%
下棋的本质是搜索
通过交替思考
自己和对方可能的走法
找到最有利于自己的落子
AlphaGo并非真正
理解了人类大脑如何下棋
而主要是依靠计算能力
演算所有的棋局局面
这个方法被称为博弈树
想象你在棋盘上下棋
每落下一子
它就代表了下一个决策的分叉点
就像一棵正在生长的树那样
会派生出许多可能的局面
并演算每一个点的未来变化情况
理论上
只要计算机的运算能力足够强
就可以按照规则
穷尽所有可能的局面
然后对每一种可能的局面做出评价
并做出最优的决策
那么,AlphaGo具体是怎么实现的呢
从宏观方法论的角度来说
主要有两个方面
一 多层次人工神经元网络
基于诺贝尔奖的研究工作
我们知道了人类初级视觉层的工作原理
那就是
一个物体投射到我们的瞳孔后
我们的视觉系统
开始把它分解为各个非常简单的影像单元
也就是像素
经过几层神经网络的不断投射
最后汇总于高级脑皮层
进行更为复杂的加工和处理
并且融入了其他脑功能
比如说注意力、情感、决策等等
AlphaGo在一定程度上
模拟了生物神经分层的架构
就像这个图一样
它是一种多层结构的
而且每一层能表达概念的抽象程度
是不一样的
表达知识复杂程度也是不一样的
二 深度学习与训练
古语云
授人以鱼不如授人以渔
新语或许可以改成
授计算机以程序
不如授计算机以深度学习能力
AlphaGo将以下两种方法进行了结合
一它从人类的程序员那里获得了围棋知识
二它也获得了学习程序员
不知道的东西的能力
刚开始
AlphaGo只是一个多层的神经网络系统
基本的一个框架
它除了围棋最基本的规则外
没有其它任何知识
换句话说
只要将一些其他规则告诉他
它也照样可以下其他类的棋
然后用了人类16万盘棋
总共3000万幅图
构成的五至九段棋手
以往比赛的棋谱去训练它
AlphaGo只用几周或者几个月的时间
就经历并学习了
人类棋手一辈子所能下的围棋
在训练过程中不断地自我调整
神经元网络的参数
从而使其行为
和高手一样甚至超过顶尖高手
事实上
它不仅能不断调整优化
每个神经元的参数
还能够进行结果的反馈
把结果重新作为输入
进行训练
也就是强化学习
自己与自己下棋来提高自己
许多人惊讶于这种类似于
左右手互博的学习机制
但事实上早在20年前就有了
通过学习人类历史上高手对弈的棋局
对人类的走法进行模拟
记住人类看到一盘棋
是如何走下一步的
当碰到没有见过的棋局时
则参考以往相似的棋局
以此让机器具有像人一样的学习能力
可见 AlphaGo和以前IBM深蓝计算机
战胜国际象棋特级大师不同
深蓝是通过将所有象棋高手的经验
整理出规则
然后教给深蓝
它不具备学习能力
换别的棋就没法玩了
AlphaGo涉及的所有算法
几乎都是现成的
它的贡献在于使用卓越的工程技术
实现了这些技术的结合
最终取得了与人匹敌的围棋能力
我们知道
计算机早在存储记忆
数值计算方面远远超过人类
今天,AlphaGo又在解决复杂问题的优化上
战胜了人类
给人工智能的研究无疑会带来
巨大的推动作用
但我们也必须看到
一 AlphaGo尚且需要一个人坐在棋盘前
优雅地拿起棋子
把棋子放在棋盘上
就光这一点
己是今天智能机器人很难企及的
二 AlphaGo目前还没有情绪
没有情感
不能现场分析对手的心理状态
他跟谁下都是一样
不能够现场和对手展开心理战
缺少交互认知的能力
三 AlphaGo赢了人类
但它产生不了牛顿和爱因斯坦
好,这一节就讲到这
-1.1 计算思维及其教育
--Video
-2.1 计算是什么
--Video
-2.2 计算与自动计算
--Video
-2.3 计算机及其计算本质特征(I)
--Video
-2.4 计算机及计算的本质特征(II)
--Video
-3.1 数的表示与模拟计算
--Video
-3.2 数的表示与数字计算
--Video
-3.3 二进制加法运算的机器化
--Video
-3.4 “九九归一”的加法运算
--Video
-3.5 二进制之优越性及问题与代价
--Video
-4.1 从数学危机到图灵机
--Video
-4.2 图灵机的计算能力
--Video
-4.3 什么问题都能计算吗?
--Video
-4.4 冯•诺依曼机及其发展与演化
--Video
-4.5 从算盘到图灵机——机械计算的本质
--Video
-4.6 电子计算机——透过现象看本质
--Video
-5.1 思维可机械计算吗(I)
--Video
-5.2 思维可机械计算吗(II)
--Video
-6.1 量子理论
--Video
-6.2 量子计算机
--Video
-7.1 人类求解问题之过程
--Video
-7.2 基于计算(机)的问题求解过程
--Video
-7.3 面向过程的结构化设计方法学
--Video
-7.4 面向对象之方法学
--Video
-7.5 面向对象技术
--Video
-7.6 抽象
--Video
-7.7 计算学科中的抽象
--Video
-7.8 时间与空间及其相互转换
--Video
-7.9 技术层面的其他方法学
--Video
-7.10 认知层面的其他方法学
--Video
-8.1 算法与程序
--Video
-8.2 算法设计方法——枚举
--Video
-8.3 算法设计方法——递推
--Video
-8.4 算法设计方法——递归
--Video
-8.5 算法设计方法——分治
--Video
-8.6 算法设计方法——仿生
--Video
-9.1 机器间的通信方式
--Video
-9.2 数据转发方法
--Video
-9.3 网络分层体系结构
--Video
-9.4 有趣的对称加密技术
--Video
-9.5 难解的非对称加密技术
--Video
-9.6 数字签名及其应用
--Video
-9.7 从自然智能到人工智能
--Video
-9.8 符号主义的基本思想
--Video
-9.9 连接主义Ⅰ
--Video
-9.10 连接主义Ⅱ
--Video
-9.11 行为主义的基本思想
--Video
-9.12 机器翻译的愿景与困难
--Video
-9.13 峰回路转的自然语言处理
--Video
-9.14 信息传输中的问题与挑战
--Video
-9.15 重复传输与冗余编码
--Video
-9.16 校验与校验和
--Video
-9.18 自纠错技术及应用
--Video
-9.19 两种简单的数据压缩方法
--Video
-9.20 哈夫曼编码
--Video
-9.21 数据压缩极限与LZ压缩方法
--Video
-9.22 大海捞针的搜索引擎
--Video
-9.23 网页排序方法(PageRank)
--Video
-10.1 计算文化
--Video
-期末考试--作业