当前课程知识点:5G与人工智能 > 第四章 Al, GOGOGO! > 4.3 AlphaGo 的原理 > 4.3 AlphaGo 的原理
围棋的复杂性
意味着它一直被视为
人工智能领域
最具挑战性的经典游戏
尽管经过几十年的努力
最强大的计算机围棋程序
只能达到人类业余棋手的水平
传统的人工智能方法
即在所有可能的位置上构造一个搜索树
使得对手没有机会
而这是因为计算
可移动的绝对数量
和评估每个可能的落子
位置非常困难
因此
计算机需要采用
一种更加聪明的办法
2016年
科学家他们将高级树搜索
与深度神经网络相结合
研发出AlphaGo
AlphaGo的神经网络
将围棋棋盘的描述作为输入
并通过包含数百万个神经元样连接的
不同网络层对其进行处理
AlphaGo通过两个不同神经网络
合作来改进下棋
第一种神经网络
即 策略网络
它主要作用是观察棋盘布局
企图找到最佳的下一步
事实上
它预测每一个合法
下一步的最佳概率
那么最前面猜测的就
是那个概率最高的
这可以理解成落子选择器
可以选择下一步怎么走
AlphaGo的第二个大脑相
对于落子选择器是回答另一个问题
不是去猜测具体下一步
它预测每一个棋手赢棋的可能
在给定棋子位置情况下
通过整体局面判断来辅助落子选择器
预测游戏的赢家
这就像有两个导师
每个都是多层神经网络
它们从多层启发式二维过滤器开始
去处理围棋棋盘的定位
就像图片分类器网络处理图片一样
经过过滤
13 个完全连接的神经网络层
产生对它们看到的局面判断
这些层能够做分类和逻辑推理
这些网络通过反复训练来检查结果
再去校对调整参数
去让下次执行更好
这个处理器有大量的随机性元素
所以人们是不可能精确知道
网络是如何“思考”的
但更多的训练后能让它进化到更好
同时
科学家向AlphaGo展示了
大量的棋局
帮助它发展自己
对人类合理的下棋方式的理解
然后让它通过
一个称为强化学习的过程
和自己的不同版本进行
成千上万次的游戏
每次都从错误中学习
并不断改进
直到它变得非常强大
直到出现最强者AlphaGo Zero
Zero 英文意思是 零
除了围棋最基本规则
棋盘的几何学定义
轮流落子规则
终局输赢计算
打劫等它就是一张白纸
放弃参考任何人类棋谱
完全自我学习
如果你和一个有人类
老师的 AlphaGo 交手
那可能还会在它背后
看到人类下棋的影子
但是 AlphaGo Zero
完全是一个无师自通的家伙
和它下棋
你可能闻到很浓烈的机械味
但从另一方面想
这样的 AlphaGo
打破了数千年来人类下棋思维的限制
探索了人类想不到的下棋境界
学会了一个崭新的下棋方式
仅仅经过 3 天的训练后
这套系统
已经可以击败 AlphaGo Lee
也就是击败韩国顶尖棋手
李世石的那套系统
而且比分高达100:0
经过 40 天训练后
它总计运行了
大约 2900 万次自我对弈
使得 AlphaGo Zero
击败 AlphaGo Master
也就是击败世界冠军柯洁的系统
比分为 89:11
要知道职业围棋选手
一生中的正式比赛也就一千多局
而 AlphaGo Zero
却进行了 2900 万次对局
在技术层面来说AlphaGo Zero
使用的不再是之前提到的
两套神经网络系统
而是将它们融合成
一个神经网络系统
这样做能更有效利用资源
学习效果更好
其关键在于采用了
新的 (强化学习)
并给该算法带了新的发展
在短短 40 天没有老师教的训练中
AlphaGo Zero
超越了他所有的前辈
在这个时候
我相信它真正做到了在围棋场上无人能敌了
-课程简介
--Video
-1.1 未来什么职业会被取代?
--1.1扩展阅读
--1.1 讨论
-1.1 测试 未来什么职业会被取代?
-1.2 人工智能在哪里
-1.2 测试 人工智能在哪里
-1.3 强人工智能和弱人工智能
--1.3 补充材料
-1.3 测试 强人工智能和弱人工智能
-1.4 人工智能靠什么实现?
-1.4 测试 人工智能靠什么实现?
-1.5 5G和人工智能有何关系?
--1.5 补充材料
-1.5 测试 5G和人工智能有何关系?
-2.1 5G,你是不是只比4G多1G?
-2.1测试 5G,你是不是只比4G多1G?
-2.2 5G,初见
-2.2测试 5G,初见
-2.3 5G,五代十国的史诗
--看视频回答问题
-2.3测试 5G,五代十国的史诗
-2.4 五代是哪五代?
-2.4测试 五代是哪五代?
-2.5 5G的三大场景
-2.5 5G的三大场景--作业
-2.6 五代(5G)演进到哪儿啦?
-2.6测试 五代(5G)演进到哪儿啦?
-2.7 马上就要来到的5G,我能做什么产品?
--2.7 扩展阅读
-2.7 测试马上就要来到的5G,我能做什么产品?
-2.8 围咖夜话(专家访谈)
-2.8测试 围咖夜话(专家访谈)
-3.1 3G之母(多址 核心技术 CDMA)上
-3.1测试 3G之母(多址 核心技术 CDMA)上
-3.2 3G之母(多址 核心技术 CDMA)下
-3.2测试 3G之母(多址 核心技术 CDMA)下
-3.3 高个爸爸与大盗
-3.3测试 高个爸爸与大盗
-3.4 4G的变局,半路杀出的Wi
-3.4测试 4G的变局,半路杀出的Wi
-3.5 4G的核心技术
-3.5测试 4G的核心技术
-3.6 羞涩的4G,前进的5G
-3.6 测试 羞涩的4G,前进的5G
-3.7 5G网络架构
-3.7测试 5G网络架构
-3.8 围咖夜话(专家访谈)
-3.8测试 围咖夜话(专家访谈)
-4.1 我们来说说“狗”
-4.1测试 我们来说说“狗”
-4.2 《阿尔法狗》前世今生
-4.2测试《阿尔法狗》前世今生
-4.3 AlphaGo 的原理
-4.3测试 AlphaGo 的原理
-4.4 阿尔法狗和我们有什么关系?
-4.4测试 阿尔法狗和我们有什么关系?
-4.5 深度学习AlphaGo (1)
-4.5测试 深度学习AlphaGo (1)
-4.6 深度学习AlphaGo(2)
-4.6测试 深度学习AlphaGo(2)
-5.1 无处不在的感知
-5.1测试 无处不在的感知
-5.2 5G和视觉
-5.2测试 5G和视觉
-5.3 AI视觉,靠脸吃饭
-5.3测试 AI视觉,靠脸吃饭
-5.4 如何应对伪造者?
--5.4 扩展阅读
-5.4测试 如何应对伪造者?
-5.5 手机上的视觉
-5.5测试 手机上的视觉
-6.1 自动驾驶,离得不远
-6.1测试 自动驾驶,离得不远
-6.2 无人驾驶实现有多难
-6.2测试 无人驾驶实现有多难
-6.3 自动驾驶也有等级
-6.3测试 自动驾驶也有等级
-6.4 无人车的视觉
-6.4测试 无人车的视觉
-6.5 自动驾驶和5G的关系(1)
-6.5测试 自动驾驶和5G的关系(1)
-6.6 自动驾驶和5G的关系(2)
-6.6测试 自动驾驶和5G的关系(2)
-6.7 围咖夜话 (专家访谈)
-期末考试--试题