当前课程知识点:5G与人工智能 >  第四章 Al, GOGOGO! >  4.3 AlphaGo 的原理 >  4.3 AlphaGo 的原理

返回《5G与人工智能》慕课在线视频课程列表

4.3 AlphaGo 的原理在线视频

下一节:4.4 阿尔法狗和我们有什么关系?

返回《5G与人工智能》慕课在线视频列表

4.3 AlphaGo 的原理课程教案、知识点、字幕

围棋的复杂性

意味着它一直被视为

人工智能领域

最具挑战性的经典游戏

尽管经过几十年的努力

最强大的计算机围棋程序

只能达到人类业余棋手的水平

传统的人工智能方法

即在所有可能的位置上构造一个搜索树

使得对手没有机会

而这是因为计算

可移动的绝对数量

和评估每个可能的落子

位置非常困难

因此

计算机需要采用

一种更加聪明的办法

2016年

科学家他们将高级树搜索

与深度神经网络相结合

研发出AlphaGo

AlphaGo的神经网络

将围棋棋盘的描述作为输入

并通过包含数百万个神经元样连接的

不同网络层对其进行处理

AlphaGo通过两个不同神经网络

合作来改进下棋

第一种神经网络

即 策略网络

它主要作用是观察棋盘布局

企图找到最佳的下一步

事实上

它预测每一个合法

下一步的最佳概率

那么最前面猜测的就

是那个概率最高的

这可以理解成落子选择器

可以选择下一步怎么走

AlphaGo的第二个大脑相

对于落子选择器是回答另一个问题

不是去猜测具体下一步

它预测每一个棋手赢棋的可能

在给定棋子位置情况下

通过整体局面判断来辅助落子选择器

预测游戏的赢家

这就像有两个导师

每个都是多层神经网络

它们从多层启发式二维过滤器开始

去处理围棋棋盘的定位

就像图片分类器网络处理图片一样

经过过滤

13 个完全连接的神经网络层

产生对它们看到的局面判断

这些层能够做分类和逻辑推理

这些网络通过反复训练来检查结果

再去校对调整参数

去让下次执行更好

这个处理器有大量的随机性元素

所以人们是不可能精确知道

网络是如何“思考”的

但更多的训练后能让它进化到更好

同时

科学家向AlphaGo展示了

大量的棋局

帮助它发展自己

对人类合理的下棋方式的理解

然后让它通过

一个称为强化学习的过程

和自己的不同版本进行

成千上万次的游戏

每次都从错误中学习

并不断改进

直到它变得非常强大

直到出现最强者AlphaGo Zero

Zero 英文意思是 零

除了围棋最基本规则

棋盘的几何学定义

轮流落子规则

终局输赢计算

打劫等它就是一张白纸

放弃参考任何人类棋谱

完全自我学习

如果你和一个有人类

老师的 AlphaGo 交手

那可能还会在它背后

看到人类下棋的影子

但是 AlphaGo Zero

完全是一个无师自通的家伙

和它下棋

你可能闻到很浓烈的机械味

但从另一方面想

这样的 AlphaGo

打破了数千年来人类下棋思维的限制

探索了人类想不到的下棋境界

学会了一个崭新的下棋方式

仅仅经过 3 天的训练后

这套系统

已经可以击败 AlphaGo Lee

也就是击败韩国顶尖棋手

李世石的那套系统

而且比分高达100:0

经过 40 天训练后

它总计运行了

大约 2900 万次自我对弈

使得 AlphaGo Zero

击败 AlphaGo Master

也就是击败世界冠军柯洁的系统

比分为 89:11

要知道职业围棋选手

一生中的正式比赛也就一千多局

而 AlphaGo Zero

却进行了 2900 万次对局

在技术层面来说AlphaGo Zero

使用的不再是之前提到的

两套神经网络系统

而是将它们融合成

一个神经网络系统

这样做能更有效利用资源

学习效果更好

其关键在于采用了

新的 (强化学习)

并给该算法带了新的发展

在短短 40 天没有老师教的训练中

AlphaGo Zero

超越了他所有的前辈

在这个时候

我相信它真正做到了在围棋场上无人能敌了

5G与人工智能课程列表:

课程简介

-课程简介

--Video

第一章 人类的密友还是对手?

-1.1 未来什么职业会被取代?

--1.1 未来什么职业会被取代?

--1.1扩展阅读

--1.1 讨论

-1.1 测试 未来什么职业会被取代?

-1.2 人工智能在哪里

--1.2 人工智能在哪里

--讨论:找寻日常生活中的人工智能应用

-1.2 测试 人工智能在哪里

-1.3 强人工智能和弱人工智能

--1.3 强人工智能和弱人工智能

--1.3 补充材料

-1.3 测试 强人工智能和弱人工智能

-1.4 人工智能靠什么实现?

--1.4 人工智能靠什么实现?

-1.4 测试 人工智能靠什么实现?

-1.5 5G和人工智能有何关系?

--1.5 5G和人工智能有何关系?

--1.5 补充材料

-1.5 测试 5G和人工智能有何关系?

第二章 五代十国之争

-2.1 5G,你是不是只比4G多1G?

--2.1 5G,你是不是只比4G多1G?

--5G与4G的根本区别在哪里呢?

-2.1测试 5G,你是不是只比4G多1G?

-2.2 5G,初见

--2.2 5G,初见

--本小节你有哪些不懂的地方,欢迎在留言板提问哦

-2.2测试 5G,初见

-2.3 5G,五代十国的史诗

--2.3 5G,五代十国的史诗

--看视频回答问题

-2.3测试 5G,五代十国的史诗

-2.4 五代是哪五代?

--2.4 五代是哪五代?

-2.4测试 五代是哪五代?

-2.5 5G的三大场景

--2.5 5G的三大场景

-2.5 5G的三大场景--作业

-2.6 五代(5G)演进到哪儿啦?

--2.6 五代(5G)演进到哪儿啦?

-2.6测试 五代(5G)演进到哪儿啦?

-2.7 马上就要来到的5G,我能做什么产品?

--2.7 马上就要来到的5G,我能做什么产品?

--2.7 扩展阅读

-2.7 测试马上就要来到的5G,我能做什么产品?

-2.8 围咖夜话(专家访谈)

--2.8 围咖夜话(专家访谈)

-2.8测试 围咖夜话(专家访谈)

第三章 5G以前的故事

-3.1 3G之母(多址 核心技术 CDMA)上

--3.1 3G之母(多址 核心技术 CDMA)上

--5G时代,我们做这些是无用功么?

-3.1测试 3G之母(多址 核心技术 CDMA)上

-3.2 3G之母(多址 核心技术 CDMA)下

--3.2 3G之母(多址 核心技术 CDMA)下

-3.2测试 3G之母(多址 核心技术 CDMA)下

-3.3 高个爸爸与大盗

--3.3 高个爸爸与大盗

-3.3测试 高个爸爸与大盗

-3.4 4G的变局,半路杀出的Wi

--3.4 4G的变局,半路杀出的Wi

-3.4测试 4G的变局,半路杀出的Wi

-3.5 4G的核心技术

--3.5 4G的核心技术

-3.5测试 4G的核心技术

-3.6 羞涩的4G,前进的5G

--3.6 羞涩的4G,前进的5G

-3.6 测试 羞涩的4G,前进的5G

-3.7 5G网络架构

--3.7 5G网络架构

-3.7测试 5G网络架构

-3.8 围咖夜话(专家访谈)

--3.8 围咖夜话(专家访谈)

-3.8测试 围咖夜话(专家访谈)

第四章 Al, GOGOGO!

-4.1 我们来说说“狗”

--4.1 我们来说说“狗”

-4.1测试 我们来说说“狗”

-4.2 《阿尔法狗》前世今生

--4.2 《阿尔法狗》前世今生

-4.2测试《阿尔法狗》前世今生

-4.3 AlphaGo 的原理

--4.3 AlphaGo 的原理

-4.3测试 AlphaGo 的原理

-4.4 阿尔法狗和我们有什么关系?

--4.4 阿尔法狗和我们有什么关系?

-4.4测试 阿尔法狗和我们有什么关系?

-4.5 深度学习AlphaGo (1)

--4.5 深度学习AlphaGo (1)

-4.5测试 深度学习AlphaGo (1)

-4.6 深度学习AlphaGo(2)

--4.6 深度学习AlphaGo(2)

-4.6测试 深度学习AlphaGo(2)

第五章 可以读的视觉

-5.1 无处不在的感知

--5.1 无处不在的感知

-5.1测试 无处不在的感知

-5.2 5G和视觉

--5.2 5G和视觉

-5.2测试 5G和视觉

-5.3 AI视觉,靠脸吃饭

--5.3 AI视觉,靠脸吃饭

-5.3测试 AI视觉,靠脸吃饭

-5.4 如何应对伪造者?

--5.4 如何应对伪造者?

--5.4 扩展阅读

-5.4测试 如何应对伪造者?

-5.5 手机上的视觉

--5.5 手机上的视觉

-5.5测试 手机上的视觉

第六章 自动驾驶

-6.1 自动驾驶,离得不远

--6.1 自动驾驶,离得不远

-6.1测试 自动驾驶,离得不远

-6.2 无人驾驶实现有多难

--6.2 无人驾驶实现有多难

-6.2测试 无人驾驶实现有多难

-6.3 自动驾驶也有等级

--6.3 自动驾驶也有等级

-6.3测试 自动驾驶也有等级

-6.4 无人车的视觉

--6.4 无人车的视觉

-6.4测试 无人车的视觉

-6.5 自动驾驶和5G的关系(1)

--6.5 自动驾驶和5G的关系(1)

-6.5测试 自动驾驶和5G的关系(1)

-6.6 自动驾驶和5G的关系(2)

--6.6 自动驾驶和5G的关系(2)

-6.6测试 自动驾驶和5G的关系(2)

-6.7 围咖夜话 (专家访谈)

--6.7 围咖夜话 (专家访谈)

期末考试

-期末考试--试题

4.3 AlphaGo 的原理笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。