当前课程知识点:数学文化 >  《数学文化》上 >  第八讲 囚徒困境与博弈问题 >  第八讲 囚徒困境与博弈问题

返回《数学文化》慕课在线视频课程列表

第八讲 囚徒困境与博弈问题在线视频

下一节:第九讲 概率与统计

返回《数学文化》慕课在线视频列表

第八讲 囚徒困境与博弈问题课程教案、知识点、字幕

在生活中

我们往往存在着很多选择

而我们一般都会按照更利于己方的条件来进行选择

这也是今天我们所要了解的内容—博弈

处处充满博弈

小到问答游戏中的田忌赛马

大到国家间的未来发展

可以是人与人之间商业的竞争

更甚之是人与自然的依存发展

在博弈当中

非常著名的就是囚徒困境问题

这个故事是这样的

两名罪犯因为入室抢劫而被抓捕

由于证据不充足

在判刑时判刑时间的长短会因其表现而发生改变

当然我们这里不强调故事的合理性

单纯的当作一个数学问题来作为讨论

囚徒困境假定每个参与者

即囚徒都是利己的

即都寻求最大自身利益

而不关心另一参与者的利益

这也就是经典经济学中的

理性人假设

参与者某一策略所得利益

如果在任何情况下都比其他策略要低的话

此策略称为严格劣势

理性的参与者绝不会选择

另外

没有任何其他力量干预个人决策

参与者可完全按照自己意愿选择策略

囚徒到底应该选择哪一项策略

才能将自己个人的刑期缩至最短

两名囚徒由于隔绝监禁

并不知道对方选择

而即使他们能交谈

还是未必能够尽信对方不会反口

就个人的理性选择而言

检举背叛对方所得刑期

总比沉默要来得低

试想

困境中两名理性囚徒会如何作出选择

若对方沉默时

背叛会让我获释

所以会选择背叛

若对方背叛指控我

我也要指控对方才能得到较低的刑期

所以也是会选择背叛

二人面对的情况一样

所以二人的理性思考都会得出相同的结论

选择背叛

背叛是两种策略之中的支配性策略

两名罪犯都有招与不招两种选择

为了将他们不同选择

而发生的不同情况明了的表述出来

我们可以通过这样的一个图来看看

我们现在可以通过故事的描述

作出这样的一个矩阵

矩阵中列出了两个囚徒招与不招的判刑时间

这样我们剋更直观的进行分析

从这样的一个双变量矩阵我们可以看到

对于A来说

尽管他不知道B是否招供

自己选择招供是比较好的

同样B也会思考到同样的情形

也会选择招供

这样的结果是每人被判5年

当然还会存在两人读不找的情况

两人都不招供

这样各自被判1年

但是根据前面我们所分析的

人都是理性的

也就是

都会选择在可行的条件下最大化自身的利益

所以这样的情况基本上是不会出现的

经过分析

我们将两个囚徒的选择策略构成的组合

就称为博弈均衡

也叫做纳什均衡

其中前后两个招

表示的是A和B的选择策略

这个组合也是两者最好的选择

但是由于人们的选择可能会改变

在达到博弈均衡时

若是任何一方单独改变策略

只能带来收益的减少

所以

在很多时候我们都要尽量去保持博弈均衡的状态

在分析的时候我们提到纳什均衡这个概念

什么事纳什均衡呢

纳什平衡又称为非合作博弈均衡

是博弈论的一个重要术语

以约翰·纳什命名

在一个博弈过程中

无论对方的策略选择如何

当事人一方都会选择某个确定的策略

则该策略被称作支配性策略

如果任意一位参与者

在其他所有参与者的策略确定的情况下

其选择的策略是最优的

那么这个组合就被定义为纳什平衡

约翰·纳什在1994年

和其他两个博弈论学家共同获得了诺贝尔经济学奖

囚徒困境情况在日常的生活中屡见不鲜

商家价格战在一些时候就是囚徒困境

一些出售同样产品的商家

为了牟利而单方面将产品价格抬高

老百姓会认为

产品价格的突然提升原因

是社会发生的一些不好的变化

在这样的猜想下

会引发人们出现恐慌和大规模的囤货的现象

如果了解囚徒困境的原理

我们就应该知道

消费者

其实是不应该存在恐慌而着急囤货的现象的

因为根据囚徒困境的原理

一些商家

虽然在价格的提升中获得了一些利益

但是

想要获得更多的利益就必须将价格降低

而单独某个商家的降价

会引起其他商家的利益受损

这时候

其余的商家也只能一样的

将商品的价格下降到原来的价位

也就是说商家价格战只是一个短期的现象

我们完全不需要有太大的压力

除了在日常的商品交易上

在政治学中

两国之间的军备竞赛可以用囚徒困境来描述

两国都可以声称有两种选择

增加军备

即背叛

或是达成削减武器协议

即合作

两国都无法肯定对方会遵守协议

因此两国最终会倾向增加军备

似乎自相矛盾的是

虽然增加军备会是两国的理性行为

但结果却显得非理性

国家的经济肯定会遭受到不同程度的创伤

社会间肯定也会引起一定程度的动荡

这可视作遏制理论的推论

就是以强大的军事力量来遏制对方的进攻

以达到和平

接下来我们来看最后的一个例子

在以工业文明为标志的资本主义强势引导下

近代人追求物质利益和效率

并树立起与工具理性

紧密关联的近代科学技术理念

资本运作和科技生产力取得了巨大的成功

但是

对随之而来的资源短缺

环境污染

生态恶化等现象却选择了视而不见

以至于

终于酿成了一系列危及人类生存

导致发展不可持续的全球性问题

与此同时

一个全球性大规模的囚徒困境

赫然在现

发达国家为维持优势地位不肯改弦易辙

发展中国家不甘落后也要走

工业化这条弊端丛生的老路

这样的不合作

导致现在生态

成为了囚徒困境中最为严重的情形

通过今天这节课

我们可以感受到数学文化渗透各个方面

各个层次

这节课我们的内容就讲到这

大家也可以下去再了解了解其他的例子

数学文化课程列表:

《数学文化》上

-第一讲 数字之美

--第一讲 数字之美

-第二讲 斐波拉契数列

--第二讲 斐波拉契数列

-第三讲 三次数学危机

--第三讲 三次数学危机

-第四讲 少数民族生活中的数学文化

--第四讲 少数民族生活中的数学文化

-第五讲 中国剩余定理

--第五讲 中国剩余定理

-第六讲 数学素养与人文素养

--数学素养与人文素养(一)

--数学素养与人文素养(二)

--数学素养与人文素养(三)

-第七讲 生活中的数学问题

--生活中的数学问题(一)

--生活中的数学问题(二)

-第八讲 囚徒困境与博弈问题

--第八讲 囚徒困境与博弈问题

-第九讲 概率与统计

--第九讲 概率与统计

-第十讲 芝诺悖论与无穷大

--芝诺悖论与无穷大(一)

--芝诺悖论与无穷大(二)

--芝诺悖论与无穷大(三)

《数学文化》下——走进分形与混沌

-第十一讲 蝴蝶效应与分形龙

--第十一讲 蝴蝶效应与分形龙

-第十二讲 分形维数

--第十二讲 分形维数

-第十三讲 英国的海岸线有多长

--第十三讲 英国的海岸线有多长

-第十四讲 拉普拉斯妖

--第十四讲 拉普拉斯妖

-第十五讲 洛伦茨与吸引子

--第十五讲 洛伦茨与吸引子

-第十六讲 奇异吸引子与蝴蝶效应

--第十六讲 奇异吸引子与蝴蝶效应

-第十七讲 生态繁衍和混沌

--第十七讲 生态繁衍和混沌

-第十八讲 混沌魔鬼与系统稳定性

--第十八讲 混沌魔鬼与系统稳定性

-第十九讲 用简单的规律来描述复杂的大自然

--第十九讲 用简单的规律来描述复杂的大自然

-第二十讲 混沌理论在金融中的应用

--第二十讲 混沌理论在金融中的应用

第八讲 囚徒困境与博弈问题笔记与讨论

也许你还感兴趣的课程:

© 柠檬大学-慕课导航 课程版权归原始院校所有,
本网站仅通过互联网进行慕课课程索引,不提供在线课程学习和视频,请同学们点击报名到课程提供网站进行学习。