当前课程知识点:轻松学好统计学 > 项目一 走进统计学 > 1.3 案例样板间 > 案例2:改变二战进程的统计学家
改变二战进程的统计学家
二战期间,在欧洲和太平洋地区的盟军战机以惊人的速度被击落。战争初期,超过4万架战机可能会因为德国和日本的对空高射炮坠毁。1943年8月的一天,由盟军联合发起的空袭中,超过60架B-17、B-24被击落。损失率如此之高,美国空军指挥官坐不住了,几名高级军官从战场飞往华盛顿。
许多将士认为,他们肯定去咨询军事专家或武器专家。然而,这几位军官却直奔哥伦比亚大学统计学教研室,找到统计学教授亚伯拉罕·沃尔德。沃尔德是一名罗马尼亚神童,1931年获得维也纳大学的数学博士学位。1938年,他逃离奥地利的纳粹来到纽约,之后一直在大学任教。
美国空军迫切需要解决战机损失率的关键问题,沃尔德教授受命于危难之际,带领一组统计专家来到前线。他在各个部队走访了一圈,然后制作了陆军航空队所用的B-l7、B-24等轰炸机大尺寸模型。紧接着,只要有执行任务的轰炸机部队返航,统计学家们就在第一时间去机场,详细地记录下每一架飞机的损伤情况,随后在模型上用墨汁将所有被击中的部位涂黑。
两个月过去了,战机仍然不断被击落,不少飞行员抱怨这些所谓的专家并没有什么用。但在统计学家面前的轰炸机模型上,除了几个很小的区域还是机身原来的颜色以外,其它全被涂黑了。很多地方显然是被反复涂过多次,墨汁都已经像油漆一样凝结成厚厚的一层。然而,飞行员们面临着不可能完成的任务,美国空军指挥官心急如焚,他们要求为飞行在敌人领空的飞机设计和开发新的装甲防护。空军想加强飞机,但只能对飞机的一小部分进行装甲强化。因为每增加一磅装甲就会减少一磅炸弹的有效荷载能力,从而降低战机的攻击能力。
在陆军航空队司令部会议室里,沃尔德教授指着模型,解释了机身被涂黑意味着什么,航空队高层马上建议加强对这些伤痕累累部位的装甲。但沃尔德教授的建议却恰恰相反:“让厂家给轰炸机上这些没有被涂成黑色的部位,尽快增加装甲。”在场的几个厂商代表质疑说:“为什么是这些没有被击中的地方?难道那些被击中次数最多的部位不需要增加装甲吗?”沃尔德很无奈地摇了摇头说:“这些部位之所以没有被涂黑,不是因为那里不会被击中,而是因为所有被击中这些部位的飞机,最终都没有返回基地。”陆军航空队司令非常赞同他的观点,立刻下令让各个厂家给轰炸机的相应部位增加防护措施。
果然,在采取沃尔德的建议后,盟军轰炸机部队战损大幅下降。事实上,沃尔德教授的观点是正确的,他的数据统计显示,被涂黑的位置在机身和机翼,它们正是飞机最强大的地方,这些部位能承受伤害并依然能安全返回基地。所以沃尔德认为这些部位并不是需要加强的关键。相反,有成千上万的飞机没有飞回来,是因为它们被击中其它地方:发动机,尾部和驾驶舱,这些部位才应该被重点保护。这是一种困扰所有领域数据分析师的认知偏差。
坠落的飞机不说话,一个困扰美国空军的“生存偏差”问题得到彻底解决,统计学家终于改变了二战历程。沃尔德的独到之处,就是在分析问题的时候,能够做到不被表面现象所迷惑,在使用数据之前首先考虑到了数据的代表性问题,进而得到了正确的统计分析结果。
同样,在第二次世界大战期间,盟军很想知道德军总共制造了多少辆坦克。德国人长于逻辑思维而乏于机变,在给坦克编号时非常刻板,他们把坦克从1开始编号。战争之中,盟军缴获了一些德军坦克,并记录下了他们的生产编号。这些编号对于了解德军的坦克总量有用处吗?在统计学家眼里,这些编号组成了一个样本,可由此去估计总的坦克数量。
制造出来的坦克数肯定不小于记录中的最大编号,为了推测它比缴获坦克中的最大编号大多少,可以先计算已知编号的平均值,并把这个平均值视为全部编号的中点。因此,样本均值乘以2就是坦克总数的一个估计,当然,这里必须存在一个假设:缴获的坦克代表了所有坦克的一个随机样本。使用这种方法估计,有可能出现一个荒谬的结果:作为全部坦克数量估计值的样本均值的2倍居然小于样本中的最大值。另一种估计方法是用观测到的最大编号乘以(1+1/n),如果缴获坦克数量为10,其中最大编号为50,那么坦克总数的一个估计是50×(1+1/10)=55。这种方法的各种变形的确用于二战之中。从战后发现的德军记录来看,盟军的估计值非常接近于德军生产坦克的实际值。记录还表明统计估计比其它情报方式所做的估计要大大接近于真实数目。
-1.1 项目导学
--情景导入动画
-1.2 知识点讲授
--知识点鸟瞰
-1.2.1 统计是什么
--统计是什么
--1.2.1 统计是什么--作业
-1.2.2 统计的前世今生
--统计学的前世今生
-1.2.2 统计的前世今生--作业
-1.2.3 掌握常用概念--统计的基石
--统计的基石(上)
--统计的基石(下)
-1.2.4 了解统计的几大方法---统计分析的利器
-1.2.5 “轻松统计学”还是“虐待统计学”
-1.2.5 “轻松统计学”还是“虐待统计学”--作业
-1.3 案例样板间
-1.4 知识拓展
--国务院第七次全国人口普查领导小组办公室负责人 就《全国人口普查条例》施行10周年答记者问
-1.5 沙场练兵
--1.5 沙场练兵--作业
-1.6 技能拔高
--技能拔高
-2.1 项目导学
-2.2 知识点讲授
--知识点鸟瞰
-2.2.1 统计数据的来源与类型
-2.2.1 统计数据的来源与类型--作业
-2.2.2 全面调查与非全面调查
-2.2.2 全面调查与非全面调查--作业
-2.2.3 重点调查与典型调查
-2.2.3 重点调查与典型调查--作业
-2.2.4 设计调查问卷
--设计调查问卷
-2.2.4 设计调查问卷--作业
-2.3 案例样板间
--案例3:国家“营改增”试点调查方案设计——陕西省某物流企业典型调查
-2.4 知识拓展
--知识拓展1:课程思政——1-2月份国民经济经受住了新冠肺炎疫情冲击
--课程思政——国务院第七次全国人口普查领导小组办公室负责人 就《全国人口普查条例》施行10周年答记者问
-2.5 沙场练兵
--2.5 沙场练兵--作业
-2.6 技能拔高
--技能拔高
-3.1 项目导学
--情境导入
-3.2 知识点讲授
--知识点鸟瞰
-3.2.1 统计分组
--统计分组
-3.2.1 统计分组--作业
-3.2.2 分配数列
--分配数列
-3.2.2 分配数列--作业
-3.2.3 读懂统计图表
--读懂统计图表
-3.2.3 读懂统计图表--作业
-3.2.4 Excel技能教与学
-3.3 案例样板间
--案例1-中国仍为世界最大的发展中国家——从购买力平价法视角评析
-3.4 知识拓展
--知识拓展3:我国人口平均预期寿命达到74.83岁——人口普查的结果
-3.5 沙场练兵
--3.5 沙场练兵--作业
-3.6 技能拔高
--技能拔高
-4.1 项目导学
--情境导入
-4.2 知识点讲授
--知识点鸟瞰
-4.2.1 认识总量指标
--认识总量指标
-4.2.1 认识总量指标--作业
-4.2.2 相对指标的含义与分类
-4.2.2 相对指标的含义与分类--作业
-4.2.3 强度相对指标
--强度相对指标
-4.2.3 强度相对指标--作业
-4.2.4 计划完成程度相对指标
-4.2.4 计划完成程度相对指标--作业
-4.2.5 总结相对指标
--总结相对指标
-4.2.5 总结相对指标--作业
-4.2.6 了解算术平均数
--了解算术平均数
-4.2.6 了解算术平均数--作业
-4.2.7 了解调和平均数
--了解调和平均数
-4.2.7 了解调和平均数--作业
-4.2.8 分清众数和中位数
--分清众数和中位数
-4.2.8 分清众数和中位数--作业
-4.2.9 平均差--均值的朋友1
-4.2.10 标准差(方差)--均值的朋友2
-4.2.11 离散系数--找差异
-4.2.12 Excel技能教与学
-4.3 案例样板间
--案例1——用真实数据说话:2014年全国科技经费投入统计公报
--案例3——一起读数据:北京市宏观经济及社会发展指标(居民收入与支出)
-4.4 知识拓展
--课程思政——2019年我国“三新”经济增加值相当于国内生产总值的比重为16.3%
--课程思政——关于“6亿人每个月的收入也就1000元”的数据解读——提高居民收入水平任重而道远
--课程思政——国家统计局城市司首席统计师孔鹏解读2020年5月份商品住宅销售价格变动情况统计数据
-4.5 沙场练兵
--4.5 沙场练兵--作业
-4.6 技能拔高
--技能拔高
-5.1 项目导学
--情境导入动画
-5.2 知识点讲授
--知识点鸟瞰
-5.2.1 时间数列含义与分类
-5.2.1 时间数列含义与分类--作业
-5.2.2 水平分析指标1--总量指标时间数列
-5.2.3 水平分析指标2--相对指标时间数列和平均指标时间数列
--时间数列——水平分析指标2相对指标时间数列和平均指标时间数列
-5.2.4 时间数列-- 速度分析指标(上)
-5.2.5 时间数列-- 速度分析指标(下)
-5.2.6 时间数列的因素分析
-5.2.6 时间数列的因素分析--作业
-5.2.7 Excel在时间数列中的运用
-5.3 案例样板间
--案例1——2017年1-8月全国固定电话年末用户数统计分析
--案例2——国家统计局城市司高级统计师绳国庆解读2018年6月份CPI和PPI数据
--课程思政——中华人民共和国2019年国民经济和社会发展统计公报
-5.4 知识拓展
--课程思政:十年巨变!2010—2019的中日GDP 对比分析
--课程思政——透过数据看规律:2020年4月份国民经济运行继续改善 主要指标呈现积极变化
--课程思政——“道路自信“的数据证明——统筹疫情防控和经济社会发展成效显著 3月份主要经济指标降幅明显收窄
-5.5 沙场练兵
--5.5 沙场练兵--作业
-5.6 技能拔高
--html
-6.1 项目导入
--情境导入动画
-6.2 知识点讲授
--html
--知识点鸟瞰
-6.2.1 相关与回归分析概论
-6.2.1 相关与回归分析概论--作业
-6.2.2 相关分析的种类和工具
-6.2.2 相关分析的种类和工具--作业
-6.2.3 一元线性相关
--一元线性相关
-6.2.3 一元线性相关--作业
-6.2.4 实证分析
--实证分析
-6.2.5 Excel在相关回归中的运用
-6.3 案例样板间
--案例1—— 描述性统计分析(以某高校财务管理、会计电算化专业学生成绩的总体情况)
-6.4 知识拓展
--知识拓展——陕西工商职业学院学生成绩与学习时间的实证分析对我们的启发
-6.5 沙场练兵
--6.5 沙场练兵--作业
-6.6 技能拔高
--技能拔高
-7.1 项目导入
--情境导入动画
-7.2 知识点讲授
--知识点鸟瞰
-7.2.1 认识统计指数
--认识统计指数
-7.2.1 认识统计指数--作业
-7.2.2 同度量因素
--同度量因素
-7.2.2 同度量因素--作业
-7.2.3 综合指数
--综合指数
-7.2.3 综合指数--作业
-7.2.4 平均指数
--平均指数
-7.2.4 平均指数--作业
-7.2.5 编制指数不混淆
--编制指数不混淆
-7.2.5 编制指数不混淆--作业
-7.2.6 指数体系与因素分析法
-7.2.6 指数体系与因素分析法--作业
-7.2.7 近距离看因素分析
-7.2.7 近距离看因素分析--作业
-7.2.8 聊聊CPI那些事
-7.2.8 聊聊CPI那些事--作业
-7.2.9 Excel在指数分析中的应用
-7.3 案例样板间
--案例1——2020年5月份CPI同比涨幅继续回落 PPI环比降幅收窄
--课程思政——2020中国生态小康指数95.2:大气污染治理进入攻坚期
--思政课堂: 国务院新闻办公室举行《第二次全国污染源普查公报》发布会
-7.4 知识拓展
--拓展1——2017年《世界幸福指数报告》(World Happiness Report 2017)
-7.5 沙场练兵
--7.5 沙场练兵--作业
-7.6 技能拔高
--技能拔高
-8.1 项目导入
--情境导入动画
-8.2 知识点讲授
--html
--知识点鸟瞰
-8.2.1 抽样推断概述
--抽样推断概述
-8.2.1 抽样推断概述--作业
-8.2.2 全及总体与样本总体、重复抽样与不重复抽样
-8.2.2 全及总体与样本总体、重复抽样与不重复抽样--作业
-8.2.3 误差与抽样误差
--误差与抽样误差
-8.2.3 误差与抽样误差--作业
-8.2.4 抽样平均误差
--抽样平均误差
-8.2.4 抽样平均误差--作业
-8.2.5 抽样极限误差
--抽样极限误差
-8.2.6 点估计
--点估计
-8.2.6 点估计--作业
-8.2.7 区间估计
--区间估计
-8.2.8 必要样本容量
--必要样本容量
-8.2.8 必要样本容量--作业
-8.2.9 抽样形式不混淆
--抽样形式不混淆
-8.2.9 抽样形式不混淆--作业
-8.2.10 Excel在抽样推断中的运用
-8.3 案例样板间
--案例1
--案例2
--案例3
-8.4 知识拓展
--拓展1
--拓展2
-8.5 沙场练兵
--8.5 沙场练兵--作业
-8.6 技能拔高
--技能拔高
-聊聊统计分析和之后的那些事情