当前课程知识点:医学科研设计 > 第四章 医学科研设计的统计学原则 > 4.10科研过程中对P值的正确理解 > 4.10 科研过程中对P值的正确理解
大家好我叫史静琤
来自于中南大学湘雅公共卫生学院
本节与大家分享
科研过程中P值的正确解读
在变异无所不在的生物医学领域
选择恰当的统计分析技术
进行正确的统计分析运算
给予合理的统计结果解释
是保证研究结论科学可靠的关键一环
在科研过程中
我们经常会涉及到对于差异或者关联的测量
例如说一种药物是不是比
另外一种药物效果更好
例如说人群的静态行为时间
是不是与血糖的水平存在关联
那么对于这样一系列问题
我们可以通过统计学的方法来评判
关联和差异是否真的存在
通常我们观测到的
是由于偶然因素所导致的差异
所以当观测差异或关联
大于随机产生的差异或关联时
统计学家称之为具有统计学意义
对此进行衡量的一个广泛应用的
统计指标是P值
所以P值它的含义是指
从H0规定的总体中间随机抽样
抽得等于及大于
或或者是和等于及小于
现有样本获得的检验统计量的概率
那么图1是P值的一个示例
图中倒扣的钟形曲线代表了
在特定的分布下
无效假设成立时
各种可能结果出现的概率
α也就是图中深灰和浅灰
所夹的这个三角形的面积
是我们在假设检验中间所规定的检验水准
实际上它规定了
所允许犯的第一类错误的概率
α的取值可以基于研究目的来进行设定
那么我们通常会取0.05
图中深灰的部分
就是我们所讲的P值
这个是我们基于样本数据所得到的
在假设检验中间
我们通常是通过P值与α值的比较
来进行结论的
那么我们通过一个实例
来给大家介绍P值的含义
某医生测量了
36名从事铅作业工人的
血红蛋白含量
算得其均数为130.83克每升
标准差为25.74克每升
问从事铅作业工人的血红蛋白含量
是否不同于正常成年男性的
平均值140克每升
那么在本例中间
我们已知正常成年男性的
血红蛋白含量为140克每升
这是一个已知的总体均数
我们记为μ0
我们还知道
由36名从事铅作业男性工人
他们的这个血红蛋白含量的均数
为130.83克每升
这是一个样本均数
我们记为X把
它所对应的总体均数
为μ是未知的
那么在这个例题中间造成这个X把
不等于μ0的原因可能有两个方面
第一个方面就是有可能铅作业
对男性的血红蛋白含量没有影响
从事铅作业工人的
血红蛋白含量的总体均数
与正常成年男性是一样的
他们来自于同一个总体
也就是μ等于μ0等于140克每升
那么造成此处X把不等于μ0的原因
仅仅只是因为有抽样误差
那么第二个方面可能是铅作业
确实会影响到成年男性的血红蛋白含量
也就是说铅作业工人的血红蛋白含量
总体均数不等于
正常成年男性的140克每升
这两者来自于不同的总体
也就是说存在本质差异
由抽样误差和本质差异
共同造成了X把不等于μ0
那么咱们假设检验的目的
就是判断差别是由上述的哪种情况所造成的
通常其实我们去进行μ是否不等于μ0的
这样的一个验证是比较困难的
因此我们可以采用
小概率反证法的思想
从这个问题的对立面
也就是我们假定μ是等于μ0的
也就是男性铅作业工人的血红蛋白含量
总体均数等于140克每升
由此来进行推导
来看看到底这样的一种差异
是因为总体不同
加上抽样误差所造成的
还是仅仅只是由于抽样误差所造成的
那么假设检验的过程
包括三个基本步骤
第一步是建立检验假设
确定检验水准
通常有两类假设
第一类我们称为无效假设
也称为零假设
我们记为H0
H0的表述通常是
这两者之间没有本质差异
也就是差异仅仅只是由于
抽样误差所造成的
那么另外一种假设
我们称为备择假设
也称为对立假设
记为H1
H1的表述通常是差异
因为有本质差异
再加上抽样误差所造成
因此就本例来说
我们的H0是μ等于μ0等于140克每升
也就是铅作业男性工人的
平均血红蛋白含量
与正常成年男性的均数相等
H1为μ不等于μ0
也就是铅作业男性工人的
平均血红蛋白含量
与正常成年男性的均数不相等
检验水准α定为0.05
也就是我们认为P小于等于0.05的
随机事件为小概率事件
那么在这个例子中间
我们的已知条件写到第一行
基于这样的一些已知条件
我们可以去计算检验统计量
检验统计量的选择
应当基于我们的研究目的
数据的资料类型
研究的设计等
进行综合考虑
那么基于我们现有的条件
我们可以考虑来计算t值
并且需要提醒大家注意的是
所有的检验统计量
都是在H0成立的前提下
计算出来的
因此本例t等于X把减去μ
除上标准误也就是S比上根号n
那么因为在H0中间
我们假定μ等于μ0等于140克每升
因此此处我们可以用μ0来替代μ
因为μ是未知的
但是μ0是已知的
因此我们可以算得t值为-2.138
相应的自由度为n减1是35
那么就这个t值的计算
我们可以来看
如果X把距离μ0不远的话
那么我们会考虑多半这个差异
是因为抽样误差所造成的
也就是我们没有足够的理由拒绝H0
但是如果X把距离μ0很远
也就是说如果我们得到的t值
绝对值很大的话
那么我们就要怀疑了
也许这两者之间不仅仅是抽样误差
可能还存在着本质的差异
那么到底这个t的绝对值要到多大
我们才认为是具有统计学意义呢
我们就得借助于这个P值来下结论
P值的含义是指从H0规定的
总体中间进行随机抽样
抽得等于及大于
或或者是和等于及小于
现有样本获得的检验统计量值的一个概率
例一的P值
我们可以用图2来加以说明
在这个图中间
其实我们把之前的μ等于μ0
等于140克每升的这样一个总体
把它转化为ν等于35的这样的一个t分布
那么P值是在μ等于μ0
等于140克每升的前提下进行随机抽样
那么得到的这个t值小于及等于-2.138
和大于及等于正的2.138的概率
如果说我们的P小于等于α
按所取的检验水准α
我们拒绝H0接受H1下有差别的结论
其统计学依据在于在H0成立的条件下
得到现有检验结果的概率
小于或等于α
是小概率事件
因为小概率事件
不可能在一次的试验中间发生
所以我们拒绝H0
本例ν等于35
t的绝对值为2.138
由此我们去查t界值表
得到相应的双尾概率
为P值大于0.02小于0.05
按照α等于0.05的水准
拒绝H0接受H1差异有统计学意义
结合本题我们可以认为
从事铅作业的男性工人
平均血红蛋白含量
低于正常成年男性
假设检验是我们统计推断的
重要内容之一
也被广泛的应用
那么这中间也存在着大量的
对于P值的误解和误用
为此在2016年美国统计协会
专门发布了一个关于P值的声明
那么在此我们把中间的要点节选如下
第一点P值能够提示样本数据
在多大程度上背离指定的无效假设
P值越小提示样本数据
与无效假设背离的程度就越大
在我们前面的这个例子中间
P值为在μ等于μ0等于140克每升的
总体中间进行随机抽样
获得我们的现有样本
也就是均数为130.83克每升
甚至比这样的一个取值
更远离140克每升的概率
第二P值不能够说明
无效假设成立的概率
P值仅仅是关于样本数据
与对其进行解释的
无效假设之间关系的一个概述
第三科研的结论或者是决策
不应该仅仅是基于P值
与假设检验水准的比较
如果有可能
我们应该在研究的报告中间
提供相应的更多科研过程的信息
例如说数据的收集和质量的控制等等
第四正确的推论需要全面而透明的报告
在某些期刊的报告中间
我们经常会看到
对于统计分析结果
仅仅报告具有统计学意义的那一部分
这样的报告是不妥的
例如本例中间研究患者
自付比例的相关因素
研究者对此进行了一个多元的统计分析
那么在结果的报告中间略去了
没有统计学意义的这个性别变量
这样的报告是不妥的
第五P值无法提供效应的大小
或者提示某结果的重要性
在本例中间P值越小
我们就越有理由认为
男性铅作业工人的血红蛋白含量均数
与正常成年男性的
总体均数140克每升有差别
而不是P值越小
那么从事铅作业的男性工人的
血红蛋白含量总体均数
与正常成年男性的
总体均数140克每升相差越远
这样的论述是错误的
第六仅就P值的自身而言
并不是一个关于模型
或者是假设证据的好的测量
我们抛开其他信息的P值
只能够提供有限的信息
好 那这一讲就到这
谢谢大家
-1.1医学科研的基本程序
--1.1医学科研的基本程序 习题
-1.2实验动物基本知识
--1.2 实验动物基本知识 习题
-1.3科研道德与诚信教育
--1.3 科研道德与诚信教育 习题
-1.4人体实验的伦理原则
--1.4 人体实验的伦理原则 习题
-1.5动物实验的伦理学原则
--1.5 动物实验的伦理学原则 习题
-1.6医学科研项目的选题
--1.6 医学科研项目的选题 习题
-2.1假说的作用与特点
--2.1 假说的作用与特点 习题
-2.2形成假说的思维方式
--2.2形成假说的思维方式 习题
-3.1医学科研的基本要素-被试因素
--3.1医学科研的基本要素-被试因素 习题
-3.2医学科研的基本要素-研究对象
--3.2 医学科研的基本要素-研究对象 习题
-3.3医学科研的基本要素-实验效应
--3.3 医学科研的基本要素-实验效应 习题
-4.1医学科研统计学设计的目的与基本策略
--4.1 医学科研统计学设计的目的与基本策略 习题
-4.2对照原则-对照的意义与形式
--第四章 医学科研设计的统计学原则--4.2 测试
-4.3对照原则-对照的设置与常见错误
--4.3 对照原则—对照的设置与常见错误 习题
-4.4随机、重复、均衡及盲法原则概述
--4.4 随机、重复、均衡及盲法原则概述 习题
-4.5随机原则
--4.5 随机原则
--4.5 随机原则 习题
-4.6重复原则
--4.6 重复原则
--4.6 重复原则 习题
-4.7均衡原则
--4.7 均衡原则
--4.7 均衡原则 习题
-4.8盲法原则
--4.8 盲法原则
--4.8 盲法原则 习题
-4.9科研数据中离群值的识别与处理
--4.9 科研数据中离群值的识别与处理 习题
-4.10科研过程中对P值的正确理解
--4.10 科研过程中对P值的正确理解 习题
-4.11常见的随机化设计
--4.11 常见的随机化设计 习题
-4.12配对、配伍和交叉设计
--4.12 配对、配伍和交叉设计 习题
-5.1实验误差及控制
--5.1 实验误差及控制 习题
-5.2有效数及其处理
--5.2 有效数及其处理 习题
-6.1医学形态学研究的基本思路概述
--6.1 医学形态学研究的基本思路概述 习题
-6.2常用生物组织的固定剂
--6.2 常用生物组织的固定剂 习题
-6.3免疫组织化学染色结果评价与非特异染色的控制
--6.3 免疫组织化学染色结果评价与非特异染色的控制 习题
-7.1基因文库及其应用
--7.1 基因文库及其应用 习题
-7.2组学的研究意义
--7.2 组学的研究意义 习题
-7.3蛋白功能研究的基本策略
--7.3 蛋白功能研究的基本策略 习题
-7.4蛋白相互作用的研究方法
--7.4 蛋白相互作用的研究方法 习题
-7.5基因转录调控研究的基本策略
--7.5 基因转录调控研究的基本策略 习题
-7.6分子生物学实验微量操作技巧
--7.6 分子生物学实验微量操作技巧 习题
-8.1细胞增殖的研究方法
--8.1 细胞增殖的研究方法 习题
-8.2细胞凋亡的研究方法
--8.2 细胞凋亡的研究方法 习题
-8.3免疫应答简介
--8.3 免疫应答简介 习题
-8.4免疫细胞分离技术
--8.4 免疫细胞分离技术 习题
-8.5免疫细胞功能检测技术
--8.5 免疫细胞功能检测技术 习题
-8.6细胞因子检测技术
--8.6 细胞因子检测技术 习题
-8.7抗肿瘤研究的基本策略-1
--8.7 抗肿瘤研究的基本策略-1 习题
-8.8抗肿瘤研究的基本策略-2
--8.8 抗肿瘤研究的基本策略-2 习题
-8.9抗肿瘤研究的基本策略-3
--8.9 抗肿瘤研究的基本策略-3 习题
-8.10抗肿瘤研究的基本策略-4
--8.10 抗肿瘤研究的基本策略-4 习题
-9.1动物实验的一般原则
--9.1 动物实验的一般原则 习题
-9.2动物行为学观察研究的一般原则
--9.2 动物行为学观察研究的一般原则 习题
-9.3实验动物学习记忆观察
--9.3 实验动物学习记忆观察 习题
-10.1功能型研究的基本思路概述
--10.1 功能型研究的基本思路概述 习题
-10.2 在体实验与体外实验的结合
--10.2 在体实验与体外实验的结合 习题
-10.3 量效关系和时效关系相结合
--10.3 量效关系和时效关系相结合 习题
-10.4 增加和减少验证相结合
--10.4 增加和减少验证相结合 习题
-10.5 配体-受体顺向与逆向研究
--10.5 配体-受体顺向与逆向研究 习题
-10.6 细胞水平功能研究的基本技术路线
--10.6 细胞水平功能研究的基本技术路线 习题
-11.1实验结果的专业判定1——实验结果可靠吗
--11.1 实验结果的专业判定1——实验结果可靠吗 习题
-11.2实验结果的专业判定2——实验结果可靠吗
--11.2 实验结果的专业判定2——实验结果可靠吗 习题
-11.3实验结果的专业判定3——实验结果可靠吗
--11.3 实验结果的专业判定3——实验结果可靠吗 习题
-11.4实验结果的专业分析1——实验结果的解释与结论
--11.4 实验结果的专业分析1——实验结果的解释与结论 习题
-11.5实验结果的专业分析2——实验结果的解释与结论
--11.5 实验结果的专业分析2——实验结果的解释与结论 习题