当前课程知识点:护理研究方法 > 第三章 研究方案的设计 > 3-17病例对照研究的资料分析 > Video
各位同学大家好我是李楠
来自北京大学第三医院临床流行病学研究中心
那这次课呢我们继续讲
病例对照研究的一些基础细节
那之前我们讲了病例对照研究的基本概念
以及如何在一个研究里面
去拆解病例对照研究的要素
如何选择病例 如何选择对照
如何定义我们的干预 暴露
就是其实在病例对照研究里应该叫暴露了
如何定义我们的暴露和结局指标
那我们定义好了这些之后
在完成了病例对照研究之后那就涉及了什么
资料的使用和基于我们的数据去推断结果
那这个病例对照研究怎么推断结果呢
病例对照研究我们看它的模式图
并不像队列研究这么好容易分析为什么呢
因为队列研究是从最开始的
暴露组和非暴露组持续观察
来知道暴露组的结局发生率
和非暴露组的结局发生率
从而直接的去看结局发生风险改变了多少
但是病例对照研究我们是从病例和非病例入手
去回溯他们各自有多少人暴露于某种状态
所以我们找不到初始的这群暴露和非暴露的人
也不知道初始的暴露和非暴露
到底有多少会发生结局
这个时候我们在病例对照研究
就需要考虑使用其他的指标
来评价暴露的这个暴露因素
可能会对结局的发生带来多大的影响
那这个指标是什么呢
就是我们说的Odds Ratio
也就是OR值或者是比值比
Odds Ratio这个值是怎么来的呢
Odds Ratio我们先看其中的Odds
Odds首先它是来源于我们英国的一个传统文化
什么啊 就是赛马
咱们知道英国的绅士们
经常会参加的一个活动就是赛马
简单来说就是一些高端的赌博
那在赛马的过程中
我们经常会去买哪匹马赢多少哪匹马输多少
通过每匹马的赢面和输面去进行下注
这个时候我们怎么去看一匹马的好坏呢
比如现在我们在赛马过程中有三匹马
abc三匹马
a马呢在过去的它自己跑到十场比赛中
赢了两场输了八场
b马也参加了十场比赛
当然和a马的十场可能不是同样的十场
它赢了三场输了七场 c马赢了一场输了九场
那这三匹马
我们是不是都能得到它的一个参数什么参数啊
就是这匹马在过去它跑的所有比赛中
赢的概率除以输的概率是多少
赢面和输面之比那这个比就称为Odds
所以a马是多少呢
a马的Odds是2比8 b马是3比7 c马是1比9
所以我们说当Odds等于1的时候意味着什么
意味它的赢输风险相当
Odds大于1的时候意味着它偏向于赢
Odds小于1的时候它可能更容易去输对吧
那通过Odds值就能判断每一匹马的赢面和输面
好了那这就是每一匹马的Odds值
我们看看刚才的Odds值
如果我们abc3匹马从来都没在一个赛场去跑
我们说我们让这三匹马去赛跑谁的赢面更大呢
大家可能会说了当然是b的赢面更大了 为什么
因为它Odds值更大那b的赢面大多少呢
最简单的一个做法
是不是就是把b的赢输面之比
除以其它马的赢输面之比就是b的赢的概率
和其它的马相比我是多多少
是这样的一个水平
那所以基于这样的一个理念
就可以提出来一个Odds Ratio的概念
那我们这里看
每匹马我过去跑的十场就相当于什么
就相当于我一堆病例过去到底有多少人暴露
一堆非病例过去有多少人暴露
那他们这种暴露和非暴露
可能在病例和非病例组来自于不同的人群
但是我们可以去看什么
可以去看他的暴露比
那在刚才这样的四格表我们看
四格表里面E代表什么呢
E代表Expose也就是暴露
D代表什么呢 代表Disease
就是我的结局事件是否发生了疾病
如果是队列研究的话
我们知道E和下面的这个非E
它们各自的发生率是多少
但是病例对照研究不知道
病例对照研究我们是从D出发的
那我们可以去看什么
可以去看疾病组就是D这一列的
暴露和非暴露去比对吧
那所以OddsD等于什么呢
等于a比c
那Odds非D就是他不是疾病的时候
他的这个Odds是什么东西呢
就是也是暴露比非暴露就是就b比d
这个时候它就能得到一个Odds ratio
这个Odds ratio是什么呢
就是得病的人相对于没得病的人
我暴露的风险是你的多少倍
就是a除以c比b除以d
那它换算过来就是ad比bc对吧
就是对角线相乘再相除
这就是它的Odds ratio
那大家一定会去想
我知道病例和非病例的暴露比值比
这个比值比有什么用呢
它对我有什么指导意义呢
好了我们抛开刚才这个病例对照研究的四格表
假定刚才这个四格表是发生在队列研究里面
我们会得到什么东西呢
如果它是发生在队列研究里面
我就可以去算E Expose这一组
暴露组的a除以a加b对吧
如果是队列研究的话我们知道暴露
它到底a加b里面有多少人发生了结局事件a
那它的结局事件发生率是多少a除以a加b
非暴露c除以c加d
那我有这两个之后我在队列研究里面
我是不是能算它的RR值啊
就是这两个发生率之比
那这个RR值我们可以把它的公式展开
之后变成ac加ad除以ac加bc
然后我们是不是可以把分子和分母
各自提取出来一个因子
分子提出一个ad分母提出一个bc
然后剩下的在括号里的一部分
我们就会发现RR和OR建立了关联了
关联在哪呢
我们提出来的ad比bc是不是就OR值啊
所以RR等于OR乘以后面这一大堆东西
大家看分子上的c除d分母上的a除b
这里面是不是当a越趋近于0当且c越趋近于0
或者是b和d趋近于无穷大的时候
那这个时候其实我的RR值
几乎就等于ad除bc了
因为很简单括号里面的c除d是加了1
a除b也是加了1
那当c除d趋近于0 a除b趋近于0的时候
那这个时候我的RR几乎就是等于OR的
那大家想想什么情况下
ac趋近于0 bd趋近于无穷大
什么情况
其实就是当我们的疾病
在人群中在我们的队列中
是一个罕见事件的时候
那实际上这个时候
我们的OR值是无限趋近于RR值的
所以我们病例对照研究的OR怎么理解呢
可以这么理解
当我们关注的这个疾病是一个罕见疾病的时候
我们的OR值可以近似的等于它的
暴露之后的风险增加的倍数
近似的等同于RR值
这就是病例对照研究中OR的意义
那我们看一个例子那这例子是什么呢
比如说我们做了一个队列研究
我们要探讨什么呢
探讨难治性抑郁的患者和抑郁的患者相比
他的自杀风险是不是更高
我们怎么办呢
我们随访了100个难治性抑郁患者
和100个普通抑郁的患者
然后看什么
随访了一段时间之后比如说一年
难治性抑郁的患者里面100个人25个人自杀了
抑郁的患者里面有15个人自杀了
那我们在这200个患者里面
发现了有40个人自杀我们可以去计算
它各自的这个难治性抑郁
和抑郁这两组人的自杀风险比
我们可能算出来RR等于多少呢1.67
那这个时候我们是不是
也能把它的OR算出来啊
当然这个时候我们算OR没有意义对不对
因为我们能直接算出RR
没关系我们先算出来看看它的OR是多少呢
OR是1.89
我们发现我们想把OR用来推断RR
但实际上它并不相等
那我们这个时候当然是看RR
那好了我们把这个队列研究改成什么
改成病例对照研究 怎么办
如果我们最开始
没有建立一个难治性抑郁和抑郁的队列
我们可能会怎么样
我们可能会想从自杀和存活的人入手
那比如说我们要建立队列的时候
我们可能做200人才能发现
这样的一个潜在的因果关联
但我不想做这么多人怎么办
我们只抓自杀的人抓了多少抓了40个人
然后怎么办呢再去找对照
找了40个不管他是什么类型抑郁的患者
他观察了一年还没有自杀的人
40对40那这时候我们总的样本量
是不就从200人下降到80人
那这个时候我问大家我们还能算出RR值吗
大家可以除一除试试显然算不出来为什么
因为这个时候自杀和存活
已经不是一个真实比例了
那难治性抑郁和抑郁这两类人
也不是来自于真实的
过去的一个暴露的总体了算不出RR值
那这个时候是什么呢
病例对照研究我们能算什么呀
我们能算OR值对吧
我们看看它的OR值是多少
ad除bc OR是1.84
所以我们看不管是做队列研究
还是做病例对照研究
不管我们自杀和存活是按什么比例去收集
我们实际上都能算出OR这个指标
而且OR这个指标相对比较稳定
刚才是多少1.86 现在是1.84
所以病例对照研究就给我们短平快的
去得到一个效应大小去提供一种可能性
我们再看一个例子
比如说ACE基因的这种多态性
位点的DD型基因可能和肺血栓的栓塞相关
那我去看什么我们做了一个病例对照研究
找了一些栓塞的人和没栓塞的人去看什么
看他这种基因型是不有表达的区别
我们可能能算出一个OR是2.51
就能回答我们的临床问题了
那RR和OR在用起来有什么区别呢
我们来看看
RR和OR首先我们说
它都是一个关联强度的一个评价指标
我们说RR和OR当它趋近于1的时候意味着什么
意味着你暴露和不暴露这种风险
暴露和不暴露这种因素
结局发生的风险是差不多的
就是暴露组的发病率比非暴露组的发病率是1
OR我是用来推断RR的
那接近1的时候差不多也是1就完全没有意义
那所以当RR和OR在1时候是没有什么价值的
如果RR和OR大于1意味着什么
意味着你暴露于这个因素
有可能会增高你结局事件的发生风险
小于1的时候就是与之相反
降低了这种风险那大家看到的这样的一种关联
联系的关联强度的推断只是一个经验推断
我们通常认为1到1.2之间的
是近似于这种无价值的当然这个也分情况
因为很多现在发现的关联都是这种弱关联
1.2到1.5的呢是偏弱的关联
1.5以上的是中等强度的关联
3以上的强关联大于10的是极强的关联
那它取个倒数就是它的这种负联系的时候
有暴露因素反而结局事件发生风险
低的时候的一个判断标准
RR和OR有什么关系呢
我们再来看看刚才我们推断的时候
假定是一个队列研究能算RR值
我们的RR和OR可以建立这样一个关系
所以RR推断到最后就是
OR乘以c除以d加1和a除以b加1的比值
大家能看到当a和c很大
a和c趋近于0 b和d很大的时候
OR和RR是相当的
当率的水平很低的时候OR近似于RR值
这个是我们能认可的
那但是我们反过来想一想呢
如果a和c没趋近于0 b和d没有那么大
也就是在我们观察的这个情况下
如果患者暴露于某种特征
他的发病率还蛮高的
这个时候OR是往大的方向走
还是往小的方向走呢
当我们仔细的去代到这个公式里去看
我们能够发现这样的一个规律什么呢
就是其实无论这个OR怎么样
它其实永远是在夸大效应的怎么来理解
当我们的真实的RR是大于1的时候
我们回到公式里去看
OR会比真实的RR更远离1
就是它会比我们的RR更大而且离1的距离更远
那同样当我们的RR是小于1的时候
也就是暴露因素不容易发生结局
OR也会比RR更小 所以我们知道
OR在我们的疾病发生率不是足够低的时候
它实际上是对RR值的一个更夸张的估计
它会夸大我们的效应大家知道这个关系就好了
OR和RR应用范围如何呢
RR是两个率之比能够直接的给我们指示
这个暴露对疾病发生风险的影响有多大
但是RR的应用范围比较窄
它只能应用于队列研究的情况
而OR呢的不管你是队列研究
还是病例对照研究我都可以去算出来
OR是什么呢是两个Odds之比
所以不但适用于可计算RR的情况
也可以适用于病例对照研究
但同样需要注意的是
在多因素分析里面我们往往只能得到OR值
所以OR还可以用于什么呢
用于调整了其他混杂因素之后
计算我们的暴露因素的效应有多大
所以OR用的范围是比较宽的
那病例对照研究里面
我们往往也会通过ad比bc
来去计算它OR大小
那当然这个OR的大小
我们也可以去做假设检验
就是我们可以去算它的卡方值
我们通过卡方值还能推断出来
OR的95%可行区间
那可能有的同学会说了
说每次我计算个OR
要计算它95%可行区间
还得套复杂的公式才能推断
那这个过程是不是太繁琐了呢
别着急我们其实有一些简单的软件
可以帮助我们迅速的得到
OR和95%可行区间的计算那是什么呢
就是我们即将要说到的
Epicalc2000这样一个软件
那我们看在这个软件里面呢
菜单里面Tables有一个2乘2的
非分层的这样的一个表格的绘制
在这个表格的绘制过程中
当我们把我们四格表输进去的时候
你看左边是Exposure有和没有
上面是Outcome有和没有
然后我们把四格表输进去
点确定它自动的就会给我们什么
给我们OR的点估计
比如在这个例子里面OR是1.49
和它的区间估计1.34到1.65
这就是它的95%可行区间
那同样回到我刚才的例子
它经过多因素分析也是给出了OR值
好 这就是今天的内容 谢谢大家
-1-1研究问题的来源:从实践中发现问题
--Video
-1-2研究问题的来源:从文献中获取选题灵感
--Video
-1-3研究问题的来源:从交叉学科找切入点
--Video
-1-4如何由临床问题演变为研究问题
--Video
-1-5研究问题的陈述:立项依据
--Video
-1-6研究问题的陈述:研究目标
--Video
-1-7研究问题的评价
--Video
-第一章 讨论
--第一章 讨论
-2-1文献检索及检索策略概述
--Video
-2-2分析检索目的、选择数据库
--Video
-2-3分析检索词和检索表达式
--Video
-2-4检索策略的调整
--Video
-2-5 文献整理与摘录
--Video
-第二章章节测试--作业
-3-1设计研究方案前应做哪些准备
--Video
-3-2理论框架在研究方案设计中的作用
--Video
-3-3干预性研究:综述
--Video
-3-4干预性研究:研究对象的选择
--Video
-3-5干预性研究:分组与对照
--Video
-3-6干预性研究:样本量的估算
--Video
-3-7干预性研究:干预措施
--Video
-3-8干预性研究:结局指标选择
--Video
-3-9干预性研究:盲法
--Video
-3-10描述性研究的设计1
--Video
-3-11描述性研究的设计2
--Video
-3-12从PICO入手解析临床研究问题
--Video
-3-13队列研究的定义和分析方法
--Video
-3-14队列研究的应用
--Video
-3-15病例对照研究的基本概念
--Video
-3-16病例对照研究的设计要点的PICO解析
--Video
-3-17病例对照研究的资料分析
--Video
-3-18病例对照研究的适用范围、特点和设计原则
--Video
-第三章章节测试--作业
-4-1构思资料收集方案的框架
--Video
-4-2公认量表的使用
--Video
-4-3国外量表的汉化过程
--Video
-4-4国外量表的信效度检测-1
--Video
-4-5国外量表的信效度检测-2
--Video
-4-6国外量表的信效度检测-3
--Video
-4-7自设问卷的技巧
--Video
-4-8自设问卷常见问题
--Video
-第四章章节测试--作业
-5-1如何撰写研究计划书
--Video
-5-2研究计划书中立项依据的撰写
--Video
-5-3研究计划书中文献综述的撰写
--Video
-5-4研究计划书中研究内容和方案的撰写
--Video
-5-5书写研究计划书的注意事项
--Video
-第五章章节测试--作业
-6-1论文写作:文题
--Video
-6-2论文写作:前言
--Video
-6-3论文写作:研究对象
--Video
-6-4论文写作:研究方法
--Video
-6-5论文写作:结果
--Video
-6-6论文写作:讨论
--Video
-6-7论文写作:讨论中常见问题
--Video
-6-8论文写作:参考文献的引用
--Video
-6-9论文写作:可读性问题
--Video
-章节测试--作业