当前课程知识点:医学统计学(高级篇) > 第十六章 生存分析 > 第四节 Cox比例风险回归模型 > Video
同学们好
我是中南大学湘雅公共卫生学院
王乐三老师
今天我们一起来学习
Cox比例风险回归模型
通过前面的内容我们知道生成分析资料
它具有下面一些特点
第一个
它是同时考虑生存时间和生存的结局
第二个通常含有删失数据
第三点
就是生存时间的分布
通常是不服从正态分布
所以我们一般不能用时间
来做多元线性回归或结局来做
logistic这个回归
我们对于生存时间和生存结局
它的影响因素研究
我们前面给大家介绍了
Kaplan-Meier法与寿命表法
这个的话我们是根据单一的变量进行分组
所以它是属于单因素的生存分析方法
我们有时候要考虑众多因素
对这么一个生存时间
和生存结局的影响
我们就会要应用到多因素的生存分析方法
多因素的生成分析方法
我们有参数法和半参数法
所谓参数法的话
我们也需要以特定的分布
以特定的分布
比如说是满足这么一个Weibull分布
或者指数分布为基础
来建立这么一个回归模型
应用的话具有它的一定的局限性
另外一类的话就是我们是半参数的方法
半参数的方法
今天我们学习的Cox比例风险回归模型
属于半参数的方法
它应用的比较广泛
Cox比例风险回归模型的基本形式
就是我们讲的这么一个形式
在这个形式里面的话
我们可以看到这是表示的是一个风险函数
这个风险函数的话
是表示具有某危险因素这么一个危险因素
这个危险因素可能是一个可能是多个
它们这么一个个体
在T时刻的死亡的风险率
当然死亡风险率在我们医学中间
可以把它叫做是一个危险度
这是它的这么一个
一个计算的一个公式
可以把它看成是一个损失的死亡率
这一个内容的话
H0T我们表示
是某危险因素X等于0的时候
在TI时刻的基础
TI时刻的一个基础风险的一个死亡率
这个的话我们可以说是未知可以未知
它假设与这样一个成比例
X这类的话就是我们感兴趣的
是可能影响生存时间的
有关变量也称协变量
它的话不随时间变化而进行一个变化
这里的贝塔
我们讲就是一个为Cox模型的
一个回归系数
这是我们一组待估的一个
回归的一个参数
由于在这个里面
我们这里它有一个我们要估计的参数
我们对于基础的奉献率
我们可以不管它是一个什么样的形式
所以它具有一个
这么一个半参数的一个特点
通过我们刚才介绍这个形式
我们可以看到这个模型的
另外一种表达的形式
我们很容易可以得到这么一种
这个形式也是代表的是一个
Cox的一个回归的一个
比例分析的一个回归模型
或者我们两边取这么一个自然对数
我们可以得到这么一个
这都是我们表达的一种形式
这个我们可以看得到
这就是我们刚才给大家介绍的
这是属于参数的部分
而这个地方的话我们并不关心它
那我们属于这是一个半参数的一个模型
通过这样一个内容的话
我们可以来进行一个考虑
假设我们这么一个
在其它变量都控制相同的情况下面
我们只考虑一个变量
这个变量的话
它这么一个取两种状态
两种状态
这两状态一种状态我们假设是暴露
另外一种状态是没有暴露
这两组这么一个个体
这两种一个个体的话
我们通过这么一个比值这个比值
这个比值的话我们很容易就可以得到
这个式子
我们在其它变量都相同的情况下面
我们只考虑其中的一个变量
这个变量的话它有两个状态
两个状态
一种状态我们用暴露用一来代表
另外一个状态是没有暴露
我们用这么一个零来给它一个代表
那我们可以得到它的两个风险的函数之比
这个风险的函数之比
最后我们可以发觉
它就等于这么一个E的贝塔次方
E的贝塔次方的话
就是我们讲这两个的风险函数之比
我们又把它叫做是一个风险比
这个风险比的话
在我们医学上面
我们就把它叫做是危险度之比
所以这就是我们建立了
这么一个相对危险度
跟我们的这么一个回归系数之间的一个关系
一个关系
所以它在医学中间得到了一个
广泛的一个应用
我们就很容易可以看得到
回归系数贝塔在医学中的一个意义
这么一个意义
这么一个意义我们刚才可以看得到了
如果贝塔等于0
RR就等于1
表示某个因素与死亡风险无关
贝塔大于零
RR就大于1
表示某因素是死亡的危险因素
贝塔小于零
RR就会小于1
表示某因素是死亡的一个保护因素
保护的因素
当然在这里
我们这个危险的因素有我们用一来代表
五是用零来进行赋值
第二个我们就是
Cox这个模型的参数估计与假设检验
我们就做一个了解做一个了解
这个就是属于在
我们叫做借助一个偏似函数
采用最大似然估计来获得
Cox回归模型参数的一个估计值
这么一个比一个比
同样的我们可以
类似于logistic一个回归一样
采用的这么一个回归系数
一个假设检验的方法
我们也有这么一些这么一个检验的一个方法
我们来看一个实例
来对我们刚才讲的这么一个
Cox回归模型有一个实际的一个了解
假设我们是为了探讨胃癌患者的预后
对是否实行手术治疗
手术治疗如果采用手术治疗
我们就用一来进行一个赋值
没有我们用0
和是否接受放射治疗
放射治疗的话采用放射治疗
我们用一没有采用放射治疗
我们用零来这么一个赋值
它的一个效果进行分析
Cox的模型我们如果已经计算了
这个模型已经给出来了
模型已经给出来
这就是它的这么一个风险
一个风险函数
通过这个内容
我们可以得到哪些
医学上的一个专业的知识
我们来看一下
控制其它因素后
在这里我们就是说
我们如果控制了这么一个放射因素
做手术与不做手术者相比
它死亡风险的一个相对的危险度
相对的危险度
这个是代表我们是X1等于1
代表进行手术
但是X2等于0
不进行这么一个放射治疗
这个就代表不进行放射治疗
也不进行这么一个手术
这两个个体的它的这么一个
死亡的一个风险比
死亡的风险比
我们可以看得到死亡的风险比
死亡的风险比我们通过前面的风险函数
我们可以得到这是这两个值
它的比值在这里
我们可以得到它的这么一个相对危险度
等于0.697
这个意味着什么内容呢
这就意味着做手术者的死亡风险
是不做手术者的69.7%
也就是说做手术它的死亡的风险要小一点
或者换换句话说这么一个不做手术的
是做手术的
它的死亡风险的多少
就是用1再除以0.697
是这么的它的一个倍数
它的一个倍数
所以我们在这里如果可以看一下
在这里的话
这么一个b1的含义
我们可以在流行病学的含义
那就是说在其它协变量不变的情况下面
协变量XJ每改变一个测量单位
所引起的相对危险度的自然对数的改变量
同理我们可以对进行放射治疗
放射治疗和没进行这么一个放射治疗相比
这么一个死亡的这么一个风险
是它的0.716倍
当然是在控制的这么一个
手术这么一个辩论之后
所以我们现在再来进一步的来理解一下
假设这样一个人
这个人我们知道是即进行这么一个手术
又进行这么一个放射治疗和另外一个病人
这个病人的话既不进行这么一个犯罪治疗
也不进行手术相比
它们的这么一个风险比的话
我们可以看到这个内容
这个内容的话
最后我们可以计算出来
RR值它是等于0.5
它是近似于等于这两个值的一个乘积
一种乘积
也就是说两个方法都治疗的
既手术治疗及犯罪治疗
它的死亡风险是
这个不治疗就是即不进行放疗
也不进行这么一个手术治疗
它的这么一个这个病人的
这么一个死亡的风险是它的50%
也就是说手术治疗和放射治疗结合在一起
它的这么一个风险性会降低更多
所以这是我们对这么一个Cox回归
它的回归系数的一个含义理解
当然这里我们可以看得到
这实际上是一个乘法的模型
因为它是一个指数的形式
所以这里的相对危险度
它是一个乘法的模型
同样我们可以再进一步的对
我们的回归系数进行一个参数的估计
进行一个百分之
进行一个一阶阿尔法的可信区间的估计
这是可信区间估计的这么一个公式
当然我们这个Cox回归
我们就是这个可以用的一些
一些的方法
这么一个方法的话
我们可以用前进法后退法逐步回归法
我们这个相对比较熟悉的
这是我们讲的因素的这么一个筛选
一个筛选
当然如果只有一个变量
我们觉得Cox模型的一个单边的分析
我们前面讲的这么一个
log-rank检验
这个是结论是一致的
它的这么一个应用
应用的话
我想主要是一个是我们临床上面筛选
对我们死亡风险预后的一些危险因素
估计这么一个危险因素
得到这么一个相对危险度和可信区间
第二个我们就是说
进行一个矫正的混杂因素
第三个的话
我们可以计算一个预后的指数
因为我们知道它的指数的线性部分越大
它的风险就越大
风险越大
所以我们可以计算它的一个预后的指数
为了比较我们可以
对原来的变量进行标准化之后
我们可以的标准化的这么一个
标准化的一个愈合指数
标准化的预后指数如果等于0
表示个体的危险度就为平均水平
标准化的这么一个预后指数大于零
表示个体危险度大于平均水平
当然如果小于零
就表示个体危险度小于平均水平
我们来看一个应用的实例
例题的17-4为探讨某恶性肿瘤的预后
某研究者收集了63例患者的生存时间
生存结局及影响因素
影响因素包括病人的年龄
性别
组织学类型治疗方式
淋巴结转移
肿瘤的清润的程度
生存的时间这里以月进行计算
这个变量的赋值和所收集的资料
分别见表17-5和表17-6
这是我们的这么一个模型
这么一个对这个变量的一个赋值
我们可以看到这里有年龄有性别
组织学的类型有低分化高分化
高分化
我们用1来进行一个赋值
治疗的方法有传统疗法和新型疗法
有淋巴结转移否和是
肿瘤的亲热程度没有突破浆膜层
和突破浆膜层
突破浆膜层为1来进行代表
这是生存的时间
生存的时间
我们以月为单位
生存的结局
这个是填负
因为这么一个肿瘤死亡了我们用1
可能出现删失数据
我们用1来进行一个表达
所以这里我们有八个
八个变量
好
这是我们的这么一个数据
这个数据的话大家可以看的这个很清楚
我们对第一的这么一个表示
number one
number one的第一个
这个人是54岁是一个女性
她属于高分化
高分化采用的是一个新型的一个疗法
新型的疗法
它是有淋巴结转移的
它没有突破浆膜层
它的生存时间是生存了52个月
它是有删失数据
这是我们通过前面的复制表
把这个人它的
所具有的一些这么一个特征
我们就在这里
下面的我们一样的
可以进行的来进行一个理解
把这个数据的话
我们就把它用软件来进行计算
当然是以生存时间生成结局为因变量
X1到X6为协变量
进行多元的逐步的Cox回归模型分析
这里我们进入的变量以0.05阿尔法入
这个剔除的变量阿尔法出
以0.1作为一个水准
我们通过这个软件可以计算得到
回归的拟合模型就在这里
最后的话我们是两个变量
这两个变量话
我们可以看到它的这么一个
回归系数的估计值
X4和这么一个X5
我们通过这里可以得到它的这么一个
Cox的一个回归的模型
这个是我们可以相应的得到它的这么一个RR
它的一个估计值
总体的相对危险度的95%的可信区间
一样的可以把它计算出来
我们来看看它说明什么问题
从协变量X4
X4我们知道是治疗方法来看
其对应的相对危险度为0.1718
说明什么内容
说明新型疗法好于传统疗法
也就是说新型疗法的死亡风险
只是传统疗法的0.1718倍
或者是17.18%
或者说传统疗法的死亡风险
是新型疗法的5.8219倍
同样的我们可以看协变量X5
这个代表的是一个淋巴结是否转移
它对所对应的相对危险度为2.5379
说明有淋巴结转移的死亡风险
是没有淋巴结转移风险的2.5倍
我们这个结论就可以看
传统疗法和有淋巴结转移
是影响肿瘤生存的不利因素
当然我们Cox模型
回归模型应用的一个注意事项
我们这个要求的话样本例数不能太小了
样本例数的话按照经验的方法
要为变量个数的5到20倍
第二个的话生存资料的结尾数据
也不能够超过20%
要有一定发生结局的事件例数
第三个的话模型中
某X因素有统计学意思
可能是因果关系
也可能是这么一个伴随的关系
第四的话
我们是要求这个病人死亡的风险
不随时间变化而变化
要满足比例风险的这么一个要求
如果不满足这个要求的话
我们可以用参数的方法
或者我们进行一个分层的
分层的分析方法来进行
我们看看软件的这么一个实现的过程
我们首先建立这么一个数据文件
当然这个数据的文件它有9列63行
其中一个的话是为标识变量
一个就是我们讲的一个标识变量
这是我们的变量视图
我们对变量的这么一个特性
它的赋值在这里进行一个赋值说明
这里我们相应的对X4
X5在这里进行了一个赋值说明
然后我们这个过程进行一个操作
我们从分析下拉菜单找到生存分析
然后我们可以找到它的这么一个
Cox回归的模型
Cox回归
这是我们可以到找到Cox回归
Cox回归里面的话
我们这么一个相应的把时间的变量
把这个状态把它这个定义好
这是我们把这么一个状态把它定义好
然后我们在它的选项里面
相应的选择进入到阿拉法入和阿尔法出
这是我们95%的这么一个可信区间
这是它的这么一个结果
最后我们筛除了X4和X5
这两个变量
它相应的RR是这两个值
我们这两个值的解释
要根据它这么一个赋值
来进行一个说明
这是我们做的这么一个比例风险的一个
假定检验
这个假定检验的话
我们是根据X4有没有治疗
和X5有没有淋巴结转移
作为一个分组变量来做的
两个的一个K-M这么一个曲线
这两个曲线的话没有交叉
我们基本认为是满足比例风险
假定的要求
好
Cox回归模型我们就介绍到这里
-1. 医学统计学概述
--Video
-2.统计学的几个基本概念
--Video
-3.医学统计工作的基本步骤
--Video
-第一章 绪论--章节测试
-1.频数分布表与频数分布图
--Video
-2.集中趋势描述
--Video
-3.离散趋势描述
--Video
-4.正态分布
--Video
-5.医学参考值范围的制度
--Video
-6.常用相对数
--Video
-7.应用相对数的注意事项
--Video
-8.率的标准化法
--Video
-第二章 计量资料统计描述及计数资料统计描述--章节测试
-1. 均数的抽样误差与标准误差
--Video
-2.t分布
--Video
-3.总体均数的估计
--Video
-4.假设检验的基本原理与步骤
--Video
-5.t检验
--Video
-6.假设检验的注意事项
--Video
-第三章 章节测试
-第一节 方差分析的基本思想及应用条件
--Video
-第二节 完全随机设计资料的方差分析
--Video
-第三节 随机区组设计资料的方差分析
--Video
-第四节 多个样本均数间的多重比较
--Video
-第四章 多个样本均数比较的方差分析--章节测试
-5-1 卡方检验——卡方检验的基本思想
--Video
-5-2 卡方检验——独立样本四格表资料的卡方检验
--Video
-5-3 卡方检验——配对四格表资料的卡方检验
--Video
-5-4 卡方检验——四格表资料的确切概率法
--Video
-5-5 卡方检验——行×列表资料的卡方检验
--Video
-5-6 卡方检验——卡方检验的多个样本率间的多重比较
--Video
-5-7 卡方检验——卡方检验用于拟合优度检验
--Video
-第五章 x²检验--章节测试
-6-1二项分布的概念
--Video
-6-2二项分布的特征
--Video
-6-3二项分布的应用—总体率的区间估计
--Video
-6-4二项分布的应用—率的假设检验
--Video
-6-5泊松分布的概念与特征
--Video
-第六章 几种离散型变量的分布及其应用--章节测试
-第一节 秩和检验概述
--Video
-第二节 Wilcoxon符号秩检验
--Video
-第三节 Wilcoxon秩和检验
--Video
-第四节 Kruskal-Wallis H检验
--Video
-第五节 Friedman M检验
--Video
-第七章 秩转换的非参数检验--章节测试
-第一节 统计表
--Video
-第二节 直条图和直方图
--Video
-第三节 圆图和百分条图
--Video
-第四节 线图和半对数线图
--Video
-第五节 散点图与统计地图
--Video
-第六节 箱图
--Video
-第八章 统计表与统计图--章节测试
-第一节 -概述
--Video
-第二节 直线回归
--Video
-第三节 直线回归中的统计推断
--Video
-第四节 双变量回归与相关-直线相关
--Video
-第五节 回归与相关中的注意事项
--Video
-第六节 秩相关
--Video
-第九章 双变量回归与相关--章节测试
-第一节 多因素试验
--Video
-第二节 两因素析因设计资料的方差分析01
--Video
-第三节 两因素析因设计资料的方差分析02
--Video
-第四节 三因素析因设计资料的方差分析
--Video
-第五节 正交设计与方差分析
--Video
-第六节 嵌套设计资料的方差分析
--Video
-第七节 裂区设计资料的方差分析
--Video
-第十章 章节测试
-第一节 重复测量资料的反差分析
--Video
-第二节 重复测量数据的两因素两水平分析
--Video
-第三节 重复测量数据的两因素多水平分析
--Video
-第四节 重复测量数据的多重比较
--Video
-第十一章 章节测试
-第一节 协方差分析的基本思想和步骤
--Video
-第二节 完全随机设计资料的协方差分析
--Video
-第三节 随机区组设计资料的协方差分析
--Video
-第十二章 章节测试
-第一节 多变量数据的统计描述
--Video
-第二节 多变量数据的统计推断-单组比较
--Video
-第三节 多变量数据的统计推断-两组比较
--Video
-第四节 多变量数据的统计推断-多组比较
--Video
-第五节 重复测量设计的多变量分析
--Video
-第十三章 多变量数据的统计描述与统计推断--章节测试
-1.多元线性回归模型
--Video
-2.多元线性回归模型的假设检验
--Video
-3.多元线性回归模型自变量的选择
--Video
-4.多元线性回归模型应用及其注意事项
--Video
-第十四章 多元线性回归分析--章节测试
-1Logistic 回归分析——logistic回归分析的概述
--Video
-2Logistic 回归分析——logistic回归分析的概念
--Video
-3Logistic 回归分析——成组(非条件)logistic回归分析
--Video
-4回归分析—— 配对(条件)logistic回归分析
--Video
-5Logistic 回归分析—— logistic回归的应用
--Video
-第十五章 logistic回归分析--章节测试
-第一节 生存分析中的基本概念
--Video
-第二节 生存率的估计与生存曲线
--Video
-第三节 生存率的比较
--Video
-第四节 Cox比例风险回归模型
--Video
-第十六章 章节测试
-第一节 判别分析-概论
--Video
-第二节 判别分析-Fisher判别
--Video
-第三节 判别分析-最大似然和Bays公式判别法
--Video
-第四节 判别分析-Bayes判别法与逐步判别
--Video
-第十七章 章节测试
-第一节 聚类分析-概论
--Video
-第二节 聚类分析-系统聚类法
--Video
-第三节 聚类分析-动态样品聚类
--Video
-第十八章 聚类分析--章节测试
-第一节 SPSS-概述
--Video
-第二节 SPSS-数据文件的建立
--Video
-第三节 SPSS-数据文件的管理
--Video
-第四节 SPSS-计量资料的统计分析-描述性统计量
--Video
-第五节 SPSS-计量资料的统计分析-均数比较-t检验
--Video
-第六节 SPSS-计量资料的统计分析-均数比较-完全随机设计资料的方差分析
--Video
-第七节 SPSS-计量资料的统计分析-均数比较-随机区组设计资料的方差分析_医学统计学
--Video
-第八节 SPSS-计量资料的统计分析-均数比较-拉丁方设计资料的方差分析
--Video
-第九节 SPSS-计量资料的统计分析-均数比较-交叉设计资料的方差分析
--Video
-第十节 SPSS-计数资料的统计分析-样本率与总体率比较
--Video
-第十一节 SPSS-计数资料的统计分析-样本率比较
--Video
-第十二节 SPSS-配对计量资料比较的秩和检验
--Video
-第十三节 spss-两独立样本比较的秩和检验
--Video
-第十四节 spss-多个独立样本比较的秩和检验
--Video
-第十五节 spss-随机区组设计资料的秩和检验
--Video
-第十六节 SPSS-直线相关回归分析
--Video
-第十七节 spss多元线性回归
--Video
-第十八节 spss-logistic回归
--Video
-第十九节 spss-条件logistic回归
--Video
-第二十节 spss-有序logistic回归
--Video
-第二十一节 spss-无序多分类logistic回归
--Video
-常用综合评价方法
--Video
-第二十章 章节测试
-量表的研制方法
--Video
-第二十一章 章节测试
-医学文献的系统综述与Mata分析
--Video
-第二十二章 章节测试



