当前课程知识点:临床研究方法学导论 > 第九章 临床研究结果解读 > 第九章 章节讨论 > 9.2 阴性结果的解读
同学们大家好
今天我们来讨论临床研究结果阴性
接下来该怎么办
上节课我们讨论了
看到了阳性的结果应该如何分析
其实我更关心另一个问题
我的研究结果是阴性的
接下来该怎么办
是个好问题
从方法学的角度来讲
一项设计优良的临床研究的可靠性
源自其预先设计的研究假设
从而避免在进行数据探索分析时
得出不可靠的结论
然而仅根据P小于0.05
判定所有研究结果的阳性
阴性似有偏颇
P值越小
真实疗效证据越可靠吗
除了P值
统计中我们还常用置信区间
置信区间
可用于表示疗效估计值的区间
也就是干预作用的范围
从临床意义的角度来讲
任何临床研究的解读
都应基于所有可及的证据
包括主要终点、次要终点、安全性终点
而不一定是单一的研究终点
那么当一项临床研究的主要结局
为阴性的时候
该如何看待呢
研究者又该如何继续开展
下一步的研究呢
2019年在ASCO大会上公布了
一项非常令人遗憾的结果
Keynote-062研究几乎全面失败
Keynote-062研究
是默沙东帕博利珠单抗冲击胃癌一线
用药的三期临床试验
此前K药已经成功拿下
非小细胞肺癌一线用药
正在信心满满
Keynote-062评估
帕博利珠单抗联合或不联合化疗
对比单纯化疗
用于晚期胃或胃食管连接处
腺癌患者的疗效和安全性
研究纳入了763例PDLone
CPS大于等于1
未经治疗的局部进展
无法手术切除或转移性胃
及胃食管交界癌的患者
1:1:1
随机分配到帕博利珠单抗
帕博利珠单抗联合化疗
和安慰剂组加化疗组中
在CPS大于等于1人群中
单药和联合化疗与化疗相比
OS和PFS均为阴性结果
仅在CPS大于等于10的人群中
单药与化疗相比
OS有显著获益
而联合治疗与化疗相比
没有发现显著差异
这项研究基本上可以说是失败的
但是在几个主要终点中
CPS大于等于10的人群中
使用帕博利珠单抗单药疗效是好的
这类人群在CPS大于等于1
的总样本中仅占到了约三分之一
并且有较好的安全性
可以说这项研究为接下来
更精准的选择患者提供了基础
复盘Keynote-062研究
关于其失败的说法是有很多的
其中不可忽视的是
它复杂的试验设计
通常的试验只会选择一个主要终点
如果只有一个主要终点的研究是阴性的
是不是就确定了研究假设的错误呢
主要研究结果如果是阴性的
有两种可能
一个是研究假设确实是错误的
另一个是研究的把握度不足
原本有差异的处理效应
因样本量不足而没有被发现
也就是说假阴性
当样本量不足时
容易出现假阴性的结果
此时的结论应当是未获得结论
而不是阴性的
张维拓老师在之前的课程中讲到过
样本量估计的重要参数
只要选取正确的参数
是不是就可以获取
具有统计学意义的样本呢
同学们这个时候要注意的是
正确估算参数本身就是一个挑战
当相应领域的研究成果很少的时候
就更加困难了
比如在2019年ASCO大会上
上公布结果的
ECOG5508研究
这是一项典型的由研究者发起的临床研究
其目的是探索晚期
非鳞非小细胞肺癌最佳的维持治疗
当时指南中推荐的维持治疗
包括培美曲塞、贝伐珠单抗
和培美曲赛联合贝伐珠单抗
前两种单药的使用是基于系统
的临床研究证实
但是联合疗法的推荐
仅仅是基于一项二期的临床试验
并没有对照
而且维持治疗是作为整体
治疗方案的一部分被研究的
显然这一条
虽然作为指南应用于临床实践
然而存疑
这项ECOG5508研究是
一项随机对照的研究
从2010年到2015年共入组了1516例
晚期非鳞非小细胞肺癌患者
未接受系统的铂类药物
培美曲塞或贝伐珠单抗治疗的患者
患者首先使用至少4个疗程的铂类药物
培美曲塞或者贝伐珠单抗
总共有874例
治疗有效的患者最终进入了维持治疗研究
并被1:1:1随机分配到对照
贝伐珠单抗、培美曲塞或联合用药组
主要结局OS
两种治疗与对照组相比均为阴性结果
次要结局PFS
联合治疗组显著优于贝伐珠单抗单药
而不良事件在联合治疗组更多
ECOG5508成功的证实了
3种推荐的维持治疗疗效相近
但是基于有限的临床获益和
更高的毒性不良反应
联合用药被认为是不适合维持治疗推荐的
这项研究已经纳入了874例患者
基本与估算的897例一致
为什么会说它有把握度不足的问题呢
它样本量的897例是为了检测到
死亡率降低25%的临床获益
计算出来的
也就是说
对照组贝伐珠单抗OS为12个月
培美曲塞和联合用药的OS
均为16个月
两个指标平分
0.05的一类错误概率
检验效能为0.81
然而在实际研究中
对照组贝伐珠单抗的中位OS
实际是14.4个月
如果要检测到两个月的获益
并且检验效能维持在0.8的情况下
每组实际需要纳入1191例患者
由于低估了对照组的疗效
统计学的效能就降低了
由此也就出现了假阴性的概率提高
这项研究太可惜了
仅仅是在研究设计时的估算错误
导致整个研究的结果受到质疑
不过这项研究其实不是完全没有用的
首先它确认了贝伐珠单抗
维持治疗的OS
并且验证了贝伐珠单抗和培美曲塞
作为维持治疗的疗效基本相似
接下来可以依据这些信息
重新设计一个把握度
更充分的研究
课程中反复讲到了PICO
是研究设计的一个重要组成部分
我们也可以用这个思路分析研究设计
没错
研究的成功与否
很大程度上取决于患者干预
对照和研究终点的定义
让我们来再讲一个例子
复合研究终点是使用预定义的算法
将多个测量指标集成或组合
到单个复合变量中
可以避免多重检验的问题
比如心血管事件的发生
就是心血管领域公认常用的复合终点
不过需要注意的是
复合终点中的不必要组成部分
只会徒增随机噪音
反而稀释真正的效益
导致主要结果
没有统计学的意义
比如在没有新的治疗方案时
晚期的直肠癌通常采用
全直肠系膜切除手术
手术呢会导致2%的术中死亡
和25%到50%的术后死亡
然而
新辅助放化疗的肿瘤完全清除率
达到了16%
预后更好的保留器官的
局部切除术成为可能
在GRECCAR2研究就是为了
探索第一位直肠癌新辅助放化疗后
保留器官的局部切除
和全直肠系膜切除的效果
这是一项三期随机对照
优效性的临床研究
总共纳入了186例患者
随机分配到局部切除
和全直肠系膜切除
主要终点为死亡、复发、手术并发症
严重后遗症的复合终点
最后研究结果为阴性的
OR等于1.33
P等于0.43
这项研究的自定义复合终点
就是最受到质疑的部分
复合终点是指当其中一个事件发生
即认为达到终点
因此设置复合终点
更容易达到预期结果
然而从临床的角度来讲
死亡和复发这两个肿瘤相关指标
却和非肿瘤学的指标视为同等的重要
这就是存疑点之一
研究者之所以选择设置这样的复合指标
是因为新辅助放化疗以后
患者预后比较好
死亡率比较低
因此必须要非常大的样本量
才能得到阳性的结果
如果单独以死亡为主要终点
这个研究需要620例的患者
因此
他们选择了一个可行性更高的设计
然而却得到了一个阴性的结果
所以对于我们研究者来说
结局指标的选择是至关重要的
谢丽老师在前面的课程中曾经讲到了
不同领域结局指标的规范
建议同学们在设计自己的研究时
一定要选择公认的有临床意义的终点
关于如何对阴性结果进行解读
并采取进一步的研究
Pocock Stone
同样也提出了12条思路
有兴趣的同学建议继续阅读
我们也将在今后的课程中
有机会和同学们继续探讨
-绪论
-章节作业
-章节讨论
-第一章 章节作业
-第二章 章节作业
-第三章 章节作业
-第四章 章节作业
-第五章 章节作业
-第六章 章节作业
-第七章 章节作业
-第九章 章节作业




