当前课程知识点:临床研究方法学导论 > 第九章 临床研究结果解读 > 第九章 章节讨论 > 3.3指标的测量
结局指标是临床研究最终落地的点
决定了研究结果的临床意义
和价值有多大
结局指标的临床意义包含两方面
结局指标本身
和结局指标测量评价的时间点
在临床研究过程中
不仅要合理地选择结局指标
还需要对其进行准确测量
提到结局测量
首先想到的就是分类指标和连续指标
不同类型的指标
对结局测量会有影响吗
结局指标的测量指
用可以进行统计分析的术语描述现象
一项研究的真实性
依赖于选择的结局指标
如何很好的反映研究现象
比如血压计
是否能较好的反映人体血压情况
阿尔茨海默量表
是否能反映老年痴呆疾病的严重程度
你刚才提到的分类指标和连续指标
背后的原理就是我们常常说的
测量尺度
又叫度量水平
度量类别
是统计学和定量研究中
对不同种类的数据
依据其尺度水平所划分的类别
选择不同的测量尺度
会影响测量所获得的信息
这张表就是临床研究中
常见的测量尺度
二分类指标分为两类
常见的比如生存状态
存活或死亡
名义指标是无序分类指标
比如ABO血型
有序分类指标
是存在明确等级关系的指标
比如疼痛程度
连续指标带有量化间隔
比如身体质量指数BMI
有这么多不同测量尺度
临床研究设计时
要如何确定结局指标的测量尺度呢
选择结局指标测量尺度时
一个好的通用准则是
连续指标优于分类指标
因为连续指标往往比分类指标
包含更多的信息量
可以提高统计效率
比如上堂课我们讨论
在非糖尿病患者强化降压研究中
采用毫米汞柱测量血压
研究者可以观察到
每位受试者的强化降压后
血压结局的变化幅度
反之
假如采用二分类指标
将降压结局定义为高血压或正常血压
则会限制对疗效的评估
与分类变量相比
连续变量还可以更灵活的使用数据
拟合变量的性质或者关联的情况
按照信息多少的排序
测量尺度可以分为
时间相关指标优于连续指标
优于有序指标
优于二分类指标
此外
我们设计结局指标的测量尺度时
还要考虑到减少测量误差
结局指标的测量误差是如何产生的
该如何避免或减小测量误差呢
测量误差是指
研究的测量值和真实值之间的偏离
一般可以从两个角度描述
随机变异和系统偏倚
也就是Variance和Bias
随机变异是通常说的精确度
系统偏倚是准确度
对于结局指标的测量
最理想的测量方式
是精确度准确度两开花
精确度和准确度会如何影响
结局指标测量真实性呢
哪些因素会影响
测量的精确度和准确度呢
结局指标的测量
需要同时考虑精确度和准确度
通常说精确度高是指
多次测量同一结局可获得相同的结果
也就是随机变异小
精确度的影响因素往往来源于
观察者变异
比如仪器操作水平
仪器自身的变异
比如环境温度改变
不同试剂批次
和研究对象自身的变异
来源于研究对象的生物学变异
比如服药后测量时间点不同
准确度高是指
测量值与真实值的符合程度较高
即系统偏倚小
准确度的影响因素往往来源于
观察者偏倚
比如血压测量倾向于向下取整数值
仪器设备偏倚
比如未校准的体重秤
整体的测量数值偏低
研究对象偏倚
比如应答偏倚和回忆偏倚
临床研究中该如何提高
结局指标测量的精确度和准确度呢
临床研究中可以采取一些
恰当的策略提高精确度
常常通过
建立标准化测量操作手册
明确操作定义和标准化操作方法
培训参与测量的观察者
改进或使用自动化测量仪器
以减少测量变异
临床研究中提高准确度的策略
除了刚才提到提高精确度中的方法
还包括
使用不易被察觉的测量方法
校正仪器
采用盲法
以提高测量的准确度
选择结局指标的测量工具和方法
还需要考虑哪些因素呢
结局指标的测量工具
首先应该有足够灵敏度
以发现某些特征的差异
其次
理想的测量方法应该是特异的
也就是只代表研究对象的特征
第三
结局指标的测量方法
还应该与研究目标相匹配
最后
在可能的情况下
尽量减少主观判断的方式
作为结局指标的测量方式
在文献中常常看到
不同研究的结局指标测量方法不同
我们做临床研究设计时
有没有结局指标测量的国际规范
或者标准可供参考呢
临床研究中选择不同的结局指标
或结局指标测量工具的现象很普遍
也有不少研究
没有提供结局指标的定义
或者结局指标测量工具
导致许多研究难以指导临床实践
或者无法进行同类比较
若在临床研究中
报告不合适的结局指标
或者选择性报告结局指标
或者选择不合适的结局指标测量工具
可能会得到毫无价值的结果
达不到临床研究的目的
也导致基于这些临床研究
而制作的系统评价
或临床指南的质量偏低
降低研究价值造成卫生资源浪费
我们在选择
合适的结局指标测量工具时
既需要评价测量工具的质量
也需要充分考虑临床医生或研究者
对测量工具性能的反馈
及选择测量工具的偏好
近年来相关学术机构和团队
提倡建立不同疾病的核心结局指标集
也就是在该疾病的研究过程中
应该尽量测量的最核心的
结局指标的集合
以及相对应的每个结局指标
确定相应的合适的测量工具集
也就是核心结局指标测量工具集
核心结局指标测量工具集是指
每个特定疾病领域的临床研究中
能覆盖相应的核心结局指标集的
最小结局指标测量工具的集合
我们在进行临床研究设计时
可以检索相关网站是否已有
对应的核心指标测量工具集供参考
当然并不是要求所有的研究
都测量和报道同样的核心结局指标
以及核心结局指标测量工具
鉴于临床研究的创新性和可行性
指标的选择和测量
仍然可以有较大的变化
核心指标集和核心指标测量工具集
具体包括哪些什么内容呢
以乳腺癌的核心指标集为例
该指标集是由来自澳大利亚
英国 美国等多国机构的研究者
共同参与研制完成的
其中核心指标集
涵盖包括一般人口学特征
基线临床信息
基线肿瘤信息
治疗措施
并发症
健康状况
生存情况
生活质量
每一个维度应测量哪些指标
这些指标使用什么工具
或手段进行测量
测量的时间点以及数据源分别是什么
均有详细说明
使用核心指标集和对应的测量工具集
可以减少同类临床研究
由于不同结局指标选择导致异质性
而无法纳入系统评价的情况
同时也能更容易识别出临床研究中
潜在的选择性报告和测量偏倚
今天我们讨论结局指标的测量要点
选择结局指标测量尺度时
按照信息从多到少的顺序
依次为
时间相关指标
连续指标
有序指标和二分类指标
结局指标的测量
需要同时考虑精确度和准确度
对于结局指标的测量
最理想的测量方式
是精确度准确度双高
对于结局指标测量方法
推荐参考核心指标测量工具集
-绪论
-章节作业
-章节讨论
-第一章 章节作业
-第二章 章节作业
-第三章 章节作业
-第四章 章节作业
-第五章 章节作业
-第六章 章节作业
-第七章 章节作业
-第九章 章节作业


