当前课程知识点:精准医学 > 第五章 精准医学与流行病学 > 4.医学大数据与精准医疗 > 4
第四个方面
我们来谈一下医学大数据与精准医疗
流行病学上一直是在用大数据
从医学大数据的概念提出之初
我们所有流行病学的人都在讲
我们在用医学大数据
医学大数据泛指所有的和医疗和生命相关的健康相关的数据
它包括哪些内容呢
包括了生物学的数据
来自于实验室的
来自于公共生物医学数据库的数据
那么另外一个大数据的来源
是我们临床的大数据
其实临床大数据
大家知道包括了我们的病历资料
我们的电子病历系统
还有我们的影像学资料
就说我们的PACS系统
我们所有的影像学的
不管是拍片 CT 磁共振 超声 各种影像学的资料
还有我们医学检验的资料
我们所有的生化检验的资料
肿瘤标志物的检测
还有我们医院管理的档案
包括我们历年的住院统计的年报
其实
临床大数据里没有用到的数据和表面上看到的数据还是一个海量的没有用到的
因为大家知道我们在做磁共振或者CT检测过程中
差距还是很大的
给临床医生提供的这几张这个片子
和它检测产生出来的数据只是用了冰山的一角
只把有意义的拿出来
其实更多的数据可能都没有呈现出来
所以这一段
只是一个从影像组学来说影像的数据就非常值得可挖掘
另外一个就是现在提出来的健康大数据
就更多了
包括了我们每一个人从出生到死亡的所有的可能数据
你所有的出生信息
你历次的健康相关信息
包括了现在大家用到的你的保险信息
你拿着医保卡在哪个地方买药所有的信息
那么最后一直到死亡的信息
所以这个健康大数据是涵盖了我们从生到死的一个全生命周期的全历程的数据
所以这些数据也为我们做精准医学研究也提供了很多信息
但是这个信息
各位研究生同学来听这个课的话
你要考虑到这个信息其实噪声是非常大的
可能我们临床的大数据还比较可信
但是健康大数据相关的噪声可能远远多于它能够真正给我们提供的信息
组学的数据更多了
因为组学技术的发展
组学就是我们原来叫基因组做的比较多
那么现在蛋白组
然后转录组 代谢组
各种各样的组学信息其实也是非常的杂非常的乱
这个图给大家展示的是一个人可以产生多少的信息
那么这些信息呢
又如何为研究者所用
这点上还是给我们所有的做精准医学研究的人提出了一个非常大的挑战
原来大家觉得数据少
那么以后产生更多的数据
数据更多的时候
如何从这种混杂的数据中找到你可用的信息
这里面给各位研究者提出了非常非常大的挑战
所以组学数据其实并不是越多越好
比如位点
原来我们开始做SNP
在十几年前大家做SNP
SNP的突变位点
几个突变位点
那么一个突变位点不能说明问题的时候
我们再开始做这个就是单倍型
然后几个SNP组合起来说明问题
这还好说
那么后来技术的发展
GWAS出来了
全基因组测序
几十万个位点
几十万个位点会怎么办呢
几十万位点然后再开始聚类
其实所有的组学数据
大家从流行病学的角度来看呢
林林总总的数据处理也不外乎我们原来传统的方法
聚类分析
其实所有的研究方法都基于我们的聚类分析
或者说主成分分析
总是把林林总总的数据汇集成几堆
我们通俗来说几堆
具有共性的
因为你再准
你不可能一个人一个组
我们说做研究的时候
你不可能一个人一个组
那么总得要把有不同特征的突变特征的或者组学特征的人
把它汇到一堆里边
比如说你要研究肺癌的话
你做300个病例
你也不可能分300个组
你最多分十个组
或者30个组一个组十个人
那不能再少了是吧
所以说从流行病学研究方法的角度来看
所有的组学数据
你不管多么乱多么复杂
一定要把它还是要理顺出来理出了几个组
那么几个共性的特征才能精准
所以呢
从组学和数据的意义上来看
精准只是一个相对精准
因为我们讲课的对象是研究生
所以我一直希望我们的学生有一点批判性思维
而不要被这些数据所迷惑
数据越多越好嘛
不是这个样子的
首先你要看数据的真实性 数据的来源
那么它里面数据的噪声到底有多大
去除所有不真实的 所有发出噪声的数据
你还要根据我们经典的方法来把它聚类
这就是说对数据和组学数据的分析
同学们要有一个清醒的认识
有一个基本的概念
包括这个宏基因组的这种深度挖掘
这个图看起来很漂亮
其实也就是挖了很多
就说宏基因组的研究更是方兴未艾
那天开玩笑讲所有能够查到的就是宏基因组的东西都在做
原来是口腔的
然后消化道的
做到各种肠道菌群
那么现在所有不可能有菌的地方
大家都已经开始找了
包括脑脊液的
大家都在找
胆汁的
这些所有的地方都在找
都可能有很多
因为感染因素嘛
感染是疾病发生的一个非常重要的病因
所有未明原因的这种疾病
大家都可能考虑感染
所以宏基因组的研究也是深度挖掘了很多
现在说又怎么样呢
没有一个非常好的概念
因为你不可能把这个菌像我们定量的做到血红蛋白或者白细胞一样能数到多少个
这个数不清楚
那么得到的还是一个相对丰度
相对丰度又能说明什么问题呢
不好说明问题
从因果关系上来说
更加不好说明问题
所以再次提醒大家
对于组学的包括宏基因组的挖掘技术
虽然看起来很漂亮
其实
实际应用的过程中依然还是满头雾水
就说你把这个组学做不出一个很好的因果关系
到底是谁先影响了谁
在这一点上就说不清楚
另外一个我们组学大数据平台在肿瘤精准治疗中的应用
其实说精准
我们更多的是叫精准肿瘤学precision oncology
大家知道肿瘤的起源
它是来自于体细胞的突变
somatic mutation
然后在这种体细胞的突变中才能够容易捕捉到一些位点
那像我们常见的心脑血管疾病
好做吗
非常不好做
因为没有特殊的位点
没有这种好找的靶点
那么做这个精准也是非常非常困难的
所以说精准医疗中
肿瘤是一个大块头
肿瘤能够做很多东西
包括临床的数据 组学的数据 医疗的资源
各种深度的学习来挖掘
这是各种各样的方法都非常多
而且近几年来
精准医学的发展
对肿瘤的治疗也带来了非常大的革新
确实它能够发现一些靶向性药物
但是
精准肿瘤学的一个最大问题
我这几天一直在查几个来自于新英格兰杂志
还有JAMA杂志的这些述评就在说到什么呢
就是精准医学给我们带来了什么呢
治疗费用的上涨
就是这个cost
所有的治疗费用上涨
在肿瘤领域治疗费用从原来的传统几万美元到几十万美元
在中国的状况其实也是这样
在这种数据的应用
包括组学数据的应用过程中
还有精准肿瘤的研究过程中
其实它的负面作用还是非常非常多的
也因为我们大家是研究生嘛
大家要考虑一下
包括我们的心脑血管疾病如何做精准
那么如果我们找不到靶点
还要不要做精准
心脑血管疾病的这种精准又如何来进行
如何来按照我们经典的办法
如何能够把它进行细分
其实也是可以的
只是说可能不如肿瘤这个领域做的更加有成效而已
那么这是我们的健康影响的金字塔
这个金字塔
底层是我们的社会经济因素
高层是健康咨询
这种收益是教育
那么我们解决这个底层的这种问题呢
就是说它包括教育 贫困 政策
会带来这种越来越深远的影响
我们这个课题组一直在做这个队列研究的过程中
也发现了这个问题
越研究越发现什么呢
社会经济地位就是底层的社会经济因素
我们说SES
社会经济地位其实是影响了人一生的这种健康的决定因素
因为我们在农村做了这么多的队列
社会经济地位产生了深远的影响
就是原来我们传统的流行病学方法会调整一下
比如说家族史
比如说父母的这种职业
或者自己的职业 受教育年限
现在我们做的家庭收入
其实发现这些和几乎所有的疾病都非常非常相关
因为这也就提醒我们
我们在如何解决全民健康的过程中
我们的教育
然后我们对贫困的脱贫
包括这个国家对底层的政策会带来非常大的影响
这也就是回到我们前面习总提到的健康2030策略
其实更多的是要政府的投入
解决了公共卫生问题
这个解决了最棘手的公共卫生问题
它不是解决了一个人的问题
其实是通过解决一个群体的全社会的一个环境
一个变化
所以从这个健康影响的金字塔来看
我们越来越深刻的体会到习总提出来的健康2030
对于我们的脱贫攻坚
国家的政策
其实对于我们全民的健康
没有全民健康就没有全民小康
这也是影响非常深重的
社会经济地位 母亲的受教育程度决定了孩子养育的方式
孩子养育的方式对他一生的健康
童年期的感染 所有感染因素的时候引发的这种对成人的健康都是非常有影响的
所以在这里我提出这个健康影响金字塔
其实也是我们这么多年做精准医学一个非常深刻的体会
做了精准越做精准
反而越注意这个底层的问题
就说是我们金字塔的底
我们的社会
我们的整个全社会的教育程度
我们全社会的脱贫
这个问题才是影响我们全民健康的一个最基本的因素
所以呢
今天的这个课那么我们从流行病学到精准医学
从精准医学我们再回到人群的健康
这个过程让同学们要体会到精准医学和流行病学是一个什么样的关系
我们是一个层次递增的关系
然后从流行病学到精准医学
从精准医学到群体
大家是一个整体的概念
所以就是用了这么长的时间
给大家梳理了一下流行病学在精准医学中的应用
也希望我们各位临床的研究生能够更多的关注公共卫生问题
因为全民的健康它不是一个孤立的
不是临床上的医生所能够解决的问题
最终还要回到我们社会回到群体
解决了群体的问题
才能解决个体的问题
我们另外一个方面
是这个片子里汇总了精准医学在公共卫生中的一些应用
那么精准医学的概念和理念
它可以延伸到公共卫生的各个层面
对整个社会产生一些积极的影响
这个片子我就不再细讲了
整个就是说我们精准医学看到是个体
然后回到是精准的群体
这样我们整个的从个体到群体
从群体到个体的这么一个过程
才真正的能够实现我们精准
我们不仅是精准的预防
精准的治疗
才是精准的全民健康
谢谢各位同学的聆听
-1.精准医学是医学发展的必然
--1
-2.精准医学的基本概念
--2
-3.精准医学的发展与现状
--3
-4.精准医学面临的难题
--4
-5.精准医学课程设置
--5
-测试题
-1.血小板功能检测指导抗血小板精准治疗
--1
-2.基因型指导抗血小板精准治疗
--2
-3.从介入治疗变迁看精准医学
--3
-4.齐鲁医院急诊科开展的精准医学研究
--4
-测试题
-1.精准内分泌学的发展
--1
-2.糖尿病的精准诊断与治疗
--2
-3.其他内分泌代谢病的精准诊治
--3
-4.精准医学在内分泌代谢病领域研究与展望
--4
-测试题
-1.罕见病的基因发现与鉴定1
--1
-2.罕见病的基因发现与鉴定2
--2
-3.罕见病的基因发现与鉴定3
--3
-4.罕见病的基因发现与鉴定4
--4
-测试题
-1.精准医学与中国机遇
--1
-2.流行病学与精准预防
--2
-3.流行病学研究方法与精准医学
--3
-4.医学大数据与精准医疗
--4
-测试题
-1.精准医学与转化医学
--1
-2.精准医学中的标本库平台建设
--2
-3.乳腺肿瘤精准诊疗
--3
-测试题
-1.精准医学概述
--1
-2.肿瘤精准放疗
--2
-3.放疗联合免疫治疗
--3
-4.放疗联合抗血管生成治疗
--4
-测试题
-1.肿瘤化疗和内分泌治疗
--1
-2.驱动基因靶向治疗
--2
-3.肿瘤免疫治疗
--3
-4.肿瘤抗血管生成治疗
--4
-测试题
-1.白血病基因改变
--1
-2.基因改变精准检测
--2
-3.危险度分层
--3
-4.靶向基因改变个体化治疗
--4
-测试题
-1.妇科肿瘤分子分型(1)
--1
-2.妇科肿瘤分子分型(2)
--2
-3.妇科肿瘤抗血管生成靶向治疗
--3
-4.PARP抑制剂用于卵巢癌靶向治疗
--4
-5.妇科肿瘤的免疫治疗
--5
-测试题
-1.精准医学的概念及特点
--1
-2.队列研究的定义与应用
--2
-3.研究生如何开展精准医学课题1
--3
-4.研究生如何开展精准医学课题2
--4
-测试题