当前课程知识点:精准医学 > 第四章 精准医学与遗传学 > 3.罕见病的基因发现与鉴定3 > 3
我们今天来继续讲授《精准医学》这门课
那很高兴为大家讲授这门课程
我是来自山东大学基础医学院遗传学系的刘奇迹
那么今天我们这堂课的主要内容是罕见病的基因发现与鉴定
伴随着人类基因组计划的实施
我们说出现了一种新方法
叫做定位克隆
这个定位克隆
它和功能克隆是完全不同的一种方式
它是从疾病的表型入手
先对基因在染色体上的一个物理定位进行定位
然后再分离基因的序列
通过利用突变检测以及功能分析证明基因和疾病的这种关系
那么也就是说
它是从表型入手来先从基因的物理位置开始入手来分离基因的序列
证明基因和疾病之间的这么一个关系
那么这就是我们前面说的定位克隆
我们前面有一个PPT已经讲过了
这是罕见病在九十年代分离罕见病的一个非常常见的一个方法
那么从这个图中我们可以看出
整个定位克隆分成这么几步
第一步
大家看左边是一个家系图
这个家系图涂红色的代表是患者
方框代表是男性患者 圆圈代表是女性
涂红色的圆圈代表女性患者
那么大家看
这一共四代
每一代都有患者
并且男女发病率基本上是类似的
这说明什么
这表明它是一个常染色体显性遗传
那么常染色体显性遗传代表什么呢
代表致病基因一定是位于1到22号常染色体上
对吧
那好
我们就把目光锁定在这1到22号常染色体上
因为1到22号常染色体涵盖了上万个基因
那究竟哪个基因是呢
这个时候我们通过遗传图
通过连锁分析
来明确地把它锁定到某一条具体的染色体的某一区某一带
也就是说把这个致病基因定位到一个非常狭小的区域
定位以后
我们在第二步进行物理图
也就是构建这个候选区域的整个物理图
然后
我们认为绝大多数的罕见病都是由于外显子区域
也就是说编码蛋白质的序列发生了突变引起的
也就是说我们不关心那些基因间的序列
我们关心的是定位在这个区域的一些可转录的序列
因为这个时候要构建转录图
拿到这些外显子序列以后
我们通过对外显子进行一个个的测序
建立一个个基因的序列图
比如说
那么我们在某一个基因之中发现了有一个C到T的突变
本来这个C到T
那么这个C是它的密码子构成是CAA
它编码的一个是谷氨酰胺
它变成了C
变成了T以后
那么CAA的密码子就变成了TAA
TAA是个什么呢
大家知道
TAA是一个终止密码子
也就是说蛋白的翻译到此终止
这是一个无义突变
由于一个碱基的改变
C到T的改变
导致编码的氨基酸
有一个密码子由一个编码氨基酸的密码子变成了终止密码子
所以导致出现一个截短蛋白
那么可能就导致了疾病的发生
大家看
这整个定位或者发现疾病基因的过程要构建四个图
遗传图
物理图
转录图
序列图
我们说
人类基因组计划其过程就是构建这四个图的过程
因此我们说定位克隆
就是伴随着人类基因组计划实施而出现和发展的这么一种方法
那么既然说定位克隆
顾名思义就是通过首先对基因它的位置入手来分离致病基因的
首先我们看第一步构建遗传图的这个过程
构建遗传图的过程的是完全根据摩尔根的连锁互换定律发生的
那我们看左边是两条同源染色体
一个蓝色的一个黄色的来自父亲和母亲的两条染色体
那么这两条染色体上面我们标记了一个绿色的一个红色的
这两个是等位基因
这两个位点
我们知道在减数分裂的过程中
由于连锁互换
这两个位点它可能就会发生交换
结果大家看
在右边这个图上
那么有两条姊妹染色单体本来是绿色和红色在一起
那么由于交换那么蓝色的和黄色的染色体就发生了片段的交换
从而导致了重组的染色体
我们构建遗传图谱过程
就是利用了连锁互换基本的这种原理
那么也就是说首先利用基因多态位点
最开始是我们利用的是STR短串联重复序列多态位点
当然现在我们更多的是用SNP芯片进行连锁分析
检测致病基因共同传递的等位基因
那么
做了这一步以后呢我们要计算LOD score值
来判断出现共同传递的这种现象是由于连锁
是位于同一条染色体上
还是位于不同的染色体上它自由组合导致的
那么从右下角这个图中我们比如说
大家看
在一条染色体上我们有一个多态位点
它的等位基因是3
那么这个致病位点我们用D来表示
由于这两个位点呢
它非常近
大家可以想在传递的过程中
它就会出现什么情况
就是说这条染色体因为它两者非常近
很少会发生重组
所以呢
它就这个等位基因3和这个致病基因就一起传递
也就是说患者从亲代得到致病基因成为病人的同时
它同时携带了等位基因3
而右边这条染色体
假设这个等位基因3和这个致病基因相距有一定距离
那么在传递过程中
可能就会由于重组
这个等位基因3和致病基因并不完全连锁
那么这就是说
我们说连锁互换的一个基本的一个道理
那么当这个LOD score值我们要进行一个统计学分析
也就是说θ代表的是重组率
我们说H0是假设
也就是说这两个位点之间
它θ等于二分之一
也就是说是自由组合的
重组率等于二分之一是自由组合
也就说不连锁
那么H1
假设θ小于二分之一
认为是连锁的
那么也就是说那么以log以10为底的对数
分子我们说是当θ等于一定重组率的情况下
支持现有减数分裂项的这么一个数据
分母是等于自由组合的这么一个数据
当LOD score值大于1的时候
表示这两个位点之间存在连锁
大于3的时候
表示肯定连锁
大家想想LOD score值等于3代表的是什么
log以10为底的对数就是说分子是分母的一千倍
也就是说支持连锁的概率是自由组合连锁概率的一千倍
那么代表它是一定连锁的
对吧
当LOD score值小于-2时
表示是否定连锁
认为出现这种情况它代表是由于自由组合而导致的
那么也就是说
连锁分析类基本的一个流程是通过基因型的多态性
通过根据孟德尔定律建立连锁不平衡
我们进行数据过滤
然后呢
通过优化遗传模式
也就是说通过参数或者非参数分析对候选区域一个大致范围进行一个基本的确定
然后通过单体型作图来进一步精细定位确定候选区域
这是这么一个精确的过程
由于时间关系
那么我们如何计算LOD score值以及如何进一步判断
我们不再进行详细地讲述
我们下面看一下一个大体的给大家的一个示意的一个过程
比如说我们发现这么一个家系
就像刚才我们看了一个家系
是一个常染色体显性遗传的这么一个家系
也就是说
患者是第一代
实际上父亲
他是一个患者
他和一个女性婚配又生了四个子代
三个男孩
一个女孩
那么其中一个男性和一个女孩发病
那么进一步再往下传每一代都有患者
我们判断它是个常染色体显性遗传
我们在构建遗传图的过程中
比如说我们就用D2S132这个多态位点
这是一个STR多态位点的一个标记
D代表是DNA的片段
2代表是2号染色体
S代表sequence或者segment片段
123是个流水编号
那么代表这个位点
它是2号染色体上的一个多态位点
它的物理定位是明确知道的
那么通过基因分析
大家看
那么这个23 14代表的是这些个体携带这个多态位点的等位基因
那么我们从第二代也可以看出
这两个患者分别从他的父亲得到了等位基因2和等位基因3
那么这两个正常的个体
也是得到了等位基因2和等位基因3
再往下看
那么这个男34
这个男性患者
他传递给子代的时候
他把等位基因3传递给了子代
然后呢这个女性患者再往下传的时候
这两个患者有的得到了等位基因3
有的得到了等位基因5
那么这是一个什么情况
大家说
这明确的就不是一个连锁的
这代表这个等位基因
这个D2S123和这个致病基因很可能是位于两条不同的染色体上
这纯粹是一个自由组合
对吧
因此我们计算LOD score值
发现确实它小于-2
明确其实不连锁
那么右边我们当我们做到
比如说D3S132
3号染色体上的一个多态位点的时候
我们发现了这个现象
男性患者23
他和携带等位基因14的女性婚配
生了两个患者
分别携带了等位基因是31和34
那么我们从这看到一个巧合的现象是
这两个患者都从患病的父亲那儿得到了等位基因3
那我们再来看他表型正常的同胞都从患者的父亲那得到了等位基因2
那么再往下看
第三代这个患者从父亲那得到的等位基因3
而他的表型正常的两个同胞都是得到了等位基因4
最后一代
那我们看
这四个子代之中
两个患者同样也是从患病的母亲那儿得到了等位基因3
而两个表型正常的同胞
得到了等位基因5
从这我们看
是不是等位基因3和这个致病基因是出现了共同传递这个现象
对不对
所以对这些患者都是从最初的那个患者得到了一个致病基因
比如说我们用致病基因A来表示
他们得到A的同时成为患者
那么同时他们还得到了等位基因3
那么这就像我们刚才讲的
那么等位基因3和致病基因很可能是在同一条染色体上
并且物理位置非常近
因此出现了共同连锁这个现象
那么
我们通过计算LOD score 值
它的LOD score值等于3.1
那么也就是说
我们认为这个位点
它和致病基因是紧密连锁的
所谓连锁呢
那我们看 用一个示意图
D3S132在这个区域之中
那么这个致病基因就在这个132的附近
但是在它的上游还是下游呢
我们并不明确
这个时候呢我们从D3S132这个多态位点附近
我们选择更多的多态位点来进行分析
那么我们再来看
当我们做到462的时候
D3S462的时候发现
大家看第二代的患者得到了等位基因3
第三代的患者得到了等位基因3
那么第四代大家看
这两个患者其中有一个患者
这两个患者都得到了等位基因3
那么其中第四代的这有一个正常的个体
大家看中间的这个女性患者正常的子代
他从患病的母亲这儿
也得到了等位基因3
也就是说
她是一个正常的个体
她从母亲这儿得到了正常的等位基因
但她得到了等位基因3
这个表明什么了
表明在这儿出现了一次重组
也就是说
这个致病基因和正常的等位基因之间出现了一次重组
那么代表这个致病基因的下边界就位于D3S462的上游
那么我们就把致病基因的下边界定出来
通过同样的方法
我们定位到
把这个上边界做到345的时候呢
在这个家系中同样发现了
大家看第四代的这个患者
在这个家系中绝大多数患者都是携带了等位基因6
对不对啊
也就是说
代表等位基因6 和致病基因是连锁的
但是
第四代的最后一名女性患者她从患病的母亲这得到了等位基因1
她没有得到等位基因6
同样的情况我们判断在这儿出现了一次重组
也就是说
致病基因的上边界就位于345附近
这样呢
我们就把致病基因定位在D3S345到D3S462这两个多态位点之间的区域
致病基因它就位于这个区域
这是一个构建连锁图的过程
这样呢
我们就把致病基因从整个1到22号常染色体
为什么说是1到22号常染色体呢
就这个例子来说
因为我们说他是一个常染色体显性遗传的致病基因
因此它的致病基因只能是位于1到22号常染色体上
我们从这么大的一个区域精细定位到三号染色体上
D3S345到462之间这么一个区域
接下来我们通过构建物理图
当然构建物理图是一个非常非常费力的一个过程
构建转录图
我们在这个区域内
通过某一个基因的一个外显子序列中发现一个C到T的突变
结果证实呢
这个C到T的突变导致了一个无义突变
那么进一步证实它可能就导致了疾病的发生
这就是定位克隆的一个过程
那么这个定位过程通过连锁分析
制作连锁图
制作物理图
转录图的过程
是一个非常费力的过程
那么
伴随着人类基因组计划的实施并完成
到现在我们出现了另外一种方法
叫定位候选克隆
也就是说
当我们进行定位以后
我们不需要再进行制作物理图
我们只需通过数据库中查找定位区域中有哪些已知的基因
把这些基因序列拿来进行突变检测
直接就可以来定位
找到基因的突变
那么这个过程大大加快了寻找致病基因的过程
那么举一个例子
是X连锁智力低下致病基因定位候选克隆的这么一个过程
那么从这个家系图中我们可以看出
有一个非常明显的特点是什么
所有的患者都是男性
另外那么我们再来看这些男性患者他们的关系
都是什么
兄弟关系
表兄弟关系
舅舅和外甥的关系
对不对啊
这代表什么
那么我们仔细分析
这是一个典型的X连锁隐性遗传的家系
对不对啊
也就是说这些男性患者的母亲她都是携带者
她两条X染色体上其中一条携带了致病基因
家系中的Ⅰ2这个女性去世了
她很可能是个携带者
她把致病基因传给了Ⅱ2这个女性
那么Ⅱ2又传递
依次往下传
那么也就是说致病基因就位于X染色体上
但位于具体的那个区域呢
我们不知道
那么这是患者的一些他的一个表现
除了智力低下之外还有一些小头
然后语言的问题
舌发育异常
骨骼发育异常等一系列的这么一个异常
然后呢我们就通过基因组分析
基因组扫描呢
把这个致病基因就定位到了DXS8064和DXS8050之间
为什么说定位在这个区域呢
大家看
DXS8064那么我们就从看到这个Ⅲ1 Ⅲ2 Ⅲ3第三代的这三个男性
大家看这三个男性呢有两个男性是正常的
其中一个表型正常的同胞
但是大家看
他们都从母亲这得到了一条X染色体
带有等位基因3的X染色体
这显然是不对的
因为Ⅲ2他是一个患者
因为从这个图中我们可以看出
所有的患者都得到的是等位基因2比如说Ⅱ4 Ⅱ5 Ⅲ4 Ⅲ5
但唯独这个Ⅲ2这个患者呢得到了等位基因3
说明了在这出现了重组
同样的情况我们可以看8050
DXS8050
这个8050大家看他的重组出现在哪里呢
Ⅱ4和Ⅱ5第二代的这两个男性患者
分别从母亲那得到了等位基因2和等位基因1
那么同样这提示它出现了重组
那么致病基因呢我们就把他定位在
8050和DXS8064这大概14.6个cM这一个候选区域之内
然后我们分析这个区域呢
这是在他的一个物理图的一个定位
那么我们用箭头示意了这两个Marker所在的位置
那么这个区域内呢一共有多少个基因呢
大约有将近一百个候选基因
我们对这些基因呢进行了分析
那么大家看这些基因的名字
对这些基因呢我们根据它的功能
它的表达模式和疾病的致病方式我们进行了分析
结果在一个CUL4B这个基因内我们进行测序的时候呢
发现了一个C到T的突变
从下面的测序图中可以看出
对男性患者
因为男性只有一条X染色体
所以他都是一个半合子
那我们看左边是一个正常对照
他是一个C
那么右边是一个患者
他是发生了一个突变是个T
那么C到T的这个突变在这个CUL4B里头他的编码序列发生了什么呢
那我们看这是这个基因的开放阅读框
这个C
上面我们用红色标记的
它正常的开放阅读框中它是一个CGA编码的是第370位的氨基酸是个精氨酸
那么C变成T以后呢这个密码子CGA就变成了TGA
我们知道TGA是个终止密码子
因此也就是说它编码的氨基酸把370位的精氨酸呢变成了一个终止密码子
而这个CUL4B他的蛋白呢全长是913个氨基酸
大家可以想想他在翻译终止以后
这个蛋白很可能是一个丧失功能的突变
更重要的是大家看我们这个蛋白
他在500多位以后还有个CULIN的结构域
那么整个这个结构与就丢失了
而导致了基因功能的丧失
从而导致了疾病的发生
当然我们后续还做了一系列其他功能的验证
和小鼠的动物模型呢证明了这个基因
这是整个CUL4B这个致病基因发现的过程
那么除了我们做的这个工作之外呢
随后呢
其他小组的工作在这个CUB4B这个基因
也发现了更多的突变在不同的家系中发现了不同的突变
那么进一步明确了CUL4B这个基因的丧失功能突变
导致了X连锁智力低下的综合征
那么这就是一个X连锁智力低下的这个致病基因的发现
一个CUL4B这个致病基因的发现
好那我们还是回到精准医学
也就是说我们前面讲到
罕见病的他的精准医学就在发现致病基因后
可以为家系成员提供基因诊断
那么就拿到这个例子来说
我们分离这个家系的致病基因拿到CUL4B这个致病基因的它的突变之后呢
可以为这个家系做什么呢
那么我们知道这种X连锁遗传方式的疾病呢
他由于绝大多数女性是携带者
带有致病基因
尽管她不发病
但她在在生育之后呢
她同时可以把致病基因传给她的男性子代
男性子代得到致病基因
有二分之一就会发病
因此
那我们可以对这些家系中所有正常的女性进行携带者检出
也就是说看这些女性有没有携带这些CUL4B的基因突变
如果她携带了基因突变那我们提醒她
她将来怀孕以后我们可以做产前诊断避免男性患儿的再次发生
从而为这个家系提供疾病干预的这个服务
另外一个
我们拿到了了解了这个智力低下它的新致病基因以后呢
我们可以对致病基因的功能进行深入的研究
而了解它为什么导致了疾病的发生
了解这个疾病发现的机制进而后面为药物的开发设计提供一个新的靶点
这是一个致病基因发现的这么一个定位候选克隆发现致病基因的这么一个例子
那么前面我们用这个示意图可以看出
定位候选克隆也好
定位克隆也好
候选功能克隆也好
我们就相当于在整个基因组中来寻找一个基因
就像我们在深夜的大街上我们丢了钥匙
那我们也仅仅能在路灯照亮的地方来进行寻找
那么在路灯照不到的地方我们是无能为力的
也就是说那个时候我们对基因组它的认识是有限的
因此大大限制了我们对致病基因发现的速度
我想今天我们的课基本上就讲到这里
谢谢大家
-1.精准医学是医学发展的必然
--1
-2.精准医学的基本概念
--2
-3.精准医学的发展与现状
--3
-4.精准医学面临的难题
--4
-5.精准医学课程设置
--5
-测试题
-1.血小板功能检测指导抗血小板精准治疗
--1
-2.基因型指导抗血小板精准治疗
--2
-3.从介入治疗变迁看精准医学
--3
-4.齐鲁医院急诊科开展的精准医学研究
--4
-测试题
-1.精准内分泌学的发展
--1
-2.糖尿病的精准诊断与治疗
--2
-3.其他内分泌代谢病的精准诊治
--3
-4.精准医学在内分泌代谢病领域研究与展望
--4
-测试题
-1.罕见病的基因发现与鉴定1
--1
-2.罕见病的基因发现与鉴定2
--2
-3.罕见病的基因发现与鉴定3
--3
-4.罕见病的基因发现与鉴定4
--4
-测试题
-1.精准医学与中国机遇
--1
-2.流行病学与精准预防
--2
-3.流行病学研究方法与精准医学
--3
-4.医学大数据与精准医疗
--4
-测试题
-1.精准医学与转化医学
--1
-2.精准医学中的标本库平台建设
--2
-3.乳腺肿瘤精准诊疗
--3
-测试题
-1.精准医学概述
--1
-2.肿瘤精准放疗
--2
-3.放疗联合免疫治疗
--3
-4.放疗联合抗血管生成治疗
--4
-测试题
-1.肿瘤化疗和内分泌治疗
--1
-2.驱动基因靶向治疗
--2
-3.肿瘤免疫治疗
--3
-4.肿瘤抗血管生成治疗
--4
-测试题
-1.白血病基因改变
--1
-2.基因改变精准检测
--2
-3.危险度分层
--3
-4.靶向基因改变个体化治疗
--4
-测试题
-1.妇科肿瘤分子分型(1)
--1
-2.妇科肿瘤分子分型(2)
--2
-3.妇科肿瘤抗血管生成靶向治疗
--3
-4.PARP抑制剂用于卵巢癌靶向治疗
--4
-5.妇科肿瘤的免疫治疗
--5
-测试题
-1.精准医学的概念及特点
--1
-2.队列研究的定义与应用
--2
-3.研究生如何开展精准医学课题1
--3
-4.研究生如何开展精准医学课题2
--4
-测试题