当前课程知识点:医学实验技术与方法新进展 > 第八章 生物信息学常用数据库和软件 > 第3节 基因变异致病性预测相关分析 > 基因变异致病性预测相关分析
大家好
我是来自中南大学湘雅三医院的袁腊梅
这一章我们学习的内容是
生物信息学常用数据库和软件
这一节学习的内容是
基因变异致病性预测相关分析
ACMG即美国医学遗传学和基因组学学会
其于2015年修订的《序列变异的解读指南》
对于遗传变异分类
发布了遗传变异分类的标准
2017年中国遗传学会遗传咨询分会
发布了
《ACMG遗传变异分类标准与指南中文版》
突变是指核苷酸序列的永久性改变
而多态性是指频率超过1%的变异
虽然术语突变和多态性已被广泛使用
但由于致病性和良性结果的不正确
假设往往会被混淆
指南建议使用变异加修饰词代替上述两个术语
修饰词包括致病性
可能致病性 意义不明确
可能良性或良性
指南包含孟德尔遗传疾病相关的变异分类
五级术语系统
ACMG建议致病性
包括可能致病的结论
应注明疾病及相应遗传模式
如图所示为ACMG证据结构
其中致病性变异分为支持到很强的证据
而良性变异证据包括支持以及强的证据
对于基因变异的命名规范
一般参照HGVS规范命名法
可利用Mutalyzer提供正确的HGVS命名
其中包含的参考序列应该确保变异
在DNA水平上命名并提供编码
和蛋白质命名法来协助功能注释
其以翻译起始密码子的ATG中A
作为编号1
对于参考转录本应选择
最长的已知转录本
或者最具临床相关性的转录本
因为临床直接评估致病性
因此推荐使用术语致病性
而不是影响功能
序列变异预测有一系列的生物信息学软件
每种工具算法虽然有差异
但都会包含序列变异在核苷酸和氨基酸水平上
作用影响的判断
辅助解读序列变异
生物信息学软件主要分为两类
一类是可以预测错义变异
是否会破坏蛋白质的功能或结构
另一种是可以预测是否影响剪接
下图表示了一些生物信息学的预测软件
使用生物信息学软件进行分析
不同的软件使用不同算法进行预测
其基本原理是相似的
不同软件工具组合预测结果被视为单一证据
而非相互独立的证据
因为每个软件算法都有其各自的优缺点
建议多种软件相互结合使用
预测效能
可能因为基因和蛋白质序列的不同而有差异
软件分析结果只是预测的结果
在序列变异解读中应用应该慎重
不建议仅仅使用这些预测结果
为唯一证据来进行临床判断
如表所示
显示了一些序列变异解读的生物信息学软件
常用的错义变异解读工具有
PolyPhen-2 SIFT和MutationTaster
接下来我们将就这三个软件进行简单的介绍
首先我们需要获得
基因或其编码蛋白的一些相关信息
以便我们开展后面的预测分析
在基因数据库界面
我们可以看到基因的转录本的ENST号
以及基因编码蛋白的ENSP号
和NP号
而对于具有多条转录本的情况
我们应该选择较长的转录本
或者具有临床相关性的转录本
接下来我们介绍PolyPhen-2软件的使用
PolyPhen-2用于预测氨基酸替换
对人蛋白质结构和功能可能影响的工具
它是基于序列 系统发生
和结构信息对替换进行预测
下图为应用PolyPhen-2进行预测的分析界面
通过输入编码蛋白的NP号
以及发生改变的氨基酸位置 发生改变前的
参考氨基酸以及发生改变后的氨基酸
并按照自己的要求对变异预测进行命名
进行预测分析后
可以得到相关的预测结果
点击如图的View即可查看
PolyPhen-2的预测结果
PolyPhen-2显示的预测结果一般分两种模型
即HumVar和HumDiv两种
通常我们用于研究孟德尔遗传病选择
HumVar模型
其预测结果分为三类
即极可能致病的 可能致病的以及良性
还提供有害的概率
以及其预测的特异度和灵敏度
SIFT软件
SIFT软件是预测氨基酸替换是否影响功能
它基于序列比对中氨基酸的保守性进行分析
SIFT软件有一些工具 即可对人和非人的物种
进行预测分析
我们可以通过蛋白改变情况进行预测
也可以通过SNP数据库提供的rs号
进行预测分析
在SIFT界面
我们同样可以看到PROVEAN的链接
PROVEAN是预测氨基酸替换和插入缺失变异
与SIFT的不同的是
它不光仅仅可以预测氨基酸替换
还可以预测插入缺失变异
PROVEAN同样可以提供
人的物种以及其他物种的相关预测分析
SIFT软件预测
可以通过输入
按照其要求输入特定格式的变异情况
即ENSP号以及氨基酸变异
提交后可以看到其结果
其结果分为两类
即致病的以及可容忍的(不致病的)
其界值为0.05
MutationTaster软件
可以预测多种类型的变异
包括碱基替换 插入缺失以及插入或缺失
使用MutationTaster进行预测
首先需要按照其要求输入特定的条件
如输入基因
选择其参考转录本
以及核苷酸编号的参考情况
如CDS 以及勾选显示变异周围的序列情况
输入核苷酸改变的位置
以及发生改变的碱基 输入预测名字
即可获得相应的预测结果
其预测结果分为两类
即致病的以及多态
可以显示基因变异的相关命名情况
以及参考转录本发生改变的情况
同样还可以显示其氨基酸序列改变情况等
大规模人群中的变异
发生情况可以通过人群数据库获得
常用的人群数据库
包括SNP数据库以及ExAC数据库等
ExAC数据库
ExAC数据库中的变异信息是通过对
6万多个独立个体进行外显子组测序分析获得的
同时也是多种疾病和群体遗传学研究中的
一部分
库中不包括儿科疾病患者及其相关人群的信息
通过输入基因名
对基因的相关变异情况进行查询
可以显示各变异在人群中的频率
如图所示界面 有关变异的情况
左侧还包括了SIFT和PolyPhen
软件的预测结果
右侧显示了其人群频率情况
EVS数据库的变异信息是通过对几个欧洲
和非洲裔大规模人群的全外显子组测序获得
EVS数据库的查询 可包括以下五种方式
如使用基因名进行查询
可以直接输入基因的缩写名
对其相关变异进行查询
EVS数据库将显示该基因变异的相关情况
以及其在人群中的相关频率
gnomAD数据库
数据库中的变异是整合和协调来自
各大型测序项目的外显子组测序
和基因组测序的数据
包括来自不相关个体的12万多个外显子序列
以及15000多个全基因组序列
作为各种特异性疾病和群体遗传研究的一部分
gnomAD数据库的查询
与ExAC数据库的查询类似
同样是输入相关基因名进行查询
可以得到该基因的变异情况
以及其人群中的频率
与ExAC相比
gnomAD数据库中还包含基因组的相关信息
如图所示
界面为一个变异在gnomAD数据库中收录的情况
右侧显示该变异在人群中的频率
我们上面提及gnomAD数据库 既包括
外显子组测序的数据
也包括全基因组测序的数据
然而该变异仅仅只有外显子组测序的数据
HGMD数据库 即人类基因突变数据库
数据库中的变异注释有相关发表文献链接
但库中的内容多需付费
用于专业版进行查询
仅可免费访问公共版
人类基因突变数据库的查询
既可使用基因名或者OMIM号查询
也可按照基因突变的类型进行查询
使用HGMD数据库 首先必须进行注册
而仅仅可以免费访问公共版
公共版的访问需要使用非盈利性
或者学术机构的邮箱进行注册
注册后登录HGMD的界面
即可对相关的基因突变进行查询
通过输入基因名对HGMD数据库收录的
所有基因突变进行查询
点击相应变异类型的Get mutations链接
即可到达该突变的相关界面
界面可以显示各基因突变的情况
右侧还有基因突变
报道的相关文献链接
点击相关文献链接即可到达PubMed的界面
好的
这部分的内容我们就学到这了
-第1节 医学实验中心基本情况
-第2节 研究人员进室流程和管理制度
-第3节 实验实施
--实验实施
-第4节 实验总结
-- 实验总结
-第一章 课件
--第一章 课件
-章节作业
-第1节 流式细胞仪的工作原理
-第2节 流式细胞仪的数据显示及分析
-第3节 流式细胞仪的应用
--流式细胞仪的应用
-第二章 课件
--第二章 课件
-章节作业
-第1节 免疫组化
--免疫组化
-第三章 课件
--第三章 课件
-章节作业
-第1节 细胞培养的基本概念
-第2节 细胞培养的基本条件
-第3节 细胞培养的基本方法
-第4节 干细胞治疗
--干细胞治疗
-第四章 课件
--第四章 课件
-章节作业
-第1节 分子生物学基本概念
-第2节 分子生物学实验技能培训
-第3节 分子生物学在临床研究中的应用
-第五章 课件
--第五章 课件
-章节作业
-第1节 药物基因组学的临床应用
-第2节 药物基因组学的实验模拟
-第六章 课件
--第六章 课件
-章节作业
-第1节 体内药物分析技术——样本处理技术
-第2节 体内药物分析技术——分析方法学验证
-第3节 体内药物分析技术——样本检测技术
-第七章 课件
--第七章 课件
-章节作业
-第1节 NCBI相关资源
--NCBI相关资源
-第2节 基因及变异命名规范
-第3节 基因变异致病性预测相关分析
-第4节 蛋白质序列及结构分析
-第八章 课件
--第八章 课件
-章节作业