当前课程知识点:生殖医学研究锦囊--从基础到临床 > 9.生殖医学相关数据库使用技巧 > 生殖组学数据挖掘 > 生殖组学数据挖掘
返回《生殖医学研究锦囊--从基础到临床》慕课在线视频课程列表
那么我们开始第二个问题的解答
其实这个问题中所涉及的组学数据
与上一小节所讲到的大数据有相似之处
都需要再分析再挖掘
有的时候
导师会给你一份基因表达矩阵或者差异基因列表
有的时候呢
导师会把整个结题报告拷给你
建议你要所有测序数据及报告
这样你就可以认真仔细的阅读其中每个细节
借此了解数据的来龙去脉
与基本分析方法过程
不管怎么样
这些数据再分析的思路是一致的
根据组学结果筛选获得差异基因
重点结合富集分析
筛选关键通路
解释你的生物学故事
那么下面我介绍几个非常实用的在线注释与富集分析网站
第一个就是WebGestalt是华人科学家创建的在线分析平台
既能进行ORA分析
也能进行GSEA分析
网络拓扑结构分析NTA
磷酸化分析等
操作简单快捷有专门的的pdf教程
以差异基因的ORA富集分析为例
先选择物种 数据库
把差异基因复制粘贴到这个红色框里
submit即可
结果如右图所示
这是我自己的一份数据
看差异基因主要富集在类固醇合成等通路
鼠标点击类固醇对应的蓝色柱
即可显示对应的差异基因如Cyp51等
第二种分析是GSEA分析
这个的关键也是copy数据进来
红框内需要两列数据
一列是差异基因名字
一列是差异基因权重评分如差异倍数等
Submit之后结果如图所示
上调基因富集见蓝色柱
下调基因富集信息见橙黄色柱
第二个富集分析在线资源为Enrichr
这个数据库可以直接对BED文件进行分析
也可以是差异基因列表
而且这个平台
富集种类超级丰富
如图所示有转录层面 通路层面 疾病 药物等等
第三个平台为metascape
每个月更新一次
它既能进行基因注释还能进行网络富集分析
在红框内输入基因列表
会自动识别基因ID类型
点submit然后选择物种
点击expression analysis即可
结果如图所示
富集通路按富集程度进行排序
可以下载成excel表格文件或者ppt文件
网页内容很丰富
这里仅截取一部分用于展示
下面还有大量网络图
第四个为经典的DAVID数据库
网络上有大量教程
也非常简单
时间关系不在此详细介绍
接下来这个是一个软件
可以安装到自己电脑上的好工具
Cytoscape软件
目前已更新到3.8版本
功能十分强大
软件可以安装大量App
CluegGo就是其中的一个App之一
目前已下载17万次
获得五星级好评
利用这个工具
你可以做出很漂亮的网络图
大家有兴趣可以下载安装学习一下
介绍完基于差异基因的富集分析
我们继续探索基因组学数据分析挖掘的大平台
今天重点介绍networkanayst这个数据库
这个数据库既可以对差异基因进行注释分析
也可以进行多批次数据的meta分析
还可对基因表达矩阵进行重新分析
或者针对进行原始测序数据进行从头再分析
非常强大
我们今天重点介绍基因表达矩阵的再分析
第一步是最关键的一步
就是按格式要求整理数据之后upload data
数据格式是固定的
如问号所提示的一样
重点是表头信息
比如#NAME #CLASS中英文格式等都不要修改
当你处理好数据之后另存为TXT格式
然后选择文件进行上传
如果submit成功会显示这样的界面
继续点击Proceed
就会进入下一步
下一步是质控环节
会出现各种质控的数据与图
比如PCAplot
通过该图我们可以看到两组分类效果较好
接下来为数据标准化环节
参数一般默认即可
也可以尝试按需修改对数据进行各种转换剔除
Submit之后也会得到系列聚类图
如PCAplot变的更聚堆
说明分类效果更好
Proceed之后便是差异基因分析
有三种不同的算法
建议大家都尝试一下
因为三种算法各有千秋
后续差异基因可以取交集
下面分组信息与如何比较就很简单了
选择完点击submit会弹出OK的对话框
然后会出现所有差异基因列表
可以修改差异倍数及P值等
数据可以直接下载
也可以按不同指标排序显示
如图所示
点击基因最后一列这个小图标
可以显示差异基因在两组中的表达图
接下来是基因富集分析
如前所述有两大模块
第一个是基于差异基因的分析ORA分析
火山图等
第二大模块是基于所有基因的全局分析如GSEA分析
点击之后可以获得各种漂亮的图
每个图可以按数据库进行调整配色并导出
根据经验GSEA这种基于全局的基因分析方法
相对能比较真实的反应整体生物学变化过程
因此建议大家学习一下GSEA分析
这个有软件版
网上有大量视频教程
手把手教不难
软件界面很简单准备好几个数据文件
导入即可分析
获得右图所示结果
可以显著提升文章档次
希望大家课后多多尝试
如果大家遇到原始测序数据
如SRA数据库下载的数据
就需要用到Rawdata分析模块
因时间关系在此不过多展开
另外向大家推荐另一个原始测序数据在线分析平台
BioJupies
其上传数据速度较快
效率较高
但是提醒大家一点
设计人的原始数据上传需遵守国家遗传办的相关法律法规
如果大家想深入学习原始数据分析
建议大家掌握测序原理
并考虑掌握一门机器语言如Linux操作指令
在此强烈推荐R语言
既能分析也能作图非常实用
为此给大家推荐一个理想的全面学习生信分析的网站《生信技能树》
其对应微信公众号如图所示
几乎每天都在更新教程
涉及几乎所有组学数据挖掘与分析
另外还有很多教程
可以从简书 知乎 CSDN等网站检索获得
希望各位同学多去探索
相信通过你的探索
你能很好的利用自己手头的数据
获得你按兴趣的基因或通路
讲述自己想讲的故事
下一小节我们重点针对单一基因继续讲解
-辅助生殖技术(一)——定义及分类
-课件
-作业题
-生殖样本出入库管理
-生殖样本处理和保存
-课件
-作业题
-全身性基因敲除小鼠的构建
-条件性基因巧除小鼠的制备及应用
-课件
-作业题
-卵巢培养与应用
--卵巢培养与应用
-颗粒细胞培养与应用
-课件
-作业题
-减数分裂重组
--减数分裂重组
-课件
-作业题
-体外受精和早期胚胎培养技巧
-课件
-作业题
-人类胎盘早期发育滋养层细胞实验模型
-课件
-作业题
-生殖相关流式细胞分析和分选
-流式分析和分选在生殖医学研究中的应用
-课件
-作业题
-生殖大数据检索
--生殖大数据检索
-生殖组学数据挖掘
--生殖组学数据挖掘
-生殖相关基因探秘
--生殖相关基因探秘
-课件
-作业题
-糖尿病对生育的影响
-甲状腺功能异常对生育的影响
-课件
-作业题
-第1节 多囊卵巢综合征的遗传与代谢
-第2节 多囊卵巢综合征的模式动物
-作业题
-课件
-第1节 早发性卵巢功能不全的遗传学研究策略及进展(一)
-第2节 早发性卵巢功能不全的遗传学研究策略及进展(二)
-课件
-作业题
-子宫内膜疾病研究进展
-课件
-作业题
-复发性流产的原因
--复发性流产的原因
-复发性流产的诊疗
--复发性流产的诊疗
-课件
-作业题
-腔镜在不孕症诊疗中的应用
-作业题
-课件
-超声在辅助生殖领域中的应用
-课件
-作业题
-人工授精概述及注意事项
-人工授精研究热点及研究展望
-作业题
-课件
-试管婴儿的取卵移植术——取卵
-试管婴儿的取卵移植术——胚胎移植
-课件
-作业题
-“第三代试管婴儿”概述
-“第三代试管婴儿”遗传学分析与案例
-课件
-作业题
-第四代试管婴儿-线粒体置换术(1)
-第四代试管婴儿-线粒体置换术(2)
-课件
-作业题
-遗传咨询(一)
--遗传咨询(一)
-遗传咨询(二)
--遗传咨询(二)
-作业题
-课件
-如何提出一个好的临床研究问题
-课件
-提出临床问题和检索已有证据
-提出研究方案和得出研究结论
-课件
-作业题
-辅助生殖出生队列研究(一)
-辅助生殖出生队列研究(二)
-课件
-作业题