1.表达谱分析:通过芯片杂交信号的荧光强弱来得到mRNA,miRNA的表达量或者CpG位点的甲基化程度,利用统计学方法来筛选差异位点,最后借助功能分析来寻找可能的生物学解释。
A:基本分析流程
B:部分结果展示
Box plot 图:是利用数据中的五个
统计量:最小值、第一四分位数(25%)、
中位数(50%)、第三四分位数(75%)和最大值来描述数据的一种方法,它也可以粗略地看出数据是否具有有对称性,分布的分散程度等信息。
Pca 图:通过降维度的方式来看样本间的相似程度,不同的颜色表示不同分组的样本。样本间距离越近表示样本基因的表达趋势约接近。
火山图:两条绿色直线对应fold change 2倍差异,绿色横线对应P=0.05,红色是差异基因区域。
非监督聚类图:纵列表示样本横列表示基因,信号值的强度用色阶表示,进化树表示基因或者样本的相似程度。
自组织映射聚类SOM 分析:将变化趋势一致的基因聚类,横坐标是不同阶段,每条线表示一个基因的表达趋势。
Go 关系图
Pathway 图
网络关系图
2.家系连锁分析:适用于单基因病研究,连锁分析通过分析减数分裂过程中染色体重组的情况,判断snp位点与疾病位点之间是否连锁,以及连锁的紧密程度(lod score)。然后利用阳性区域推断单倍型来明确家系中DNA的传递关系,找到交换发生的位置进一步缩小候选基因的范围。
A:基本分析流程
B:部分结果展示
Lod plot 图:横坐标是染色体位置纵坐标是lod score值
单倍型图:可以从图中看到病人共享相同的单倍型
3.GWAS分析:针对复杂疾病研究,通过大样本量和全基因组的tagSNP基因分型,借助统计学方法来控制人群分层等干扰因素的影响,进而识别和疾病显著关联的SNP位点,找寻潜在的易感基因。
A:基本分析流程
B:部分结果展示
利用PCA分析人群分层情况剔除异常样本
Q-Q plot反应样本群的分层情况,越接近1人群分层情况影响越小
Manhattan plot反映统计检验后p值在基因组上的分布情况
显著位点区域放大图
LD plot 根据LD连锁关系得到block区域,将多SNP位点与候选区域进行关联展示
4.CNV分析:针对疾病研究,通过包含CNV探针的SNP芯片来检测拷贝数变异,利用统计学方法来优化变异区域的边界,进而识别和研究关联的CNV区域,找寻潜在的易感基因。
A:基本分析流程
B:部分结果展示
CNV区域的识别
CNV区域的染色体分布
CNVR区域的合并
疾病相关的CNV区域