基于三代测序的全长转录组解决方案
基于三代测序的全长转录组解决方案
转录组研究是理解生物机体功能的一个重要途径。传统二代转录组测序无法直接获得单个RNA分子由5ˊ到3ˊ的全部序列。基于PacBio三代测序平台的转录组研究,无需打断,直接读取反转录的全长cDNA,能够有效的获取高质量的单个RNA分子的全部序列,准确辨别二代测序无法识别的同源异构体(isoform)、同源基因、超家族基因或等位基因表达的转录本。
产品优势
有效地绘制复杂基因组的转录图谱,作为基因功能研究的参考序列;
绘制准确、全面的可变剪切图谱;
补充已注释基因组的基因注释结果;
研究复杂基因家族中不同基因的表达情况;
识别不同等位基因的表达的转录本,从基因表达水平揭示等位基因对生物性状的控制模式;
实验流程图
图1. 三代转录组测序实验流程图
案例解析
1. 人体20个组织和器官混合样本的三代全长转录组测序
将人体的20个组织和器官的RNA混合,在不打断、不扩增的条件进行PacBio测序[1]。结果显示1.5kb以下的RNA分子80%以上没有缺失,更长的RNA分子在5’端存在更大比率的缺失,但是大部分保留了完整的内含子结构;同时发现约14000个具有可变剪切的GENCODE基因。将转录本比对到Hg19,高可信度的比对结果能够与GENCODE注释结果高度吻合,但是有大于10%(是454测序的两倍以上,图2)的RNA支持以前没有被注释的基因内含子结构(图3)。
图3. 三代测序发现ACD基因新的剪切模式
2. 人胚胎干细胞二代和三代转录组测序
结合二代和三代转录组测序数据与专门设计的分析方法分析鉴定人胚胎干细胞中高可信度的isoform[2]。发现了2428个新的isoform,其中273个isoform来自216个新基因(图4,A)。选取胚胎干细胞中10个高表达的基因,分析其在人体16个组织与胚胎干细胞中的差异表达(图4,C),其中有8个新基因几乎只在胚胎干细胞中表达,另外2个新基因在不同组织中均有表达。对所有的新基因在不同组织中进行差异表达分析(图4,B),结果显示有68%的新基因在胚胎干细胞中存在特异性表达。
图4. 新基因与新基因在不同组织中的差异表达
参考文献
1. Donald, S. et al. A single-molecule long-read survey of the human transcriptome. Nature Biotechnology, 10, 1009-1014 (2013).
2. Kin, F. A. et al. Characterization of the human ESC transcriptome by hybrid sequencing. PNAS 11, E4821-E4830 (2013).
单位名称: |
详细地址:
中国湖北省武汉市东湖开发区高新大道666号
|
qq:
|
官网: |
联系电话: |
Email: |