| 基础概念 |
转录组(广义) |
特定条件下,细胞 / 组织 / 个体产生的所有转录产物集合,含 mRNA、rRNA、tRNA 及非编码 RNA |
覆盖所有 RNA 类型,范围广 |
全面分析样本 RNA 组成时使用 |
| 基础概念 |
转录组(狭义) |
特定条件下,细胞 / 组织 / 个体产生的所有 mRNA 集合 |
仅含 mRNA,实际研究中默认指代此类别 |
基因表达水平分析的核心对象 |
| 基础概念 |
转录本 |
从基因转录生成的所有 RNA 分子,分为可翻译蛋白质的 mRNA 和不可翻译的非编码 RNA(ncRNA) |
按 “能否翻译为蛋白质” 分类,ncRNA 含 rRNA、tRNA 等,自身具备功能 |
转录本结构分析、功能注释 |
| 基础概念 |
pre-mRNA |
DNA 转录生成的初始 RNA 产物,含 UTRs、ORF 及内含子序列 |
未经过加工,含内含子,无法直接翻译为蛋白质 |
转录后加工机制研究 |
| 基础概念 |
成熟 mRNA |
pre-mRNA 去除内含子后,添加 5’帽子结构和 3’polyA 尾形成的 RNA 分子 |
含 5’帽子 + 3’polyA 尾,可被核糖体翻译,结构稳定 |
蛋白质合成模板、基因表达定量 |
| 技术参数 |
测序深度(Sequencing depth) |
样本中每个碱基被测序的平均次数,衡量测序数据量的核心参数 |
计算方式:总有效数据量 / 目标序列(基因组 / 转录组)大小,单位用 “X” 表示(如 100X) |
评估检测灵敏度,深度越高越易捕获低表达转录本 |
| 技术参数 |
测序覆盖度(Coverage) |
被测序到的碱基占目标序列(基因组 / 转录组)总碱基数的比率 |
计算方式:被覆盖碱基数 / 目标序列总碱基数 ×100%,用百分比表示(如 90%) |
评估测序完整性,覆盖度越高越全面反映目标序列 |
| 技术参数 |
reads |
RNA-seq 测序的直接结果,指单条独立的 RNA 序列片段 |
为短序列片段,需与参考基因组 / 转录组比对后才能用于后续分析 |
基因表达量计算、转录本拼接 |
| 技术参数 |
adapter(接头序列) |
文库构建时添加到 RNA 片段两端的短序列,具有类似引物的功能 |
人工添加的辅助序列,测序后需通过生物信息学手段去除,避免干扰分析 |
协助测序反应启动,保障测序顺利进行 |