遗传变异可以通过改变调控元件来改变基因表达,从而影响复杂性状。然而,影响猪调控元件活性的遗传变异很大程度上未知,这些变异在多大程度上影响基因表达和助力理解复杂表型仍不清楚。
2024年3月29日,江西农业大学黄路生院士团队利用292只猪肝脏的组蛋白H3第27位赖氨酸乙酰化(H3K27ac)的ChIP-seq数据注释了90991个高质量调控元件。结合基因组重测序和RNA-seq数据,共鉴定出28425个H3K27ac数量性状位点(acQTL)和12250个表达数量性状位点(eQTL)。通过等位基因不平衡分析在独立数据集中验证了两个因果性acQTL变异。研究观察到基因表达和H3K27ac之间存在大量共有遗传调控,尤其是在启动子区域。研究人员推断46%的H3K27ac与基因表达表现出伴随关系而非因果关系。通过整合GWAS、eQTL、acQTL和转录因子结合预测,进一步证明了它们通过代谢物dulcitol、磷脂酰胆碱(PC)(16:0/16:0)和已发表的表型,在鉴定可能的因果变异和基因以及发现亚阈值GWAS位点方面的应用。研究深入了解调控元件与基因表达之间的关系,以及剖析表型分子机制的遗传基础。相关研究成果以“Omics-based construction of regulatory variants can be applied to help decipher pig liver-related traits”为题发表在《Commun Biology》期刊上。

研究思路

结果图形
(1)调控元件的描述和注释
通过染色质免疫沉淀测序(ChIP-seq)技术获得了猪肝脏中H3K27ac的分布情况。将reads比对到猪的参考基因组(Sscrofa 11.1)。通过peaks鉴定和过滤程序,确定了每个样本中平均77947个H3K27ac峰值。所有峰值进一步合并成至少在三个样本中出现的90991个共有峰值。在转录起始位点(TSS)1 kb范围内的共有峰值定义为启动子(16544个),其他的被定义为增强子(74447个)。41%的H3K27ac峰值位于内含子中,其中近三分之一是第一个内含子。23%和18%的峰值分布在远端间基因区域和启动子区域。近一半的峰值位于TSS附近10~100 kb范围内。通过与之前研究中的H3K27ac峰值比较,验证了这些峰值的真实性。结果显示本研究中的30169个H3K27ac峰值覆盖了Kern等人研究中98.6%的峰值。此外,研究者还分析了每个共有峰值的出现百分比与其丰度(以FPM衡量)之间的相关性,发现峰值的出现百分比与其丰度显著正相关。同时还鉴定了调控可能决定细胞和组织身份的基因中起重要作用的超增强子。本研究中每个样本平均鉴定了1090个超级增强子,覆盖宽度平均为47.2 kb。

图1:H3K27ac的综合分析。
a. H3K27ac峰宽分布:H3K27ac峰的平均宽度为691 bp。红色虚线表示平均值。
b. H3K27ac共有峰:共有峰分为启动子或增强子。启动子位于基因转录起始位点附近,增强子位于基因内部或远端调控区域。
c. 共有峰丰度与百分比相关性:共有峰的平均每M片段数(FPM,类似于RNA中的TPM)与其在个体中出现的百分比之间的相关性。每个峰用一个蓝色点表示,红色实线为点的拟合。右上角的图表通过平均值±3倍标准差(sd)去除了异常值。相关性和显著性通过斯皮尔曼相关性计算。
d. 增强子或启动子的比例变化:随着共有峰出现的百分比变化,增强子或启动子的比例也会发生变化。
e. 代表性共有超级增强子表征:展示了一种覆盖脂质代谢相关基因LDLR的代表性共有超级增强子。x轴表示基因组位点,y轴表示每20bp bin的平均reads深度(以M计)。Input轨迹为阴性对照。透明的橙色矩形高亮显示共有超级增强子范围。基因表达丰度(TPM)显示在符号下方。
f. 增强子RNA(eRNAs)的外显子数量:比较了多聚腺苷酸化的增强子RNA(eRNAs)与参考注释中基因的外显子数量。
(2)鉴定与肝脏H3K27ac相关的遗传变异
图2:acQTLs的表征和转录因子结合分析
(3)eQTL的鉴定与表征
图3:H3K27ac与基因表达的共有遗传和因果关系。
(4)鉴定代谢相关分子表型和已发表的 GWAS 位点的功能调控元件、基因和推定的因果变异
图4:dulcitol相关候选因果变异、调控元件和靶基因的鉴定
图5:对已发表的平均红细胞血红蛋白浓度(MCHC)的全基因组关联研究(GWAS)结果的功能性变异、基因和调控元件的优先级排序
参考文献:
Ling Z, Li J, Jiang T, Zhang Z, Zhu Y, Zhou Z, Yang J, Tong X, Yang B, Huang L. Omics-based construction of regulatory variants can be applied to help decipher pig liver-related traits. Commun Biol. 2024 Mar 29;7(1):381. pii: 10.1038/s42003-024-06050-7. doi: 10.1038/s42003-024-06050-7. PubMed PMID: 38553586.