文章

单细胞转录组长读长测序揭示癌症研究中难以获得的重要见解

2025-09-01     来源:怡美通德微信公众号     点击次数:110

癌症研究中,在异构体水平上对单细胞转录组进行特征分析的能力至关重要。常规单细胞转录组学中,短读长序列仅能捕获基因水平的信息。

Iso-Seq® 技术(Isoform Sequencing,PacBio® HiFi 测序的全长 RNA 测序技术)已被证实可推动癌症研究,该技术能在单细胞水平上对异构体进行明确的特征分析,而其他长读长技术则缺乏识别独特分子标识符(UMI)和细胞条形码(CBC)所需的准确性。PacBio Kinnex™ RNA 试剂盒以 MAS-Seq 技术为基础(该技术可将 cDNA 等扩增子连接成更长的片段),进一步提升了 HiFi 长读长测序仪的测序通量。对连接分子进行测序所产生的 HiFi 读长序列,可通过生物信息学方法拆分,从而获取原始的 cDNA 序列。

本文重点介绍几篇将 Iso-Seq 技术应用于癌症研究的文献,阐释单细胞 Iso-Seq 数据如何用于检测融合基因、识别可能作为疫苗候选新表位的新型异构体,以及追溯克隆进化过程。

检测融合基因

短读长测序可轻松识别融合连接点,但由于读长不足,无法完整解析单个融合转录本的结构。Dondi et al.(2023)将 Kinnex 连接法的早期版本应用于卵巢癌样本的单细胞全长 RNA 测序中。在他们的 Kinnex 测序数据中,鉴定出了一种患者特异性的 IGFBP2::TESPA1 融合基因;而在匹配的短读长测序数据中,该融合基因此前被误判为 TESPA1 基因高表达,因为短读长测序仅捕获到了该融合基因的 3' 端融合部分,即 TESPA1 基因部分。
 

图1. 对新鲜处理的高级别浆液性卵巢癌(HGSOC)大网膜转移灶,以及与患者匹配的无肿瘤远端大网膜组织活检样本进行的单细胞 RNA 短读长及长读长测序。


图2. 长读长单细胞 RNA 测序鉴定出肿瘤特异性融合基因 IGF2BP2::TESPA1,而短读长数据将该基因误判为 TESPA1 过表达。

肿瘤新抗原发现 - 新型异构体发现在转化研究中的应用

剪接失调(splicing dysregulation)是大多数癌症中普遍存在的特征,但人们对异常剪接的整体情况仍知之甚少。Li et al.(2024)的研究中,研究人员通过单细胞 RNA 测序技术研究结直肠癌(colorectal cancer, CRC),在肿瘤上皮细胞中鉴定出 394 种失调的转录本结构。该研究同时发现了肿瘤特异性及异构体特异性的 RNA 编辑事件,通过质谱验证筛选出具有肿瘤特异性的新型异构体。研究人员开发了一种算法,依据人类白细胞抗原(HLA)结合亲和力对这些潜在的新抗原进行排序。借助这一方法,他们发现了 4 种新型肿瘤特异性异构体,这些异构体对广大结直肠癌患者群体均具有较强的 HLA 结合亲和力,有望成为癌症疫苗的候选分子。

图3. 工作流程示意图:12 例结直肠癌(CRC)患者肿瘤样本与正常样本的长读长(PacBio)及短读长(Illumina)单细胞 RNA 测序(scRNA-seq)。


 

图4. 上图为用于癌症疫苗研发的、基于新型肿瘤特异性反复出现的转录本异构体的新表位鉴定流程;下图展示22 个新表位针对 TCGA-COAD 患者 HLA 等位基因的亲和力及排序。

追踪克隆进化

常规短读长单细胞 RNA 测序(short-read single-cell RNA-Seq)仅能覆盖转录本的 5' 端或 3' 端,因此在基于肿瘤体细胞突变确定细胞基因型的能力上存在局限。相比之下,单细胞 Iso-Seq 技术能够对来自多个单细胞平台的全长 cDNA 进行测序。

Black et al.(2024)将PacBio Kinnex单细胞RNA试剂盒应用于由 10x Genomics Chromium平台生成的单细胞 cDNA 中,该cDNA来源于携带BTK耐药突变的慢性淋巴细胞白血病(CLL)样本,研究表明应用长读长测序结果在基因分型能力方面有显著提升。对于在≥1% 的细胞中存在的变异位点,Illumina短读长测序仅覆盖了其中的7.61%,而Kinnex数据则覆盖了18.59%的此类变异位点。这一结果进而帮助优化了其中一个样本的亚克隆结构,清晰呈现出两个不同的突变亚克隆 —— 这两个亚克隆此前被错误地识别为单一亚克隆。

图5. A) 从批量 DNA 测序数据中识别出的亚克隆结构。慢性淋巴细胞白血病(CLL)相关基因突变会标注在其所在的亚克隆下方。B) 患复发样本的基因型矩阵图有助于完善原始亚克隆结构。绿色表示在该细胞内特定变异位点的scRNA-seq中仅存在参考等位基因;红色表示该细胞内至少有一个scRNA-seq测序读数包含体细胞变异等位基因。颜色越深,表明支持该基因型的reads数量越多。为提高区分亚克隆的分辨率,仅纳入了CLL相关基因突变。C) 经完善的亚克隆结构显示,包含BTK基因 c.1543T>A突变的亚克隆,与包含BTK基因c.1544G>C 突变和DICER1基因突变的亚克隆相互独立。

Wedemeyer et al.(2024)研究发现,当使用Kinnex单细胞RNA试剂盒对一株携带已知单核苷酸变异(PIK3CA:c.3139C>T)的患者来源成纤维细胞进行测序时,长读长测序在15.3%的细胞中覆盖了该变异位点;相比之下,使用Illumina短读长测序时,仅在1.2%的细胞中覆盖了该变异位点。此外,通过将突变型细胞与野生型细胞进行对比,研究人员发现了通常与上皮-间质转化(epithelial-mesenchymal transition,EMT)相关的独特基因表达模式及信号通路,这一发现为理解为何仅存在于少量细胞群体中的变异,能导致巨脑-毛细血管畸形综合征(MCAP)患者出现显著临床表型提供了思路。


图6. 上图Chord diagram显示,在野生型 PIK3CA(PIK3CAwt)成纤维细胞与未分化角质形成细胞之间存在Notch介导的信号传导,而在突变型PIK3CA(PIK3CAmut)成纤维细胞与未分化角质形成细胞之间则无此信号传导。下图展示野生和突变型细胞富集前10的Gene Ontology BP点图。

小结

单细胞转录组长读长测序(Iso-Seq 技术),能够揭示癌症研究中难以通过短读长测序获得的重要见解。单细胞 Iso-Seq技术还可结合 Kinnex 试剂盒应用,提高测序通量,用于检测新型异构体、融合转录本和新抗原,同时对单细胞进行基因分型并追踪克隆群体,最终获得对癌症转录组更全面的认识。
 


北京怡美通德科技发展有限公司是10x Genomics和PacBio的官方授权代理商,代理美国10x Genomics公司生产的Chromium单细胞测序建库系列产品、Visium空间转录组系列产品以及Xenium组织空间原位分析系统;美国PacBio公司生产的Vega桌面式三代测序系统,提供仪器配套的试剂耗材供货、产品演示实验、产品安装、使用培训以及售前售后技术咨询、生物信息学分析等相关技术服务。

如果您想了解更多关于10x Genomics和PacBio的信息,欢迎扫描下方二维码或点击文末左下角的“阅读原文”填写信息,我们会在第一时间与您联系!

参考文章:

1.Black et al. (2024). Long-read single-cell RNA sequencing enables the study of cancer subclone specific genotype and phenotype in chronic lymphocytic leukemia. BioRxiv. https://doi.org/10.1101/2024.03.15.585298

2.Dondi, A., Lischetti, U., et al. (2023). Detection of isoforms and genomic alterations by high-throughput full-length single-cell RNA sequencing in ovarian cancer. Nature Communications, 14(1), 7780. https://doi.org/10.1038/s41467-023-43387-9

3.Li, Z., Zhang, B., Chan, J. J., et al. (2024). An isoform resolution transcriptomic atlas of colorectal cancer from long-read single-cell sequencing. Cell Genomics, 4(9). https://doi.org/10.1016/j.xgen.2024.100641

4.Wedemeyer, M. A., et al. (2024). Defining the transcriptome of PIK3CA-altered cells in a human capillary malformation using single cell long-read sequencing. Scientific Reports, 14(1), 25440. https://doi.org/10.1038/s41598-024-72167-8

相关文章 更多 >