文章

果蝇单细胞三维时空多组学图谱揭示细胞类型分化的全景关键调节因子

2025-09-26     来源:本站     点击次数:44

期刊:Cell
影响因子:45.5

主要技术:Stereo-seq、scRNA-seq、scATAC-seq

导语
多细胞生物的发育是一个高度复杂的过程,受到无数基因和通路在空间和时间上的严格调控。单细胞水平上基因表达的空间环境对于理解其生物学相关性至关重要,但在标准的单细胞测序过程中往往丢失。以前,我们利用了空间增强分辨率组学测序(Stereo-seq),一种基于测序和模式化 DNA 纳米球(DNB)阵列的空间转录组学平台,具有高空间分辨率和灵敏度,来解决这个问题。在这里,我们将对果蝇时空转录组的研究扩展到覆盖其从胚胎到蛹期的整个发育过程。我们使用 Stereo-seq 和 Spateo,这是一个用于分析单细胞多模态数据的计算流程,重建了单细胞空间分辨率的3D转录组。我们进一步将单细胞 Stereo-seq(scStereo-seq)数据与单细胞 RNA 测序(scRNA-seq)和单细胞转座酶可及染色质测序(scATAC-seq)数据相结合,创建了一个果蝇胚胎发生的多组学图谱。这个图谱包括超高通量空间背景下转录组和表观遗传信息,这使我们能够建立多组学细胞状态轨迹,并具有相关分子调控网络的时空动态。

为了从 3D 时空多组学的角度阐明各种细胞类型的发育调控,我们将中肠作为研究的模型。果蝇中肠通过不同类型的细胞和它们形成的区域发挥着多种功能,例如吸收营养的肠上皮细胞(ECs)、感知刺激和分泌激素的肠内分泌细胞(EEs)以及与金属离子稳态和胃酸分泌相关的铜细胞。在变态过程中,幼虫中肠细胞经历自噬依赖性细胞死亡,成年中肠细胞则从一群专门指定的干细胞中重新构成,这些干细胞被称为成年中肠祖细胞(AMPs)。然而,分化的时机和调控机制尚未完全阐明。我们重点关注发育中的中肠,从多组学角度研究了其细胞类型多样化、基因调控网络(GRNs)和区域化。通过多模态分析,我们确定了参与中肠发育细胞类型特异性调控的多个潜在因素,并通过突变分析验证了同源框(HD)转录因子(TF)exex 是铜细胞的关键调节因子。这个广泛的图谱提供了一个丰富的资源,并作为系统平台,用于研究具有超高通量时空分辨率的集成单细胞数据的果蝇发育。

主要技术
Stereo-seq、scRNA-seq、scATAC-seq

研究结果
1. 以单细胞分辨率重建从胚胎发育到变态阶段的果蝇三维空间转录组
为了构建果蝇发育的多组学图谱,我们首先通过收集发育阶段不同的样本,包括胚胎(0.5 到 2 小时间隔)、幼虫(L1 到 L3 的早期和晚期阶段)和蛹(P12 到 P72),来扩展和增强 3D 空间转录组(图 1A)。为了实现单细胞空间分辨率,我们对每个芯片进行了核染色和细胞分割,从而允许进行更精确的单细胞转录组分析。利用 Stereo-seq 平台,我们生成了 43 个胚胎、9 个幼虫和 5 个蛹样品的全器官单细胞空间转录组,总共有 3812505 个细胞单元(图 1A)。然后,我们将来自单个样本所有切片的细胞单元组合起来,基于基因表达谱和空间位置进行无监督聚类,并手动注释聚类。通过将空间位置和细胞注释与 Spateo 结合,我们实现了 3D 空间转录组来重建具有精细解剖形态的各种组织(图 1A)。基于这个全面的时空转录组数据集,我们生成了一个在已建立的 in situ 数据库中未报道空间表达模式的 338 个基因列表,并在 3D 中重建了它们的模式。因此,我们为果蝇样品生成了 3D 空间转录组,涵盖了从胚胎到蛹的整个发育阶段。
 


图 1

2. 果蝇胚胎发育的单细胞时空多组学图谱
为了用更深入的转录组和表观基因组信息来增强我们的单细胞三维空间转录组数据。我们在胚胎发生过程中,每隔2小时收集胚胎样本,并对其进行了基于滴液的scRNA-seq和scATAC-seq 测序(图 1A)。经过质量控制后,我们获得了238242个单细胞转录组,其中scRNA-seq的中位数为每个细胞6841个独特的分子标识符(UMIs)和 1707 个基因。我们还获得了240573个单细胞染色质可及性配置文件,其中 scATAC-seq 的中位数为每个细胞11772个片段。为了在幼虫阶段进行更全面的分析,我们从 NP1-Gal4 > UAS-mCherry-shRNA(其中 NP1-Gal4 是中肠 EC 特异性驱动器;shRNA,短发夹 RNA)的 L3 中肠中生成额外的控制 scRNA-seq 数据集。经过质量控制措施,我们获得了 17988 个单细胞转录组,其中中位数为每个细胞8846个UMIs和1795个基因。

在胚胎发生过程中收集的聚合 scRNA-seq 数据,我们首先进行了粗略的无监督聚类,并在 UMAP 图中生成了 45 个细胞簇。我们对这些簇进行了注释,并在三个级别(细胞类型-组织-胚层)对注释进行了分类(例如,胃盲囊-中肠-内胚层)(图 1A)。我们还对聚合scATAC-seq数据进行了粗略的无监督聚类。类似地,我们在 UMAP 图中产生了40个不同注释的簇(图 1A)。我们收集的数据涵盖了主要组织,这从每个组织所代表细胞的比例及其在发育阶段的变化中可以看出(图 1B)。

我们进一步通过亚聚类分析了组织细胞类型异质性。在scRNA-seq数据中,我们能够广泛地描述胚胎组织的细胞类型组成,包括稀有细胞类型。为了验证我们识别的亚簇,我们编制了一个在两个数据集中都识别出的常见细胞类型标记基因列表,并使用荧光原位杂交(FISH)验证了 3 个之前未报道的细胞类型标记基因的表达特异性(图 1C)。总之,我们生成了果蝇胚胎发生过程中 scStereo-seq、scRNA-seq 和 scATAC-seq 数据集的综合图谱。我们多组学数据的高粒度和时间连续性为细胞类型和发育年龄依赖的这些多组学数据整合打开了可能性。

3.多组学数据集成与构建组织分化轨迹
为了整合 scStereo-seq 和 scRNA-seq 数据,我们使用 NovoSpaRc 选择推断发育年龄差异为 1 小时的细胞进行整合。为了评估这种整合,我们选择了 9 个之前未表征的组织特异性基因,并使用 FISH 建立了它们表达模式的基准。我们发现,与仅使用 scStereo-seq 数据相比,整合数据明显减少了信号背景,增强了组织富集,并改善了空间模式,使其与 FISH 结果更加相似(图 1D )。

为了整合 scRNA-seq 和 scATAC-seq 数据,我们将 scATAC-seq 峰矩阵中的表达矩阵进行插补,并将其与 scRNA-seq 表达矩阵共嵌入同一UMAP 空间进行聚类(图 2A)。接下来,我们旨在将 scRNA-seq 和 scATAC-seq 数据中每个胚层的所有胚胎组织细胞状态组织成连续的发育轨迹。我们将 PhyloVelo29 应用于整合数据,为三个胚层建立了速度矢量场,并根据标记基因重新注释细胞簇以及它们沿速度轨迹的顺序。有了这些速度矢量,我们能够确定每个组织的分化轨迹,并将细胞类型按时间顺序排列(图 2B)。由于细胞类型分化的复杂性,细胞类型分化分支在 3D UMAP 空间中可视化效果更好。这些结果表明,我们的数据集可以作为探索细胞信号网络的系统框架。
 


图 2

4. 组织分化过程中细胞类型特异性的转录因子活性
为了解析沿组织分化轨迹由 TFs 指导的细胞类型特异性调控活动,我们仔细审查了我们的整合 scRNA-seq/scATAC-seq 数据。我们首先在 scATAC-seq 数据中识别了表现出细胞类型特异性活动的 TF 结合基序。我们进一步通过 scRNA-seq 数据中细胞类型标记基因的靶基因富集过滤候选 TF 列表。这种整合分析中重叠的候选 TF 代表了沿分化路径最活跃的细胞类型特异性 TF,包括既定的调节因子和尚未表征的潜在因子(图 2B)。


代表性的细胞类型特异性 TF 活动包括 GATAe 在 Malpighian 肾管中的基序、Rfx 在外胚层 PNS 和 CNS 中的基序和 sage 在唾液腺中的基序。在中胚层中,我们发现了 Mef2 在躯体肌肉中的基序富集、bin在内脏肌肉中的基序和 srp 在脂肪体和血细胞中的基序。内胚层表现出 GATA 家族 TFs grn、fkh 和 GATAe 的基序富集,这些 TF 调节晚期内胚层分化。我们还发现了几个之前未表征的 TF,它们在胚胎发生过程中具有潜在的时空特异性功能。TF crp 在多个组织中广泛表达,并已知在气管管道中指定终细胞,在中胚层脂肪体和血细胞中表现出潜在的调控功能(图 2C)。

为了进一步探索这些 TF 的空间调控子活动,我们将 SCENIC45 应用于整合 scStereo-seq/scRNA-seq 数据,揭示了 TF 调控子活性的空间模式与组织特异性基序富集分析一致(图 2D)。这些不太确定的 TF 的空间表达模式也通过伯克利果蝇基因组计划(BDGP)原位数据库进行了探查,所有这些 TF 在其推断功能的阶段都表现出弱信号或普遍表达模式。因此,我们的多组学数据为阐明这些 TF 的组织特异性调控作用提供了额外的证据。

随后,我们将 Pando47应用于整合 scRNA-seq/scATAC-seq 数据,深入探讨了识别的 TF 的详细调控子。在脂肪体和血细胞特异性调控子活动中,我们发现 crp 和 srp 位于同一 GRN 中。值得注意的是,我们发现 srp 和 crp 的调控子中的靶基因在早期脂肪体中 largely 相互重叠,并且这种重叠在中胚层组织(包括脂肪体和血细胞)的发育轨迹中增加(图 2E)。我们识别的 srp 的调控子与从早期脂肪体发育开始诱导脂肪细胞形成的作用一致,crp已知影响细胞生长和组织大小控制。我们的分析暗示 crp 和 srp 在脂肪体和血细胞发育过程中在同一个 GRN 中的作用越来越协调。与这一发现一致,FISH 结果证实了 crp 和 srp 表达细胞在晚期胚胎中的重叠(图 2F)。通过追踪组织分化轨迹,我们确定了在细胞类型分化过程中既定的和潜在的 TF,揭示了它们的组织特异性和协调的调控网络。

5. 通过时空细胞类型图谱研究组织分化的起源和模式
我们选择了脂肪体(哺乳动物肝脏的对应物)和前肠/后肠(哺乳动物胃/大肠的对应物,两者均为外胚层来源作为模型,并将它们的细胞类型与胚胎 scStereo-seq 样本进行对齐(图 3A 和 3B)。在各个发育阶段对组织细胞类型进行映射为在时空背景下检查分化起源的分布提供了独特的机遇。具体来说,具有集中分化起源(如干细胞)的组织将在发育的不同阶段产生空间上不同的细胞类型。相比之下,具有分散分化起源的组织将在不同阶段产生细胞类型的混合物(图 3C)。

以前的研究确定,脂肪体细胞起源于在整个组织中延伸的重复片段中的祖细胞。这表明脂肪体分化是分散的。为了验证这一点,我们使用邻域富集分析量化了脂肪体细胞类型的空间聚集水平,其中较高的分数表示更高的空间聚集水平。我们发现脂肪体的邻域富集水平较低。一致地,我们在 3D 模型中发现,脂肪体细胞类型的各个阶段分布分散且混合(图 3A)。这进一步得到了 scStereo-seq 数据中细胞单元 CytoTRACE 分数的空间分布的支持。CytoTRACE 利用可检测到的基因表达数量作为分化潜力的稳健指标。我们观察到脂肪体 scStereo-seq 数据中具有不同分化潜力的细胞相互混合(图 3D)。

另一方面,胚胎前肠/后肠分化起源的空间分布尚未完全绘制。以前的研究确定了成年肠道中消化道干细胞的生态位,其中在空间上定义的干细胞群分别产生成年前肠和后肠。也有报道称,胚胎后肠来自受多种信号通路调节的狭窄环状区域,这些通路控制后肠节段的生长。胚胎器官发生过程中肠道干细胞的数量和分化起源的位置仍然不清楚。我们的数据表明,前肠/后肠细胞类型具有显著更高的邻域富集。不同发育阶段和分化潜能的细胞类型也表现出不同的空间分布(图 3A 和 3D)。这些发现表明,胚胎前肠/后肠以集中方式分化,为胚胎前肠和后肠中存在成簇而不是分散的分化起源提供了证据。总之,组织细胞类型的空间映射为分析分化起源和识别潜在干细胞生态位提供了直观的视角。


图 3

6. 中枢神经系统形态测量学中的转录组动力学变化
我们在 7 个 scStereo-seq 样本中对中枢神经系统进行了形态学分析,这些样本的发育年龄跨度从 7 小时到 18 小时。在整个中枢神经系统发育过程中,我们观察到最高加速区域从 VNC 的后端(E8.84 之前)转移到大脑的前端(E13.79 之后)(图 3E)。VNC 中加速和曲率分数的下降可能与胚带收缩的完成有关,这表明早期发育过程中 VNC 的缩短主要依赖于后部细胞向前端迁移。相反,大脑前端区域加速和曲率分数的增加可能反映了晚期胚胎发生过程中大脑叶的细胞组织活动(图 3E)。正如预期中的中枢神经系统形态学一样,最高曲率和曲率分数的区域集中在 VNC 和大脑之间的弯曲关节处。形态学分析产生了一组与中枢神经系统形态计量动力学相关的时空表达变化基因。GO富集分析显示,与中枢神经系统形态计量变化相关的基因在细胞命运决定和模式形成中高度富集。值得注意的是,基因表达术语在早期阶段更富集,而信号转导术语在后期阶段更富集。这些观察结果表明,中枢神经系统形态发生过程与内在细胞命运决定密切相关。这得到了已知中枢神经系统发育调节因子(例如,mira、tll 和 toy)对中枢神经系统形态计量分数的贡献的进一步支持。此外,我们识别了多个未表征的因子。例如,编码未表征跨膜蛋白的 CG42394 的表达水平与加速呈负相关,而 lncRNA:CR30009 的表达水平与加速呈正相关(图 3F)。我们使用 FISH 验证了这些潜在调节因子在中枢神经系统中的特异性表达,并观察到 CG42394 表现出分段表达模式,而 lncRNA:CR30009 在中枢神经系统中更普遍地表达(图 3G)。值得注意的是,潜在形态计量调节因子列表中除了 lncRNA:CR30009(之前报道在胶质细胞中富集并共定位与胶质细胞标记基因 repo)之外,还包括多个长非编码 RNA(lncRNA)基因。在我们 scRNA-seq 数据中检查这些 lncRNA 基因时,我们观察到 lncRNA:CR30009 和 lncRNA:CR45388 的表达与神经母细胞和胶质母细胞标记基因的相关性最高。我们进一步使用 FISH 确认了它们与神经母细胞标记基因 mira 和 cas 的共定位(图 3H)。这些观察结果表明,这两个 lncRNA 基因可能通过调节神经母细胞来影响中枢神经系统细胞迁移。

因此,对中枢神经系统的形态计量分析提供了一个独特的视角来研究与细胞迁移相关的基因,并确定了已知和潜在的中枢神经系统细胞迁移调节因子。

7. 胚胎中肠细胞亚群的基因表达与空间布局
果蝇中肠是研究细胞分化调控机制广泛使用的模型。在胚胎中肠发育过程中,细胞类型的解剖形态和空间分布高度动态(图 4A)。在各种中肠细胞类型中,内分泌细胞(EEs)和肠上皮细胞(ECs)可以根据它们的标记基因和在成体中的生理功能进一步分类为多个亚类。然而,它们在胚胎和幼虫发育过程中的动态变化仍然不清楚。在这里,我们首先旨在将胚胎中肠细胞类型分类为亚类,并使用 Dynamo 描绘它们的分化动态。我们集中在中肠 scRNA-seq 数据上进行高分辨率亚聚类、注释和细胞状态谱系描述(图 4B)。这揭示了发育中中肠的 23 个细胞亚簇,并确定了 AMPs(由 esg 标记)、EEs(由 pros 标记并由特定内分泌基因表达区分)和 ECs(由消化酶和代谢相关基因标记和区分)的存在和分化路径(图 4C)。

已知一些果蝇中肠细胞类型占据不同的空间位置以执行其功能。例如,铜细胞专门位于中肠中部的小段中。为了探索中肠细胞亚簇的空间模式,我们通过从 scRNA-seq 到胚胎 scStereo-seq 数据的标签转移,将上述识别的亚簇映射到它们各自的空间位置(图 4D)。正如预期的那样,胃盲囊和铜细胞表现出高度的空间聚集(图 4D)。在标签转移的 scStereo-seq 3D 模型中,我们观察到了整个胚胎发生过程中细胞类型比例的动态变化,反映了这些细胞类型出现的时间不同。例如,EC(Try29F+)在大约 13 小时的发展中出现,而 EC(Acbp3+)直到大约 17 小时才形成(图 4E)。邻域富集分析表明,所有 EC 亚簇都表现出更高的聚集空间分布。在胚胎 scStereo-seq 样本中,我们观察到 Jon99Cii 和 Try29F 标记的 ECs 占据不同的空间位置,这表明这些负责产生消化酶的 ECs 倾向于占据中肠道的更后部位置(图 4F)。我们进一步在 BDGP 原位数据库中检查了具有高邻域富集分数的细胞亚簇标记基因的空间分布。

总结来说,我们对胚胎中肠中存在的各种细胞亚簇进行了分类和检查。我们的分析揭示了占据不同空间位置的 EC 亚簇,并追踪了它们在发育过程中的分布。


图4

8. 幼虫和蛹中肠细胞亚群的基因表达和空间布局
与胚胎相比,幼虫中肠的大小显著增长,并且在发育过程中显示出更多样化的肠细胞类型(图 4G )。值得注意的是,不同的 ECs 沿着中肠的前后轴紧密聚集,正如它们分布的 3D 模型中所观察到的。在成年中肠中,已经确定 EEs 可以被分类为几个亚簇,每个亚簇表达独特的肽激素组合,并占据中肠长度上的不同区域。类似地,在我们的幼虫 scStereo-seq 数据中,EEs 也可以被分类为表达各种肽激素的亚簇。这些 EE 亚簇也显示了不同的空间分布,类似于在成年中肠中观察到的(图 4H)。这些观察结果表明,EEs 的空间模式可能在幼虫中也会发生,类似于成年。


我们的蛹 scStereo-seq 样本的空间转录组数据为研究中肠变态的调控提供了宝贵的资源。检查蛹 scStereo-seq 样本,我们观察到蛹中肠分层为两层,我们在手动注释中将这两层标注为“中肠内层”和“中肠外层”(图 4I)。这些结构在 P24 阶段后退缩,并在 P72 阶段重新出现。之前的研究发现,在变态过程中,部分 AMPs 定位于围绕幼虫中肠的上皮层,该层退化成一种称为黄色体的结构。蛹 scStereo-seq 样本中观察到的中肠结构可能反映了这种分层。检查这两层的表达谱,我们观察到中肠内层群富集了金属硫蛋白和铁蛋白家族基因,而中肠外层群表达了多种抗菌通路基因(例如,DptA 和 Drsl2)。这些结果为中肠变态过程中基因调控的研究提供了线索。

总之,使用标签转移辅助的空间映射和注释揭示了空间上不同的幼虫和蛹中肠细胞类型及其在发育过程中的动态变化。

9. 中肠功能区的出现与空间分布
同时,区域的空间分布开始在同一时间点结晶,反映了成年中肠中观察到的空间顺序(从前到后为 R1 到 R5)(图 4J)。这表明晚期胚胎中肠表现出与其成年对应物相似的区域分隔。我们检查了已识别的胚胎中肠区域的标记基因的GO富集。例如,R1/R2 类区域在功能上富集于脂肪酸代谢;R3 类区域在功能上富集于离子运输和 pH 调节,这与该区域的酸性性质一致;R5 类区域在功能上富集于金属离子稳态。这些功能与成年中肠区域中的对应功能非常吻合。我们以类似的方式对幼虫中肠区域进行了分析。成功识别了对应于 R1 到 R5 区域的模块,这些模块沿幼虫中肠的前后轴依次排列(图 4K)。在我们的 scStereo-seq 数据中,我们注意到虽然 AMPs(由 esg 表达标记)分布在整个中肠中没有空间聚集(图 4L),但位于每个已识别区域的 AMPs 表现出不同的表达谱(图 4L)。这些发现表明,中肠干细胞的区域特异性发生在幼虫阶段。

总之,我们的 scStereo-seq 数据展示了胚胎和幼虫中肠中的不同区域及其基因表达谱,这些谱决定了与成年人相似的局部亚器官功能。

10. 通过多模态分析鉴定exex作为铜细胞调节因子
为了寻找中肠发育过程中以前未表征的细胞类型特异性调节因子,我们追踪了整合的 scRNA-seq/scATAC-seq 数据的内胚层轨迹(图 5A )。我们首先在每个谱系内进行差异基序分析,以识别表现出细胞谱系特异性活性的 TFs。在早期中肠中,我们识别了多个与先前报道的调节 AMP 和 EE 分化的 TFs 相对应的基序,包括 ttk73 和 lola。在晚期中肠分化过程中,我们还识别了已知的中肠发育调节 TFs,如 fkh75 和 cad76。

检查中肠谱系时,我们注意到铜细胞从早期中肠原基分化为高度特化的谱系(图 5A )。我们观察到分化后的铜细胞在胚胎发生约 10 小时出现(图 4E)。这与从 BDGP 原位数据库推断的时间点一致,其中铜细胞标记 Vha100-4 在胚胎发育第 13 阶段(约 10 小时)后出现。为了进一步追踪铜细胞谱系回溯到中肠原基的起源,我们对中肠原基簇进行了亚聚类,产生了 7 个细胞群,每个细胞群沿着分化轨迹注定发展为各种中肠细胞类型(图 5B)。其中,亚簇 2 导致了铜细胞的发展,我们观察到特异性转录表达和 lab 基序活性的提高。这些发现与先前的发现一致,即同源盒(Hox)TF lab 是果蝇中肠中铜细胞的一个已确立的特异性决定因子,对于铜细胞的特化和维持既必要又充分。为了评估这一假设,我们检查了沿着谱系中与铜细胞差异基序相对应的 HD TFs 的表达水平。其中,我们注意到 exex 在谱系起源处表现出显著的高表达水平,在铜细胞分化后表达水平下降(图 5C 和 5D)。这些观察进一步暗示 exex 在胚胎到幼虫阶段的铜细胞发育中发挥作用。
 


图5

11. exex 通过调节 kay 和 lab 的表达来维持对铜细胞的特化和稳态
为了验证 exex 的功能,我们使用 lab-Gal4 驱动 UAS-exex-shRNA 和 UAS-GFPnls 报告基因的表达,进行了铜细胞特异性敲低(KD)。检查晚期胚胎,我们发现与对照胚胎相比,exex KD 胚胎在铜细胞区域的 lab::GFP 信号较弱且较少(图 5E)。一致地,我们观察到 RNAi KD 导致 L3 中肠中 exex 表达和 lab::GFP 阳性细胞数量显著减少(图 5F-5H)。剩余的 lab::GFP 阳性细胞与对照中观察到的典型大、扁平、球形铜细胞特征相比,表现出明显较小的尺寸和异常形态(图 5G)。


然后,我们检查了 exex KD 是否影响了铜细胞的生理功能。铜细胞在饮食铜处理后,当被紫外线激发时,会发出橙色自体荧光。这被认为是金属硫蛋白与铜细胞中积累的铜离子相互作用的结果。在用铜饮食处理的 exex KD L3 中,我们观察到 lab::GFP 阳性细胞数量和同时表现出橙色荧光的 lab::GFP 阳性细胞比例显著减少(图 5I 和 5J)。这表明在 exex 缺乏时,铜细胞中的铜离子稳态丧失。我们进一步研究了在携带 exexKK30(exex 功能丧失等位基因)的铜饮食 L3 中铜细胞的表型。这种品系在我们手中是纯合致死的。在杂合 L3 中,我们注意到铜依赖性自体荧光细胞的显著丢失和形态改变(图 5K 和 5L)。总之,这些发现证实了 exex 在铜细胞发育中的关键作用。

随后,我们探索了 exex 调节铜细胞特化的潜在机制。我们注意到 kay 和 Jra 的基序活性在铜细胞中排名靠前。这两种 TFs 是已知的中肠中 lab 表达的激活因子。考虑到 exex 表达水平与 kay 和 lab 之间的时间不同步(图 5D),exex 活性可能先于其他两个在原初铜细胞中起作用。这一时间顺序得到了在 kay 的 TSS 区域识别 exex 基序的支持。此外,exex KD 导致 kay 表达水平显著降低。尽管在 Jra 的 TSS 区域没有发现 exex 基序,但我们仍然注意到相似水平的表达减少。与这些发现一致,我们观察到 lab 表达的中度但显著的减少(图 5M)。

综上所述,这些观察强调了 exex 在调节果蝇中肠中铜细胞发育和铜稳态中的关键作用,通过调节 kay 和 lab 的表达水平。

12. exex 和 lab 在铜细胞发育过程中的潜在调控
尽管 exex 和 lab 的表达水平显示了时间序列,但它们的结合基序在铜细胞谱系中持续活跃。因此,我们探索了 exex 是否也和 lab 协同发挥调控功能。为了检验这一假设,我们检查了所有包含 lab 或 exex 基序的峰,发现同时包含这两种 TF 基序的峰(双重基序)与铜细胞标记基因的重叠程度比仅包含 lab 或 exex 基序的峰(单一基序)更大。与这一观察结果一致,由双重基序调节的铜细胞标记基因表现出比仅由 lab 基序调节的基因更高的染色质可及性和表达水平(图 5N)。

此外,我们使用 scStereo-seq 数据可视化了在铜细胞中由双重或单一基序上调或下调的标记基因的空间表达模式。我们观察到,具有双重基序的上调基因在发育过程中表现出空间聚集趋势的增加,而具有单一基序的基因没有表现出空间聚集模式(图 5O 和 5P)。与具有单一基序的基因相比,具有双重基序的基因在时间上与铜细胞的空间相关性逐渐增加和增强(图 5P)。这些发现表明,由双重基序调节的基因在发育过程中对铜细胞的特异性逐渐增强。

为了进一步检测 exex 铜细胞特异性 KD 导致的全球变化,我们对铜细胞进行了批量 RNA-seq。在 exex KD 和对照组之间检测到的 415 个差异表达基因(DEGs)中,我们观察到有 107 个(25.8%)与铜细胞标记基因重叠。在这些基因中,我们注意到具有双重基序的失调基因数量比具有单一基序的基因更多(图 5Q)。检查代表性的双重基序基因,包括金属内肽酶基因 Mmp2 和 CG6763,以及一个未表征的糖基转移酶基因 CG10000,我们注意到在 exex KD 上的显著表达失调(图 5Q),这得到了 qPCR 的证实(图 5R)。我们进一步观察到这些基因的铜细胞差异可及性(DA)峰中存在双重基序。这些观察结果表明,除了调节 lab 表达外,exex 的功能可能还包括在铜细胞发育过程中作为 lab 的转录共调节因子。

总之,通过体内功能验证,我们确认了 exex 在铜细胞发育调控中的关键作用。这些结果强调了我们的多组学数据在识别发育组织中的细胞类型水平调节因子方面的实用性。

导语
多细胞生物的发育是一个高度复杂的过程,它受到无数基因和通路在空间和时间上的严格调控。在这里,我们介绍了 Flysta3D-v2,一个涵盖模式生物果蝇从胚胎到蛹期发育全过程的全面多组学图谱。我们的数据集包括 3D 单细胞空间转录组、单细胞转录组和单细胞染色质可及性信息。通过整合多模态数据,我们生成了整个有机体发展中连续的虚拟 3D 模型。我们进一步构建了组织发育轨迹,揭示了细胞类型分化的详细特征。重点关注中肠,我们使用多组学数据分析确定了参与中肠细胞类型调控的转录因子,并通过突变研究验证了 exex 是铜细胞发育的关键调节因子。这个广泛的图谱提供了一个丰富的资源,并作为系统平台,用于研究具有超高通量时空分辨率的集成单细胞数据的果蝇发育。

参考文献:
Wang M, Hu Q, Tu Z, Kong L, Yu T, Jia Z, Wang Y, Yao J, Xiang R, Chen Z, Zhao Y, Zhou Y, Ye Q, Ouyang K, Wang X, Bai Y, Yang Z, Wang H, Wang Y, Jiang H, Yang T, Chen J, Huang Y, Yin N, Mo W, Liang W, Liu C, Lin X, Liu C, Gu Y, Chen W, Liu L, Xu X, Hu Y. A Drosophila single-cell 3D spatiotemporal multi-omics atlas unveils panoramic key regulators of cell-type differentiation. Cell. 2025 Aug 21;188(17):4734-4753.e31. doi: 10.1016/j.cell.2025.05.047. Epub 2025 Jun 26. PMID: 40578340.

相关文章 更多 >