2024级博士研究生郝高阳研究成果发表在《Nature Communications》

发布时间:2025-02-24 点击:

    李向涛教授指导的2024级博士研究生郝高阳提出了一种基于图深度学习框架的单细胞染色质可及性数据分析,该方法通过显式建模数据生成过程,能够同时学习表示和聚类,并有效揭示了与细胞身份相关的关键调控元素和单细胞的功能多样性。该成果以“Topological identification and interpretation for single-cell epigenetic regulation elucidation in multi-tasks using scAGDE”为题发表于国际顶级期刊《Nature Communications》上。

    郝高阳2022年至人工智能学院跟随李向涛教授攻读硕士学位,2024年通过硕博连读考核跟随李向涛教授攻读博士学位,目前从事单细胞与空间组学数据研究的工作。

    基因表达受暴露在基因组可及染色质区域的数百万个活性DNA调控元件的调控。单细胞转座酶可接近染色质测序(scATAC-seq)技术通过超活性Tn5转座酶探索染色质可及性景观。因此,scATAC-seq通过对染色质可及性的分析,提供了超越转录组测量的细胞异质性显著见解,揭示了单细胞水平的表观遗传调控机制。然而,在全基因组分析过程中,开放染色质位点的捕获率相对较低,导致scATAC-seq数据的高维性和稀疏性,这对分析带来了巨大挑战。这种稀疏性掩盖了重要的基因组信息,且使得下游分析(如峰值调用和基序发现)变得复杂。此外,DNA拷贝数的固有限制加剧了数据的二进制特性,使得信号与噪声难以区分。该研究为应对上述问题,提出了scAGDE。实验结果表明,scAGDE在细胞分离、可视化等方面优于现有方法,同时缓解了dropout的问题,揭示了潜在的染色质可及区域。应用于人脑组织时,scAGDE成功注释了由顺式调控元件确定的细胞类型,并揭示了谷氨能神经元的功能多样性和调控机制。

原文链接:https://www.nature.com/articles/s41467-025-57027-x#Abs1