李向涛教授指导的2020级硕士研究生卢艺夫的论文GMHCC: High-throughput Analysis of Biomolecular Data using Graph-based Multiple Hierarchical Consensus Clustering近日被 Bioinformatics杂志接收。 Bioinformatics是Oxford Academic出版社旗下数学与计算生物学方向的中科院一区期刊,也是生物信息学领域的顶级杂志,SCI IF(2020)= 6.937。
卢艺夫本科就读于吉林大学数学学院,2020年保研至人工智能学院跟随李向涛老师攻读硕士,从事计算智能及生物信息学方面的研究工作。本文通讯作者为我院李向涛老师。
本文提出了一种基于图的多层次集成聚类算法(GMHCC),用于解决癌症数据和单细胞RNA数据的聚类分析问题。算法采用基于图的无监督特征排序和基于图的链接方法来发现集成聚类基本分区的多重层次信息,并对多种类型的高通量生物分子数据进行聚类分析。我们首先使用一个基于图的无监督特征度量模型来排序每个特征。然后,为了保持基本分区的多样性和鲁棒性,算法提取了多个不同的特征子集来生成多个基本分区,并通过优化全局一致性函数来探索数据的层次结构。最后,我们在35个癌症数据集和8个单细胞RNA数据集上的聚类结果和下游分析证明了我们方法的有效性。本工作结合了集成聚类与生物信息学等多学科交叉的优势共同完成。 主要合作者为香港城市大学Ka-Chun Wong 教授。