GRN前沿:GNNLink:使用图神经网络从单细胞RNA-seq数据预测基因调控链
1.论文原名:Predicting gene regulatory links from single-cell RNA-seq data using graph neural networks
2.发表日期:2023
摘要:
单细胞RNA测序(scRNA-seq)是在单细胞水平上研究基因表达模式的一种强有力的技术。从scRNA-seq数据推断基因调控网络(GRNs)提供了从基因组水平对细胞表型的深入了解。然而,高稀疏性、噪声和scRNA-seq数据中固有的丢失事件对GRN推断提出了挑战。近年来,实验验证的转录因子与DNA结合的数据急剧增加,使得通过监督方法推断GRNs成为可能。在本研究中,我们将GRN推断问题视为一个图链接预测任务来解决。为此,本文提出了一种新的GNNLink框架,该框架利用已知的GRNs来推断基因之间潜在的调控依赖性。首先,我们对原始的scRNA-seq数据进行预处理。在此基础上,提出了一种基于图卷积网络的交互图编码器,通过捕获网络中节点间的相互依赖关系来有效地细化基因特征。最后,通过对节点特征进行矩阵完备运算,得到GRN的推理结果。从模型训练中获得的特征可以应用于下游任务,例如测量基因对之间的相似性和推断因果关系。为了评估GNNLink的性能,我们使用7个scRNA-seq数据集将其与6种现有的GRN重建方法进行了比较。这些数据集涵盖了不同的基础事实网络,包括功能相互作用网络、功能丧失/功能获得数据、非特异性ChIPseq数据和细胞类型特异性ChIP-seq数据。实验结果表明,GNNLink在这些数据集上取得了较好的性能,展示了其鲁棒性和准确性。此外,我们还观察到在不同规模的数据集上的一致性能。
关键词:图神经网络;链接预测;图卷积网络;基因调控网络
GNNLink框架
1. 问题定义
-
目标:从单细胞 RNA 测序数据中推断基因调控网络(GRNs),即预测基因之间的潜在调控依赖关系。
-
挑战:scRNA-seq 数据具有高稀疏性、噪声和 dropout 事件,这给 GRN 推断带来了困难。
2. GNNLink 框架概述
GNNLink 框架主要包含三个核心部分:
-
数据预处理:对原始 scRNA-seq 数据进行预处理,提取基因特征。
-
基于图卷积网络(GCN)的交互图编码器:利用 GCN 捕获基因之间的依赖关系,提取基因特征。
-
链接预测:通过矩阵补全操作预测基因之间的调控依赖关系。