单细胞数据分析(二):harmony算法整合数据
文章目录
-
- 介绍
-
- Harmony算法的原理
- Harmony算法的步骤
- 加载R包
- 数据链接
- 导入数据
- 数据预处理
- Harmony整合数据
- 可视化
- 输出结果
- 系统信息
介绍
Harmony是一种用于单细胞数据整合的算法,它特别适用于去除不同数据集之间的批次效应,使得来自不同实验条件、不同平台或不同时间点的数据能够被整合在一起分析。以下是Harmony算法的原理和步骤:
Harmony算法的原理
- 主成分分析(PCA):Harmony首先使用PCA将转录组表达谱嵌入到低维空间中,以捕捉数据中的主要变异来源。
- 软聚类(Soft Clustering):Harmony概率性地将细胞分配给多个聚类,同时确保每个聚类内数据集的多样性最大化。
- 计算全局中心和数据集特定中心:对于每个聚类,Harmony计算所有数据集的全局中心以及特定数据集的中心。
- 计算校正因子:在每个聚类中,Harmony基于中心为每个数据集计算校正因子。
- 细胞校正:使用基于C的特定于细胞的因子校正每个细胞。由于Harmony使用软聚类&#x