数据分析:转录组数据分析方法汇总(差异分析,PCA,聚类分析和功能富集分析)
文章目录
-
- 介绍
-
- DESeq2差异分析
- 对数倍数变化分析lfcShrink
- PCA分析
- 无监督聚类
- 多组功能富集分析比较compareCluster
- 加载R包
- 数据下载
- 导入数据
- 差异分析之DESeq2
-
- 数据预处理
- 构建DESEQDataset数据对象
- 运行DESeq
- 调节倍数变化lfcShrink
- PCA分析及可视化
-
- 转换基因ID
- 准备数据
- PCA分析
- PCA可视化
- 无监督聚类分析
-
- 数据标准Z-score
- 数据预处理
- 聚类
- 聚类结果热图可视化
- 聚类结果小提琴图可视化
- KEGG通路富集结果多组比较
-
- 基因列表准备
- 富集分析compareCluster
- 结果比较可视化
- 不同lfc缩放下的通路结果比较
-
- 准备数据
- KEGG compareCluster
- MSigDb compareCluster
- 可视化
- 总结
- 系统信息
介绍
本教程旨在指导用户如何在转录组数据中应用多种统计分析方法,包括差异表达分析(DESeq2)、差异表达基因的LFC(对数倍数变化)收缩分析(lfcShrink),以及无监督聚类分析。通过这些方法,用户可以深入理解数据中的生物学信号,并揭示不同条件下的基因表达变化。
- DESeq2差异分析:获取差异基因。
- 对数倍数变化分析lfcShrink:通过不同的收缩估计器,利用所有基因的信息来改善LFC的估计,使得结果更加稳定和可靠,有助于后续的基因排序和可视化分析。
- PCA分析:将高维数据转换为二维或三维,便于直观理解数据结构。
- 无监督聚类:将数据集中的样本划分为若干个簇或组,使得同一个簇内的样本相似度高,而不同簇之间的样本相似度低。
- 多组功能富集分析比较compareCluster:在一个单一的运行中分析和比较多个处理和时间点获得