代谢组数据分析(二十二):Zscore标准化后主成分分析(PCA)及热图展示
禁止商业或二改转载,仅供自学使用,侵权必究,如需截取部分内容请后台联系作者!
文章目录
-
- 介绍
-
- Z-score标准化
- 主成分分析(Principal Component Analysis,PCA)
- 加载R包
- 数据下载
- 导入数据
- 数据预处理
- 填补缺失值
- Zscore标准化
- PCA分析
- 热图展示代谢物聚类簇
- 小提琴图
- 聚类分析
- 总结
- 系统信息
介绍
本教程采用Z-score标准化进行数据预处理,再做PCA分析,解析不同分组的代谢物整体在三维图上的可视化结果。
代谢物原始数据(raw data)具有以下特点:
- 高噪声:生物体内含有大量维持自身正常功能的内源性小分子,具有特定研究意义的生物标志物只是其中很少一部分,绝大部分代谢物和研究目的无关。
- 高维、小样本:代谢物的数目远大于样品个数,不适合使用传统的统计学方法进行分析,多变量分析容易出现过拟合和维数灾难问题。
- 高变异性:代谢物质的理化性质差异巨大,其浓度含量动态范围宽达7~9个数量级;生物个体间存在各种来源的变异,如年龄、性别都可能影响代谢产物的变化;仪器测量受各种因素影响,容易出现随机测量误差和系统误差。
<