Python和R统计检验比较各组之间的免疫浸润
统计检验用于比较各组间的免疫浸润差异,通过定量分析特定免疫细胞的浸润水平,评估它们在不同条件或组别下的显著性变化。常用方法包括t检验、Mann-Whitney U检验、ANOVA或Kruskal-Wallis检验,选择依据数据分布及样本特点。这些分析可揭示免疫微环境特征,助力探索疾病机制、预测治疗效果或筛选潜在生物标志物,为精准医学提供数据支持。
🌵Python片段
在 Python 中,统计检验可用于比较不同组之间的免疫浸润情况。常见的分析方法包括 t 检验、单因素方差分析(ANOVA) 和 非参数检验(如 Mann-Whitney U 检验、Kruskal-Wallis 检验)。以下是实现过程:
1. 数据准备
假设你有一个数据集,包含以下信息:
- 样本编号 (Sample ID)
- 组别 (Group)
- 免疫浸润指标 (Immunoinfiltration)
以下是数据框的结构:
Sample ID Group Immunoinfiltration
1 A 0.8
2 A 0.6
3 B 1.2
4 B 1.5
...
2. 安装所需库
首先安装常用的库:
pip install numpy pandas scipy seaborn matplotlib
3. Python 代码实现
导入库与加载数据
import pandas as pd
import numpy as np
from scipy.stats import ttest_ind, mannwhitneyu, f_oneway, kruskal
import seaborn as sns
import matplotlib.pyplot as plt
# 假设数据保存在 CSV 文件中
data = pd.read_csv("immune_infiltration.csv")
可视化数据
可以先使用箱线图或小提琴图观察各组免疫浸润的分布:
sns.boxplot(x='Group', y='Immunoinfiltration', data=data)
plt.title("Immune Infiltration Across Groups")
plt.show()
或者小提琴图:
sns.violinplot(x='Group', y='Immunoinfiltration', data=data, inner='quartile')
plt.title("Immune Infiltration Across Groups")
plt.show()
组间统计检验
(1) 两组之间的比较
- 使用 t 检验(假设数据符合正态分布):
group_A = data[data['Group'] == 'A']['Immunoinfiltration']
group_B = data[data['Group'] == 'B']['Immunoinfiltration']
t_stat, p_val = ttest_ind(group_A, group_B)
print(f"T-test: t-statistic={t_stat}, p-value={p_val}")
- 使用 Mann-Whitney U 检验(非参数检验):
u_stat, p_val = mannwhitneyu(group_A, group_B)
print(f"Mann-Whitney U Test: U-statistic={u_stat}, p-value={p_val}")
(2) 多组之间的比较
- 使用 单因素方差分析(ANOVA):
groups = [data[data['Group'] == g]['Immunoinfiltration'] for g in data['Group'].unique()]
f_stat, p_val = f_oneway(*groups)
print(f"ANOVA: F-statistic={f_stat}, p-value={p_val}")
- 使用 Kruskal-Wallis 检验(非参数检验):
h_stat, p_val = kruskal(*groups)
print(f"Kruskal-Wallis Test: H-statistic={h_stat}, p-value={p_val}")
4. 结果解读
- p 值小于显著性水平(如 0.05),则说明组间存在显著差异。
- 若结果显著,可进一步进行 事后分析(Post-hoc test),例如使用 Tukey HSD 或 Dunn’s test。
事后分析示例:
pip install scikit-posthocs
import scikit_posthocs as sp
# 进行 Dunn's 检验
posthoc = sp.posthoc_dunn(data, val_col='Immunoinfiltration', group_col='Group', p_adjust='bonferroni')
print(posthoc)
5. 完整流程示例
结合上述代码,可以顺利完成各组免疫浸润的统计分析和可视化。如果需要进一步扩展,还可以结合机器学习模型进行特征关联分析。