因果推断核心算法:倾向得分匹配法PSM
1. PSM基本定义
倾向得分匹配法是一种常见的因果推断算法,核心思想是通过倾向得分(Propensity Score)将具有相似特征的处理组和控制组的个体进行匹配。在没有随机化实验的情况下,通过匹配使两组个体在协变量上尽量相似,从而减少混淆偏差。
**1. 什么是倾向得分(Propensity Score)?
倾向得分是指在给定一组协变量的条件下,一个个体接受处理(Treatment)的概率。**
倾向得分通常通过统计模型估计得出,例如:
- 逻辑回归(Logistic Regression)
- 随机森林(Random Forest)
- XGBoost等机器学习方法。
**2. 什么是协变量(Covariate)?
协变量是指在因果推断模型中,与结果变量(因变量)相关,但不一定直接参与因果路径的变量。**
特性:
- 协变量可能与结果变量相关,但不一定影