贝叶斯推断的条件观点
内容来源
贝叶斯统计(第二版)中国统计出版社
未知参数 θ \theta θ 的后验分布 π ( θ ∣ x ) \pi(\theta|x) π(θ∣x) 包括了总体、样本和先验三种信息,集所有可供利用的信息于一身。
所以有关 θ \theta θ 的点估计、区间估计和假设检验等统计推断都按一定方式从 π ( θ ∣ x ) \pi(\theta|x) π(θ∣x) 中提取信息。
但是, π ( θ ∣ x ) \pi(\theta|x) π(θ∣x) 是在样本 x x x 给定下 θ \theta θ 的条件分布。
所以基于后验分布进行统计推断就意味着只考虑已出现的数据(样本),认为未出现的数据与推断无关。
这一重要观点被称为条件观点,基于这种观点提出的统计推断方法被称为条件方法。与经典统计中的频率方法有着很大差别。
例如,经典统计学认为参数 θ \theta θ 的无偏估计 θ ^ ( x ) \hat{\theta}(x) θ^(x) 应该满足如下等式
E [ θ ^ ( x ) ] = ∫ x θ ^ ( x ) p ( x ∣ θ ) d x = 0 E[\hat{\theta}(x)]=\int_x\hat{\theta}(x)p(x|\theta)\mathrm{d}x=0 E[θ^(x)]=∫xθ^(x)p(x∣θ)dx=0
这个式子考虑了整个样本空间,可实际中样本空间中绝大多数样本尚未出现过,甚至重复数百次也不会出现的样本也要在评价估计量 θ ^ \hat\theta θ^ 的好坏中占一席之地,何况在实际中不少估计量只使用一次或几次,而多数从未出现的样本也要参与平均是使实际工作者难以理解的。
故在贝叶斯推断中不用无偏性。