【数理统计】参数估计
文章目录
- 点估计
- 矩估计法
- 最大似然估计法
- 区间估计
- 单个正态总体参数的区间估计
- 两个正态总体参数的区间估计(略)
- 补充:单侧置信区间
点估计
矩估计法
【定义】设 X X X 是随机变量,若 E ( X k ) ( k = 1 , 2 , . . . ) E(X^k) (k=1,2,...) E(Xk)(k=1,2,...) 存在,则称其为 X X X 的 k k k 阶矩。
【方法】设待估计的参数 θ 1 , θ 2 , . . . , θ n \theta_1,\theta_2,... ,\theta_n θ1,θ2,...,θn,设
{ μ 1 = μ 1 ( θ 1 , θ 2 , . . . , θ n ) = E ( X 1 ) μ 2 = μ 2 ( θ 1 , θ 2 , . . . , θ n ) = E ( X 2 ) . . . μ n = μ n ( θ 1 , θ 2 , . . . , θ n ) = E ( X n ) \begin{cases} \mu_1 = \mu_1 (\theta_1,\theta_2,... ,\theta_n) = E(X^1) \\ \mu_2 = \mu_2 (\theta_1,\theta_2,... ,\theta_n) = E(X^2) \\ ... \\ \mu_n = \mu_n (\theta_1,\theta_2,... ,\theta_n) = E(X^n) \end{cases} ⎩ ⎨ ⎧μ1=μ1(θ1,θ2,...,θn)=E(X1)μ2=μ2(θ1,θ2,...,θn)=E(X2)...μn=μn(θ1,θ2,...,θn)=E(Xn)
这是关于 θ i \theta_i θi 的方程组,解该方程组可得
{ θ 1 = θ 1 ( μ 1 , μ 2 , . . . , μ n ) θ 2 = θ 2 ( μ 1 , μ 2 , . . . , μ n ) . . . θ n = θ n ( μ 1 , μ 2 , . . . , μ n ) \begin{cases} \theta_1 = \theta_1 (\mu_1,\mu_2,... ,\mu_n) \\ \theta_2 = \theta_2 (\mu_1,\mu_2,... ,\mu_n) \\ ... \\ \theta_n = \theta_n (\mu_1,\mu_2,... ,\mu_n) \end{cases} ⎩ ⎨ ⎧θ1=θ1(μ1,μ2,...,μn)θ2=θ2(μ1,μ2,...,μn)...θn=θn(μ1,μ2,...,μn)
以 A l = 1 n ∑ i = 1 n X i l A_l = \frac{1}{n} \sum_{i=1}^n X_i^l Al=n1∑i=1nXil 代替上式中的 μ l ( l = 1 , 2 , . . . , n ) \mu_l(l=1,2,...,n) μl(l=1,2,...,n) 即可得到矩估计量。
注意:
- A 1 = 1 n ∑ i = 1 n X i = X ˉ A_1 = \frac{1}{n} \sum_{i=1}^n X_i = \bar{X} A1=n1∑i=1nXi=Xˉ
- A 2 = 1 n ∑ i = 1 n X i 2 A_2 = \frac{1}{n} \sum_{i=1}^n X_i^2 A2=n1∑i=1nXi2
- A 2 − A 1 2 = D ( X ) A_2 - A_1^2 = D(X) A2−A12=D(X)
【举例】
- 当 n = 1 n=1 n=1 时,即待估计参数有一个,令 μ 1 = E ( X ) \mu_1 = E(X) μ1=E(X),然后解出 θ 1 \theta_1 θ1,最后用 A 1 A_1 A1 代替 μ 1 \mu_1 μ1 即可。
- 当 n = 2 n=2 n=2 时,即待估计参数有两个,令
{ μ 1 = E ( X ) μ 2 = E ( X 2 ) = D ( X ) + [ E ( X ) ] 2 \begin{cases} \mu_1 = E(X) \\ \mu_2 = E(X^2) = D(X) + [E(X)]^2 \end{cases} {μ1=E(X)μ2=E(X2)=D(X)+[E(X)]2
然后解出 θ 1 , θ 2 \theta_1, \theta_2 θ1,θ2,最后用 A 1 , A 2 A_1, A_2 A1,A2 代替 μ 1 , μ 2 \mu_1, \mu_2 μ1,μ2 即可。
最大似然估计法
【定义】若总体 X X X 的概率密度函数为 f ( x ; θ ) f(x;\theta) f(x;θ),其中 θ ∈ Θ \theta \in \Theta θ∈Θ 为参数向量( Θ \Theta Θ 为参数 θ \theta θ 可能取值的范围), X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 为来自 X X X 的一个样本,则联合概率密度函数记为
L ( x 1 , x 2 , . . . , x n ; θ ) = ∏ i = 1 n f ( x i ; θ ) L(x_1,x_2,...,x_n; \theta) = \prod_{i=1}^{n} f(x_i; \theta) L(x1,x2,...,xn;θ)=i=1∏nf(xi;θ)
称为参数 θ \theta θ 的似然函数。
【思想】求参数 θ \theta θ 的估计值,使得似然函数取得最大值。
【方法】求极大似然估计的一般步骤如下:
- 写出似然函数:
L ( x 1 , x 2 , . . . , x n ; θ ) = ∏ i = 1 n f ( x i ; θ 1 , θ 2 , . . . , θ m ) L(x_1,x_2,...,x_n; \theta) = \prod_{i=1}^{n} f(x_i; \theta_1, \theta_2,..., \theta_m) L(x1,x2,...,xn;θ)=i=1∏nf(xi;θ1,θ2,...,θm)
- 对似然函数取对数:
ln L = ∑ i = 1 n ln f ( x i ; θ 1 , θ 2 , . . . , θ m ) \ln L = \sum_{i=1}^{n} \ln f(x_i; \theta_1, \theta_2,..., \theta_m) lnL=i=1∑nlnf(xi;θ1,θ2,...,θm)
- 对 θ j ( j = 1 , 2 , . . . , m ) \theta_j (j=1,2,...,m) θj(j=1,2,...,m) 分别求偏导,建立似然方程组:
∂ ln L ∂ θ j = 0 ( j = 1 , 2 , . . . , m ) \frac{\partial \ln L}{\partial \theta_j} = 0 \ \ (j=1,2,...,m) ∂θj∂lnL=0 (j=1,2,...,m)
- 解得 θ j ^ \hat{\theta_j} θj^ 为 θ j \theta_j θj 的极大似然估计量(不是估计量!)
区间估计
【定义】设总体的未知参数为 θ \theta θ,由样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 确定两个统计量
θ 1 ^ = θ 1 ^ ( X 1 , X 2 , . . . , X n ) , θ 2 ^ = θ 2 ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta_1} = \hat{\theta_1} (X_1,X_2,...,X_n), \hat{\theta_2} = \hat{\theta_2} (X_1,X_2,...,X_n) θ1^=θ1^(X1,X2,...,Xn),θ2^=θ2^(X1,X2,...,Xn)
对于给定的实数 α ( o < α < 1 ) \alpha(o<\alpha<1) α(o<α<1),满足
P { θ 1 ^ < θ < θ 2 ^ } ≥ 1 − α P\{ \hat{\theta_1} < \theta < \hat{\theta_2} \} \geq 1-\alpha P{θ1^<θ<θ2^}≥1−α
则称随机区间 ( θ 1 ^ , θ 2 ^ ) (\hat{\theta_1}, \hat{\theta_2}) (θ1^,θ2^) 是 θ \theta θ 的置信水平为 1 − α 1-\alpha 1−α 的置信区间, 1 − α 1-\alpha 1−α 为置信水平, α \alpha α 为显著性水平,通常取值 0.1 或 0.05。
【枢轴量法】
- 选取待估参数 θ \theta θ 的估计量:遵从估计量的优良性准则,如 X ˉ → μ \bar{X} \rightarrow \mu Xˉ→μ, S 2 → σ 2 S^2 \rightarrow \sigma^2 S2→σ2
- 建立枢轴量: W = W ( X 1 , X 2 , . . . , X n ; θ ) W = W(X_1,X_2,...,X_n; \theta) W=W(X1,X2,...,Xn;θ),使得 W W W 不依赖于 θ \theta θ 及其他未知参数
- 确定 W W W 的分布,通常选取经典分布
- 根据 W W W 的分布,建立概率等式:
P { W 1 − α / 2 < W < W α / 2 } = 1 − α P\{ W_{1-\alpha/2} < W < W_{\alpha/2} \} = 1-\alpha P{W1−α/2<W<Wα/2}=1−α
- 将上式等价变形为:
P { a < θ < b } = 1 − α P\{ a < \theta < b \} = 1-\alpha P{a<θ<b}=1−α
( a , b ) (a,b) (a,b) 即为 θ \theta θ 的一个置信水平为 1 − α 1-\alpha 1−α 的置信区间。
单个正态总体参数的区间估计
均值 μ \mu μ 的区间估计
(1) σ 2 \sigma^2 σ2 已知
根据中心极限定理,选取枢轴量
X ˉ − μ σ / n ∼ N ( 0 , 1 ) \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1) σ/nXˉ−μ∼N(0,1)
注意右边的枢轴量(即标准正态分布)并不依赖于任何未知参数,因此有
P { − u α / 2 < X ˉ − μ σ / n < u α / 2 } = 1 − α P\left\{ -u_{\alpha/2} < \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} < u_{\alpha/2} \right\} = 1-\alpha P{−uα/2<σ/nXˉ−μ<uα/2}=1−α
注:对于标准正态分布,有 u α = − u 1 − α u_{\alpha} = -u_{1-\alpha} uα=−u1−α
等价变形为
P { X ˉ − σ n u α / 2 < μ < X ˉ + σ n u α / 2 } = 1 − α P\left\{ \bar{X} - \frac{\sigma}{\sqrt{n}} u_{\alpha/2} < \mu < \bar{X} + \frac{\sigma}{\sqrt{n}} u_{\alpha/2} \right\} = 1-\alpha P{Xˉ−nσuα/2<μ<Xˉ+nσuα/2}=1−α
因此 μ \mu μ 的一个置信水平为 1 − α 1-\alpha 1−α 的置信区间为
( X ˉ − σ n u α / 2 , X ˉ + σ n u α / 2 ) \left(\bar{X} - \frac{\sigma}{\sqrt{n}} u_{\alpha/2}, \bar{X} + \frac{\sigma}{\sqrt{n}} u_{\alpha/2} \right) (Xˉ−nσuα/2,Xˉ+nσuα/2)
注:有些教科书上用的不是 u u u,而是 z z z,其实两者表示的意思是一样的。
(2) σ 2 \sigma^2 σ2 未知
考虑 S 2 S^2 S2 为 σ 2 \sigma^2 σ2 的无偏估计,根据抽样分布定理,应选取枢轴量
X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1) S/nXˉ−μ∼t(n−1)
注意右边的枢轴量(即自由度为 n − 1 n-1 n−1 的 t t t 分布)并不依赖于任何未知参数,因此有
P { − t α / 2 ( n − 1 ) < X ˉ − μ S / n < t α / 2 ( n − 1 ) } = 1 − α P\left\{ -t_{\alpha/2}(n-1) < \frac{\bar{X} - \mu}{S/\sqrt{n}} < t_{\alpha/2}(n-1) \right\} = 1-\alpha P{−tα/2(n−1)<S/nXˉ−μ<tα/2(n−1)}=1−α
注:对于自由度为 n n n 的 t t t 分布,有 t α ( n ) = − t 1 − α ( n ) t_{\alpha}(n) = -t_{1-\alpha}(n) tα(n)=−t1−α(n)
等价变形为
P { X ˉ − S n t α / 2 ( n − 1 ) < μ < X ˉ + S n t α / 2 ( n − 1 ) } = 1 − α P\left\{ \bar{X} - \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1) < \mu < \bar{X} + \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1) \right\} = 1-\alpha P{Xˉ−nStα/2(n−1)<μ<Xˉ+nStα/2(n−1)}=1−α
因此 μ \mu μ 的一个置信水平为 1 − α 1-\alpha 1−α 的置信区间为
( X ˉ − S n t α / 2 ( n − 1 ) , X ˉ + S n t α / 2 ( n − 1 ) ) \left(\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1), \bar{X} + \frac{S}{\sqrt{n}} t_{\alpha/2}(n-1) \right) (Xˉ−nStα/2(n−1),Xˉ+nStα/2(n−1))
方差 σ 2 \sigma^2 σ2 的区间估计
(1) μ \mu μ 已知
由抽样分布定理,应选取枢轴量
χ 2 = 1 σ 2 ∑ i = 1 n ( X i − μ ) 2 ∼ χ 2 ( n ) \chi^2 = \frac{1}{\sigma^2} \sum_{i=1}^n (X_i - \mu)^2 \sim \chi^2(n) χ2=σ21i=1∑n(Xi−μ)2∼χ2(n)
注意右边的枢轴量(即自由度为 n n n 的 χ \chi χ 分布)并不依赖于任何未知参数,因此有
P { χ 1 − α / 2 2 ( n ) < 1 σ 2 ∑ i = 1 n ( X i − μ ) 2 < χ α / 2 2 ( n ) } = 1 − α P\left\{ \chi_{1-\alpha/2}^2(n) < \frac{1}{\sigma^2} \sum_{i=1}^n (X_i - \mu)^2 < \chi_{\alpha/2}^2(n) \right\} = 1-\alpha P{χ1−α/22(n)<σ21i=1∑n(Xi−μ)2<χα/22(n)}=1−α
等价变形为
P { ∑ i = 1 n ( X i − μ ) 2 χ α / 2 2 ( n ) < σ 2 < ∑ i = 1 n ( X i − μ ) 2 χ 1 − α / 2 2 ( n ) } = 1 − α P\left\{ \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\alpha/2}^2(n)} < \sigma^2 < \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\alpha/2}^2(n)} \right\} = 1-\alpha P{χα/22(n)∑i=1n(Xi−μ)2<σ2<χ1−α/22(n)∑i=1n(Xi−μ)2}=1−α
因此 σ 2 \sigma^2 σ2 的一个置信水平为 1 − α 1-\alpha 1−α 的置信区间为
( ∑ i = 1 n ( X i − μ ) 2 χ α / 2 2 ( n ) , ∑ i = 1 n ( X i − μ ) 2 χ 1 − α / 2 2 ( n ) ) \left(\frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{\alpha/2}^2(n)}, \frac{\sum_{i=1}^n (X_i - \mu)^2}{\chi_{1-\alpha/2}^2(n)} \right) (χα/22(n)∑i=1n(Xi−μ)2,χ1−α/22(n)∑i=1n(Xi−μ)2)
(2) μ \mu μ 未知
考虑 S 2 S^2 S2 为 σ 2 \sigma^2 σ2 的无偏估计,由抽样分布定理,应选取枢轴量
χ 2 = n − 1 σ 2 S 2 ∼ χ 2 ( n − 1 ) \chi^2 = \frac{n-1}{\sigma^2} S^2 \sim \chi^2(n-1) χ2=σ2n−1S2∼χ2(n−1)
注意右边的枢轴量(即自由度为 n − 1 n-1 n−1 的 χ \chi χ 分布)并不依赖于任何未知参数,因此有
P { χ 1 − α / 2 2 ( n − 1 ) < n − 1 σ 2 S 2 < χ α / 2 2 ( n − 1 ) } = 1 − α P\left\{ \chi_{1-\alpha/2}^2(n-1) < \frac{n-1}{\sigma^2} S^2 < \chi_{\alpha/2}^2(n-1) \right\} = 1-\alpha P{χ1−α/22(n−1)<σ2n−1S2<χα/22(n−1)}=1−α
等价变形为
P { ( n − 1 ) S 2 χ α / 2 2 ( n ) < σ 2 < ( n − 1 ) S 2 χ 1 − α / 2 2 ( n ) } = 1 − α P\left\{ \frac{(n-1)S^2}{\chi_{\alpha/2}^2(n)} < \sigma^2 < \frac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n)} \right\} = 1-\alpha P{χα/22(n)(n−1)S2<σ2<χ1−α/22(n)(n−1)S2}=1−α
因此 σ 2 \sigma^2 σ2 的一个置信水平为 1 − α 1-\alpha 1−α 的置信区间为
( ( n − 1 ) S 2 χ α / 2 2 ( n ) , ( n − 1 ) S 2 χ 1 − α / 2 2 ( n ) ) \left(\frac{(n-1)S^2}{\chi_{\alpha/2}^2(n)}, \frac{(n-1)S^2}{\chi_{1-\alpha/2}^2(n)} \right) (χα/22(n)(n−1)S2,χ1−α/22(n)(n−1)S2)
两个正态总体参数的区间估计(略)
(略)
补充:单侧置信区间
【定义 1】设总体的未知参数为 θ \theta θ,由样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 确定的统计量
θ ^ = θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta} = \hat{\theta} (X_1,X_2,...,X_n) θ^=θ^(X1,X2,...,Xn)
对于给定的实数 α ( o < α < 1 ) \alpha(o<\alpha<1) α(o<α<1),满足
P { θ > θ ^ } ≥ 1 − α , ∀ θ ∈ Θ P\{ \theta > \hat{\theta} \} \geq 1-\alpha, \forall \theta \in \Theta P{θ>θ^}≥1−α,∀θ∈Θ
则称随机区间 ( θ ^ , + ∞ ) (\hat{\theta}, +\infty) (θ^,+∞) 是 θ \theta θ 的置信水平为 1 − α 1-\alpha 1−α 的单侧置信区间, θ ^ \hat{\theta} θ^ 称为 θ \theta θ 的置信水平为 1 − α 1-\alpha 1−α 的单侧置信下限。
【定义 2】设总体的未知参数为 θ \theta θ,由样本 X 1 , X 2 , . . . , X n X_1,X_2,...,X_n X1,X2,...,Xn 确定的统计量
θ ^ = θ ^ ( X 1 , X 2 , . . . , X n ) \hat{\theta} = \hat{\theta} (X_1,X_2,...,X_n) θ^=θ^(X1,X2,...,Xn)
对于给定的实数 α ( o < α < 1 ) \alpha(o<\alpha<1) α(o<α<1),满足
P { θ < θ ^ } ≥ 1 − α , ∀ θ ∈ Θ P\{ \theta < \hat{\theta} \} \geq 1-\alpha, \forall \theta \in \Theta P{θ<θ^}≥1−α,∀θ∈Θ
则称随机区间 ( − ∞ , θ ^ ) (-\infty, \hat{\theta}) (−∞,θ^) 是 θ \theta θ 的置信水平为 1 − α 1-\alpha 1−α 的单侧置信区间, θ ^ \hat{\theta} θ^ 称为 θ \theta θ 的置信水平为 1 − α 1-\alpha 1−α 的单侧置信上限。
【举例】对于正态总体 X X X,若均值 μ \mu μ、方差 σ 2 \sigma^2 σ2 均未知,设 X 1 , . . . , X n X_1,...,X_n X1,...,Xn 是一个样本,由
X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1) S/nXˉ−μ∼t(n−1)
得
P { X ˉ − μ S / n < t α ( n − 1 ) } = 1 − α P\left\{ \frac{\bar{X} - \mu}{S/\sqrt{n}} < t_{\alpha}(n-1) \right\} = 1-\alpha P{S/nXˉ−μ<tα(n−1)}=1−α
等价变形为
P { μ > X ˉ − S n t α ( n − 1 ) } = 1 − α P\left\{ \mu > \bar{X} - \frac{S}{\sqrt{n}} t_{\alpha}(n-1) \right\} = 1-\alpha P{μ>Xˉ−nStα(n−1)}=1−α
因此 μ \mu μ 的一个置信水平为 1 − α 1-\alpha 1−α 的单侧置信区间为
( X ˉ − S n t α ( n − 1 ) , + ∞ ) \left(\bar{X} - \frac{S}{\sqrt{n}} t_{\alpha}(n-1), +\infty \right) (Xˉ−nStα(n−1),+∞)
【总结】在形式上,只需将置信区间的上下限中的 α / 2 \alpha/2 α/2 改成 α \alpha α,就能得到相应的单侧置信上下限了。