【数理统计】极限定理及抽样分布
文章目录
- 中心极限定理
- 抽样分布
- 卡方分布
- t分布
- F分布
- 正态总体的【样本均值】与【样本方差】的分布
中心极限定理
【中心极限定理】设随机变量 X k ( k = 1 , 2 , . . . , n ) X_k(k=1,2,...,n) Xk(k=1,2,...,n) 相互独立且服从同一分布,数学期望 E ( X k ) = μ E(X_k)=\mu E(Xk)=μ,方差 D ( X k ) = σ 2 D(X_k)=\sigma^2 D(Xk)=σ2,当 n n n 充分大时,有
- X ˉ − μ σ / n ∼ N ( 0 , 1 ) \frac{\bar{X} - \mu}{\sigma/\sqrt{n}} \sim N(0,1) σ/nXˉ−μ∼N(0,1) 近似成立
- X ˉ ∼ N ( μ , σ 2 / n ) \bar{X} \sim N(\mu,\sigma^2/n) Xˉ∼N(μ,σ2/n) 近似成立
- ∑ k = 1 n X k ∼ N ( n μ , n σ 2 ) \sum_{k=1}^{n}X_k \sim N(n\mu,n\sigma^2) ∑k=1nXk∼N(nμ,nσ2) 近似成立
【棣莫孚—拉普拉斯中心极限定理】设随机变量 X k ∼ B ( n , p ) ( k = 1 , 2 , . . . , n ) X_k \sim B(n,p)(k=1,2,...,n) Xk∼B(n,p)(k=1,2,...,n)(二项分布),数学期望 E ( X k ) = p E(X_k)=p E(Xk)=p,方差 D ( X k ) = p ( 1 − p ) D(X_k)=p(1-p) D(Xk)=p(1−p),当 n n n 充分大时,有
lim n → ∞ P { X n − n p n p ( 1 − p ) } ≈ Φ ( x ) (此为标准正态分布的分布函数) \lim_{n \rightarrow \infty} P\left\{ \frac{X_n - np}{\sqrt{np(1-p)}} \right\} \approx \Phi(x) (此为标准正态分布的分布函数) n→∞limP{np(1−p)Xn−np}≈Φ(x)(此为标准正态分布的分布函数)
抽样分布
卡方分布
【定义 1】设 X 1 , X 2 , . . . , X n X_1, X_2,..., X_n X1,X2,...,Xn 相互独立且都服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1),则:
χ 2 = ∑ i = 1 n X i 2 ∼ χ 2 ( n ) \chi^2 = \sum_{i=1}^{n} X_i^2 \sim \chi^2(n) χ2=i=1∑nXi2∼χ2(n)
即随机变量 χ 2 \chi^2 χ2(标准正态随机变量的独立平方和)服从自由度为 n n n 的卡方分布。
【定义 2】对于任意正数 α ( 0 < α < 1 ) \alpha(0<\alpha<1) α(0<α<1),称满足条件
P { χ 2 > χ α 2 ( n ) } = ∫ χ α 2 ( n ) + ∞ f ( x ) d x = α P\{\chi^2 > \chi_{\alpha}^2 (n)\} = \int_{\chi_{\alpha}^2 (n)}^{+\infty} f(x)dx = \alpha P{χ2>χα2(n)}=∫χα2(n)+∞f(x)dx=α
的数为卡方分布的上 α \alpha α 分位数。
有如下重要性质:
- 设 χ 2 ∼ χ 2 ( n ) \chi^2 \sim \chi^2(n) χ2∼χ2(n),则: E ( χ 2 ) = n E(\chi^2) = n E(χ2)=n, D ( χ 2 ) = 2 n D(\chi^2) = 2n D(χ2)=2n
- 设 Y 1 ∼ χ 2 ( n 1 ) Y_1 \sim \chi^2(n_1) Y1∼χ2(n1) 和 Y 2 ∼ χ 2 ( n 2 ) Y_2 \sim \chi^2(n_2) Y2∼χ2(n2) 相互独立,则: Y 1 + Y 2 ∼ χ 2 ( n 1 + n 2 ) Y_1 + Y_2 \sim \chi^2(n_1 + n_2) Y1+Y2∼χ2(n1+n2)
- 当 n n n 足够大( n > 40 n>40 n>40)时,有: χ α 2 ( n ) ≈ 1 2 ( u α + 2 n − 1 ) 2 \chi_{\alpha}^2 (n) \approx \frac{1}{2}(u_{\alpha} + \sqrt{2n-1})^2 χα2(n)≈21(uα+2n−1)2
t分布
【定义 1】设 X ∼ N ( 0 , 1 ) X \sim N(0,1) X∼N(0,1), Y ∼ χ 2 ( n ) Y \sim \chi^2(n) Y∼χ2(n) 相互独立,则
t = X Y / N ∼ t ( n ) t = \frac{X}{\sqrt{Y/N}} \sim t(n) t=Y/NX∼t(n)
即随机变量 t t t 服从自由度为 n n n 的 t 分布。
【定义 2】对于任意正数 α ( 0 < α < 1 ) \alpha(0<\alpha<1) α(0<α<1),称满足条件
P { t > t α ( n ) } = ∫ t α ( n ) + ∞ f ( x ) d x = α P\{t > t_{\alpha} (n)\} = \int_{t_{\alpha} (n)}^{+\infty} f(x)dx = \alpha P{t>tα(n)}=∫tα(n)+∞f(x)dx=α
的数为 t 分布的上 α \alpha α 分位数。
有如下重要性质:
- t α ( n ) = − t 1 − α ( n ) t_{\alpha}(n) = -t_{1-\alpha}(n) tα(n)=−t1−α(n)
- 当 n ( n > 45 ) n (n>45) n(n>45) 足够大时,有: t α ( n ) ≈ u α t_{\alpha}(n) \approx u_{\alpha} tα(n)≈uα
F分布
【定义 1】设 U ∼ χ 2 ( n 1 ) U \sim \chi^2(n_1) U∼χ2(n1), V ∼ χ 2 ( n 2 ) V \sim \chi^2(n_2) V∼χ2(n2) 相互独立,则
F = U / n 1 V / n 2 ∼ F ( n 1 , n 2 ) F = \frac{U/n_1}{V/n_2} \sim F(n_1,n_2) F=V/n2U/n1∼F(n1,n2)
即随机变量 F F F 服从自由度为 ( n 1 , n 2 ) (n_1,n_2) (n1,n2) 的 F 分布。
【定义 2】对于任意正数 α ( 0 < α < 1 ) \alpha(0<\alpha<1) α(0<α<1),称满足条件
P { F > F α ( n 1 , n 2 ) } = ∫ F α ( n 1 , n 2 ) + ∞ f ( x ) d x = α P\{F > F_{\alpha} (n_1,n_2)\} = \int_{F_{\alpha} (n_1,n_2)}^{+\infty} f(x)dx = \alpha P{F>Fα(n1,n2)}=∫Fα(n1,n2)+∞f(x)dx=α
的数为 F 分布的上 α \alpha α 分位数。
有如下重要性质:
- F 1 − α ( n 1 , n 2 ) = 1 F α ( n 2 , n 1 ) F_{1-\alpha} (n_1,n_2) = \frac{1}{F_{\alpha} (n_2,n_1)} F1−α(n1,n2)=Fα(n2,n1)1
- 1 F ∼ F ( n 2 , n 1 ) \frac{1}{F} \sim F(n_2, n_1) F1∼F(n2,n1)
正态总体的【样本均值】与【样本方差】的分布
【定理】设 X 1 , X 2 , . . . , X n X_1, X_2,..., X_n X1,X2,...,Xn 是来自正态总体 N ( μ , σ 2 ) N(\mu, \sigma^2) N(μ,σ2) 的样本, X ˉ \bar{X} Xˉ 为样本均值, S 2 S^2 S2 为样本方差,则有:
- X ˉ \bar{X} Xˉ 和 S 2 S^2 S2 相互独立
- X ˉ ∼ N ( μ , σ 2 / n ) \bar{X} \sim N(\mu, \sigma^2/n) Xˉ∼N(μ,σ2/n)
- ( n − 1 ) S 2 σ 2 ∼ χ 2 ( n − 1 ) \frac{(n-1)S^2}{\sigma^2} \sim \chi^2(n-1) σ2(n−1)S2∼χ2(n−1)
- X ˉ − μ S / n ∼ t ( n − 1 ) \frac{\bar{X} - \mu}{S/\sqrt{n}} \sim t(n-1) S/nXˉ−μ∼t(n−1)