R语言统计分析——功效分析1(总述)
参考资料:R语言实战【第2版】
功效分析可以帮助在给定置信度的情况下,判断检测到给定效应值时所需要的样本量。功效分析也可以帮助我们在给定置信水平下,计算在在某样本量内能检测到给定效应值得概率。
在研究过程中,我们通常关注四个量:样本大小、显著性水平、功效和效应值,这四个量紧密相关(给定其中任意三个量,便可推算出第四个量):
样本大小:指的是实验设计中每种条件/组中观测的数目。
显著性水平(也成为α)由Ⅰ型错误的概率定义,也可以把它看作发现效应不发生的概率。
功效:通过1减去Ⅱ型错误来定义,我们可以把它看作真实效应发生的概率。
效应值:指的是在备择或研究假设下效应的量。效应值得表达式依赖于假设检验中使用的统计方法。
Ⅰ型错误:原假设为真,但拒绝原假设。
Ⅱ型错误:原假设为假,但不拒绝原假设。
虽然我们可以直接控制样本量的大小和显著性水平,但对于功效和效应值得影响却是间接的。如:放宽显著性水平时,检验的功效变会增加;增加样本量,功效也会增加。
通常来说,研究目标是维持一个可接受的显著性水平,尽量使用较少的样本,然后最大化统计检验的功效。即最大化发现真实效应的几率,并最小化发现错误效应的几率,同时把研究成本控制在合理的范围内。
pwr包可以实现功效分析,常用函数见下表,对于每个函数,我们可以设定四个量(样本大小,显著性水平,功效,效应值)中的三个量,第四个量将由软件计算出来。
函数 | 功效计算的对象 |
pwr.2p.test() | 两比例(n相等) |
pwr.2p2n.test() | 两比例(n不相等) |
pwr.anova.test() | 平衡的单因素方差分析 |
pwr.chisq.test() | 卡方检验 |
pwr.f2.test() | 广义线性模型 |
pwr.p.test() | 比例(单样本) |
pwr.r.test() | 相关系数 |
pwr.t.test() | t检验(单样本、双样本、配对) |
pwr.t2n.test() | t检验(不相等的两样本) |
四个量中,效应值时最难规定的。计算效应值通常需要一些相关估计的经验和对过去研究知识的理解。