8.1 R 的统计表
R 给出了详尽的统计表。R 还提供了相关工具来计算累计概率分布函数 P (X ≤ x),概率密度函数和分位数函数(给定q,符合P (X ≤ x) > q 的最小x就是对应的分位数),和基于概率分布的计算机模拟。
概率分布 | R对应的名字 | 附加参数 |
---|---|---|
β分布 | beta | shape1, shape2, ncp |
二项式分布 | binom | size, prob |
Cauchy分布 | cauchy | location, scale |
卡方分布 | chisq | df, ncp |
指数分布 | exp | rate |
F分布 | f | df1, df1, ncp |
γ分布 | gamma | shape, scale |
几何分布 | geom | prob |
超几何分布 | hyper | m,n,k |
对数正态分布 | lnorm | meanlog, sdlog |
logistic分布 | logis | location, scale |
负二项式分布 | nbinom | size, prob |
正态分布 | norm | mean, sd |
Poisson分布 | pois | lambda |
t分布 | t | df, ncp |
均匀分布 | unif | min, max |
Weibull分布 | weibull | shape, scale |
Wilcoxon分布 | wilcox | m, n |
不同的名字前缀表示不同的含义,d 表示概率密度函数,p 表示累积分布函数 (cumulative distribution function,CDF),q 表示分位函数以及 r
表示随机模拟(random deviates)或者随机数发生器。dxxx
的第一个参数是 x
,pxxx
是 q
,qxxx
是 p
,和rxxx
的是 n
(rhyper
和 rwilcox
例外,二者的参数是 nn
)。偏态指数(non- centrality parameter) ncp
现在仅用于累积分布函数,大多数概率密度函数和部分其他情况1:更细节的内容可以参考在线帮助文档。
pxxx
和 qxxx
函数都有逻辑参数 lower.tail
和 log.p
,dxxx
也有一个逻辑参数 log
。这样就让计算函数的各种累积概率值成为可能。例如可以通过下式直接计算累计(“积分的”)风险(hazard)函数,H(t) = −log(1 − F(t)),
- pxxx(t, ..., lower.tail = FALSE, log.p = TRUE)
或用来计算更精确的对数似然值(dxxx(..., log = TRUE)
)。
此外还有函数 ptukey
和 qtukey
计算来自正态分布样本的标准化全距(studentized range)的分布,以及处理多项分布(multinomial distribution)的 dmultinom
和 rmultinom
。贡献包(contributed packages)中包含更多分布,尤其是SuppDists
这里是一些例子
> ## t分布的双侧p值
> 2*pt(-2.43, df = 13)
> ## F(2, 7)分布的上1%分位数
> qf(0.99, 2, 7, lower.tail = FALSE)
可参见 RNG
在线帮助在 R 中如何生成随机数。
1. 译者注:原文为“In not quite all cases is the non-centrality parameter ncp are currently available...” ↩