8.1 R 的统计表

R 给出了详尽的统计表。R 还提供了相关工具来计算累计概率分布函数 P (X ≤ x),概率密度函数和分位数函数(给定q,符合P (X ≤ x) > q 的最小x就是对应的分位数),和基于概率分布的计算机模拟。

概率分布 R对应的名字 附加参数
β分布 beta shape1, shape2, ncp
二项式分布 binom size, prob
Cauchy分布 cauchy location, scale
卡方分布 chisq df, ncp
指数分布 exp rate
F分布 f df1, df1, ncp
γ分布 gamma shape, scale
几何分布 geom prob
超几何分布 hyper m,n,k
对数正态分布 lnorm meanlog, sdlog
logistic分布 logis location, scale
负二项式分布 nbinom size, prob
正态分布 norm mean, sd
Poisson分布 pois lambda
t分布 t df, ncp
均匀分布 unif min, max
Weibull分布 weibull shape, scale
Wilcoxon分布 wilcox m, n

不同的名字前缀表示不同的含义,d 表示概率密度函数,p 表示累积分布函数 (cumulative distribution function,CDF),q 表示分位函数以及 r 表示随机模拟(random deviates)或者随机数发生器。dxxx 的第一个参数是 xpxxxqqxxxp,和rxxx 的是 n (rhyperrwilcox 例外,二者的参数是 nn)。偏态指数(non- centrality parameter) ncp 现在仅用于累积分布函数,大多数概率密度函数和部分其他情况1:更细节的内容可以参考在线帮助文档。

pxxxqxxx 函数都有逻辑参数 lower.taillog.pdxxx 也有一个逻辑参数 log。这样就让计算函数的各种累积概率值成为可能。例如可以通过下式直接计算累计(“积分的”)风险(hazard)函数,H(t) = −log(1 − F(t)),

- pxxx(t, ..., lower.tail = FALSE, log.p = TRUE)

或用来计算更精确的对数似然值(dxxx(..., log = TRUE))。

此外还有函数 ptukeyqtukey 计算来自正态分布样本的标准化全距(studentized range)的分布,以及处理多项分布(multinomial distribution)的 dmultinomrmultinom 。贡献包(contributed packages)中包含更多分布,尤其是SuppDists

这里是一些例子

> ## t分布的双侧p值
> 2*pt(-2.43, df = 13)
> ## F(2, 7)分布的上1%分位数 
> qf(0.99, 2, 7, lower.tail = FALSE)

可参见 RNG 在线帮助在 R 中如何生成随机数。


1. 译者注:原文为“In not quite all cases is the non-centrality parameter ncp are currently available...”

results matching ""

    No results matching ""