8.1 R 的统计表

R 给出了详尽的统计表。R 还提供了相关工具来计算累计概率分布函数 P (X ≤ x)，概率密度函数和分位数函数(给定q，符合P (X ≤ x) > q 的最小x就是对应的分位数)，和基于概率分布的计算机模拟。

概率分布	R对应的名字	附加参数
β分布	beta	shape1, shape2, ncp
二项式分布	binom	size, prob
Cauchy分布	cauchy	location, scale
卡方分布	chisq	df, ncp
指数分布	exp	rate
F分布	f	df1, df1, ncp
γ分布	gamma	shape, scale
几何分布	geom	prob
超几何分布	hyper	m,n,k
对数正态分布	lnorm	meanlog, sdlog
logistic分布	logis	location, scale
负二项式分布	nbinom	size, prob
正态分布	norm	mean, sd
Poisson分布	pois	lambda
t分布	t	df, ncp
均匀分布	unif	min, max
Weibull分布	weibull	shape, scale
Wilcoxon分布	wilcox	m, n

不同的名字前缀表示不同的含义，d 表示概率密度函数，p 表示累积分布函数 (cumulative distribution function，CDF)，q 表示分位函数以及 r 表示随机模拟(random deviates)或者随机数发生器。dxxx 的第一个参数是 x，pxxx 是 q，qxxx 是 p，和rxxx 的是 n (rhyper 和 rwilcox 例外，二者的参数是 nn)。偏态指数(non- centrality parameter) ncp 现在仅用于累积分布函数，大多数概率密度函数和部分其他情况¹：更细节的内容可以参考在线帮助文档。

pxxx 和 qxxx 函数都有逻辑参数 lower.tail 和 log.p，dxxx 也有一个逻辑参数 log。这样就让计算函数的各种累积概率值成为可能。例如可以通过下式直接计算累计(“积分的”)风险(hazard)函数，H(t) = −log(1 − F(t))，

- pxxx(t, ..., lower.tail = FALSE, log.p = TRUE)

或用来计算更精确的对数似然值(dxxx(..., log = TRUE))。

此外还有函数 ptukey 和 qtukey 计算来自正态分布样本的标准化全距(studentized range)的分布，以及处理多项分布(multinomial distribution)的 dmultinom 和 rmultinom 。贡献包(contributed packages)中包含更多分布，尤其是SuppDists

这里是一些例子

> ## t分布的双侧p值
> 2*pt(-2.43, df = 13)
> ## F(2, 7)分布的上1%分位数 
> qf(0.99, 2, 7, lower.tail = FALSE)

可参见 RNG 在线帮助在 R 中如何生成随机数。

¹. 译者注:原文为“In not quite all cases is the non-centrality parameter ncp are currently available...” ↩

8.1 R 的统计表

8.1 R 的统计表

results matching ""

No results matching ""