目录
1. 数学统计函数
2. 描述性统计函数
2.1 summary()
2.2 fivenum ()
【R语言|R语言数学统计函数和描述性统计函数】 2.3 describe()
1. 数学统计函数 R语言中有许多基于概率论的数学统计函数。这里主要讨论R中的概率分布函数,R中有将近20种不同分布的函数它们都有几种前缀,其中d开头代表其是概率密度函数,p开头是分布函数,q开头是分布函数的反函数,r开头是产生满足该分布的随机数,在d、p、q、r后面加上相应分布的名称就构成了相应的函数例如r+binomial->rbinom()表示的就是生成二项分布的随机数的函数
分布 | 随机数 | 概率密度 | 分布函数 | 分位数函数 |
正态分布 | rnorm | dnorm | pnorm | qnorm |
二项分布 | rbinom | dbinom | pbinom | qbinom |
负二项分布 | rnbinom | dnbinom | pnbinom | qnbinom |
几何分布 | rgeom | dgeom | pgeom | qgeom |
超几何分布 | rhyper | dhyper | phyper | qhyper |
F分布 | rf | df | pf | qf |
泊松分布 | rpois | dpois | ppois | qpois |
t分布 | rt | dt | pt | qt |
连续均匀分布 | runif | dunif | punif | qunif |
> m<-mtcars[c("mpg","hp","wt","am")]
> summary(m)
mpghpwtam
Min.:10.40Min.: 52.0Min.:1.513Min.:0.0000
1st Qu.:15.431st Qu.: 96.51st Qu.:2.5811st Qu.:0.0000
Median :19.20Median :123.0Median :3.325Median :0.0000
Mean:20.09Mean:146.7Mean:3.217Mean:0.4062
3rd Qu.:22.803rd Qu.:180.03rd Qu.:3.6103rd Qu.:1.0000
Max.:33.90Max.:335.0Max.:5.424Max.:1.0000
2.2 fivenum () fivenum函数功能与summary类似,不过是针对某一列,从左到右依次从最小值到最大值
> fivenum(m$mpg)
[1] 10.40 15.35 19.20 22.80 33.90
2.3 describe() describe函数会告诉你最值和缺失值数目等
> describe(m)
m 4Variables32Observations
------------------------------------------------------------------------------
mpg
nmissing distinctInfoMeanGmd.05.10
320250.99920.096.79612.0014.34
.25.50.75.90.95
15.4319.2022.8030.0931.30 lowest : 10.4 13.3 14.3 14.7 15.0, highest: 26.0 27.3 30.4 32.4 33.9
------------------------------------------------------------------------------
hp
nmissing distinctInfoMeanGmd.05.10
320220.997146.777.0463.6566.00
.25.50.75.90.95
96.50123.00180.00243.50253.55 lowest :5262656691, highest: 215 230 245 264 335
------------------------------------------------------------------------------
wt
nmissing distinctInfoMeanGmd.05.10
320290.9993.2171.0891.7361.956
.25.50.75.90.95
2.5813.3253.6104.0485.293 lowest : 1.513 1.615 1.835 1.935 2.140, highest: 3.845 4.070 5.250 5.345 5.424
------------------------------------------------------------------------------
am
nmissing distinctInfoSumMeanGmd
32020.724130.40620.498 ------------------------------------------------------------------------------
>
推荐阅读
- 人工智能|重磅!李沐在斯坦福开新课了!
- 人工智能|李沐分享斯坦福2021秋季新课(实用机器学习)
- Machine|在pycharm中部署yolov5报错问题
- 机器学习|基于飞桨实现BigGAN生成动漫图像——为艺术创作赋能
- 代码文件备份 | 3-10(对arraymatrix数据进行初步筛选与分组差异表达分析)
- 单细胞测序|经验总结 | R语言批量读取目录下的文件然后按照行名对其进行整合成为data.frame
- 笔记|R语言画图 | 如何看已知基因list的细胞类型特异性表达()
- 拓端tecdat|【视频】线性混合效应模型(LMM,Linear Mixed Models)和R语言实现案例
- 拓端tecdat|拓端tecdat|R语言多变量广义正交GARCH(GO-GARCH)模型对股市高维波动率时间序列拟合预测