功能:数值型变量转变为因子变量
cut将x的范围划分为若干个区间,并根据这些区间对x中的值进行编码。最左边的区间对应于第一级,第二左的区间对应第二级。
cut(x, breaks, labels = NULL,
include.lowest = FALSE, right = TRUE, dig.lab = 3,
ordered_result = FALSE, ...)
x:数值型向量
break 可以为自定义的分组也可以为大于等于2的数字,如果是数字,则软件会自动均分数值间的距离,如果不想均分,可以自定义分类距离
right 代表区间的左右端开和闭 默认为true,代表左开又闭,当设置成False的时候,为左闭右开
label 为标签向量,代表给每段间距设置一个标签,相当于每个间距给一个名字
Z <- stats::rnorm(10000)
table(cut(Z, breaks = -6:6))
(-6,-5] (-5,-4] (-4,-3] (-3,-2] (-2,-1](-1,0](0,1](1,2](2,3](3,4](4,5]
0017232134834573317139322790
(5,6]
0 sum(table(cut(Z, breaks = -6:6, labels = FALSE)))
sum(graphics::hist(Z, breaks = -6:6, plot = FALSE)$counts)
【R语言cut函数】
推荐阅读
- 大数据处理|R语言:gl()函数
- r语言|R语言-岭回归的代码与案例解读
- 学习笔记|R语言入门学习笔记1——5种数据模式(vector,matrix, factor, list, data frame)
- r语言|r语言 新增一列数字类型_R语言实战之R语言基础语法精讲(一)
- R语言从入门到机器学习|R语言对dataframe的行数据进行排序(Ordering rows)实战(使用R原生方法、data.table、dplyr等方案)
- R语言入门课|R语言使用reshape包的rename函数修改数据变量的名称、例如、使用rename函数自定义修改dataframe数据列的名称
- R语言入门课|R语言使用dim函数查看数据维度、例如、使用dim函数查看dataframe数据有多少行多少列
- R语言|R语言(Newton法、似然函数)
- Prometheus|PromQL 计算Counter指标增长率 rate irate increase