数据结构对于理解非常重要。数据结构是我们将在R中日常处理的对象。对于初学者来说, 处理对象转换是最常见的绝望根源。我们可以说R中的所有东西都是对象。
R具有许多数据结构, 其中包括:
文章图片
- 原子向量
- list
- Array
- 矩阵
- 数据框
- 因素
向量是R中的基本数据结构, 或者可以说向量是最基本的R数据对象。原子向量有六种类型, 例如逻辑, 整数, 字符, 双精度和原始。 “ 向量是元素的集合, 最常见的是模式字符, 整数, 逻辑或数字” 向量可以是以下两种类型之一:
- 原子向量
- 清单
在R中, 列表是容器。与原子向量不同, 列表不限于单一模式。列表包含多种数据类型。该列表也称为通用向量, 因为列表的元素可以是任何类型的R对象。 “ 列表是向量的一种特殊类型, 其中每个元素可以是不同的类型。”
我们可以借助list()或as.list()创建一个列表。我们可以使用vector()创建所需长度的空列表。
数组
还有另一种类型的数据对象, 可以在两个以上的维度(称为数组)中存储数据。 “ 数组是具有连续内存分配的相似数据类型的集合。” 假设, 如果我们创建一个尺寸为(2, 3, 4)的数组, 那么它将创建两个两行三列的四个矩形矩阵。
在R中, 借助于array()函数创建一个数组。此函数将向量作为输入, 并使用dim参数中的值创建一个数组。
矩阵
矩阵是R对象, 其中元素以二维矩形布局排列。在矩阵中, 包含相同原子类型的元素。为了进行数学计算, 可以使用包含数字元素的矩阵。借助R中的matrix()函数创建一个矩阵。
句法
创建矩阵的基本语法如下:
matrix(data, no_row, no_col, by_row, dim_name)
数据框
数据框是二维数组状结构, 或者我们可以说它是一个表, 其中每一列包含一个变量的值, 而行包含每一列的值的集合。
数据帧具有以下特征:
- 列名将为非空。
- 行名将是唯一的。
- 数据框存储数字, 因子或字符类型数据。
- 每列将包含相同数量的数据项。
因子也是数据对象, 用于对数据进行分类并将其存储为级别。因子可以存储字符串和整数。列具有有限数量的唯一值, 因此因子在列中非常有用。它在用于统计建模的数据分析中非常有用。
【R编程中的数据结构介绍】通过将向量作为输入参数, 借助factor()函数创建因子。