常见数据处理方法

以存在缺失值和重复值的dataset数据集为例
1.删除缺失值
dataset1<-na.omit(dataset)
【常见数据处理方法】2.删除重复值
如dataset数据集中Ensembl.Gene.ID这一列存在重复值
(1)建立是否重复索引
index<-duplicated(data.set$Ensembl.Gene.ID)

index

在后面我们用!来取反:

data.set1<-data.set[!index,]

data.set1

3.数据合并merge()函数
4.数据转置t()函数

    推荐阅读