python去重复的函数 python去除重复值( 二 )


在excel中可以按“F5” , 在“定位条件”中选择“空值”,选中后,输入替换信息,再按“Ctrl+Enter”即可完成替换 。
在python中,使用函数 isnull 和 notnull 来检测数据丢失, 包含空值返回True , 不包含则返回False 。
pd.isnull(data1)
pd.notnull(data1)
也可以使用函数的实例方法,以及加入参数 , 对某一列进行检查:
print data1['Func'].isnull()
输出
Func Gene Size
0 True False False
1 False False False
2 False False False
再使用fillna对空值进行填充:
data.fillna(value=https://www.04ip.com/post/0)
#用0来填充空值
data['Size'].fillna(data1['Size'].mean())
#用data1中Size列的平均值来填充空值
data['Func']=data['Func'].map(str.strip)
#清理Func列中存在的空格
Excel中可以按“Ctrl+F”,可调出替换对话框,替换相应数据 。
Python中,使用replace函数替换:
data['Func'].replace('monooxygenase', 'oxidase')
将Func列中的'monooxygenase'替换成'oxidase' 。
Excel中,通过“数据-筛选-高级”可以选择性地看某一列的唯一值 。
Python中,使用unique函数查看:
print data['Func'].unique()
输出
[nan u'monooxygenase' u'aminotransferase' u'methyltransferase']
Excel中,通过UPPER、LOWER、PROPER等函数来变成大写、小写、首字母大写 。
Python中也有同名函数:
data1['Gene'].str.lower()
Excel中可以通过“数据-删除重复项”来去除重复值 。
Python中,可以通过drop_duplicates函数删除重复值:
print data['Func'].drop_duplicates()
输出
0 NaN
1 monooxygenase
2 aminotransferase
3 methyltransferase
Name: Func, dtype: object
还可以设置“ keep=’last’ ”参数 , 后出现的被保留 , 先出现的被删除:
print data['Func'].drop_duplicates(keep='last')
输出
2 aminotransferase
3 methyltransferase
6 monooxygenase
8 NaN
Name: Func, dtype: object
内容参考:
Python For Data Analysis
蓝鲸网站分析博客,作者蓝鲸(王彦平)
python如何去掉三维数组中重复的向量unique函数用来去除矩阵A中重复python去重复的函数的元素python去重复的函数,
比如说A=[1,2,3,3,4],那么unique(A)=[1,2,3,4]python去重复的函数;
如果A=[1,2,3;3,4,5],那么unique(A)=[1,2,3,4,5];
unique(A,'rows')用来去除矩阵A中重复的行python去重复的函数,
比如说A=[1,2,3;4,5,6;1,2,3],
那么unique(A,'rows')=[1,2,3;4,5,6];
综上python去重复的函数,如果x=[1 1 1 2 2 2 3 3 3 3 3],
那么unique(x)=[1,2,3] 。
Python 。重复元素判定 。编写一个函数,接受列表作为参数代码如下:
def func1(num_list):
if len(num_list) != len(set(num_list)):
return True
else:
return False
if __name__ == '__main__':
num_list = [[1, 2, 3, 4], [6, 7, 8], [4, 5, 6, 6, 6]]
for one_list in num_list:
print(func1(one_list))
运行结果:
扩展资料
python对列表去重python去重复的函数的几种方式:
1、直观方法python去重复的函数,先建立一个新的空列表,通过遍历原来的列表,再利用逻辑关系not in 来去重 。总结:这样可以做出来 , 但是过程不够简单 。但是此方法保证了列表的顺序性 。
2、利用set的自动去重功能,将列表转化为集合再转化为列表,利用集合的自动去重功能 。简单快速 。缺点是:使用set方法无法保证去重后的顺序 。
参考资料:python-Doc语法文档
Python lock函数重复调用解决重复调用 。

推荐阅读