drop_duplicates()函数执行常见的数据清理任务, 该任务处理DataFrame中的重复值。此方法有助于从DataFrame中删除重复的值。
句法
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
参数
- 子集:它采用一列或列标签列表。它仅考虑用于标识重复项的某些列。默认值无。
- keep:用于控制如何考虑重复值。它具有三个不同的值, 如下所示:
- first:删除除第一个匹配项外的重复值。
- last:删除最后一次出现的重复值。
- 错误:删除所有重复项。
- inplace:返回布尔值。默认值为False。
返回
根据传递的参数, 它返回删除了重复行的DataFrame。
例子
import pandas as pdemp = {"Name": ["Parker", "Smith", "William", "Parker"], "Age": [21, 32, 29, 21]}info = pd.DataFrame(emp)print(info)
输出
NameAge0Parker211Smith322William293Parker21
import pandas as pdemp = {"Name": ["Parker", "Smith", "William", "Parker"], "Age": [21, 32, 29, 21]}info = pd.DataFrame(emp)info = info.drop_duplicates()print(info)
【Pandas DataFrame.drop_duplicates()用例】输出
NameAge0Parker211Smith322William29
推荐阅读
- Pandas DataFrame.describe()使用例子
- Pandas DataFrame.cut()用法例子
- Pandas DataFrame.astype()使用实例
- Pandas DataFrame.assign()用法介绍
- Pandas DataFrame.aggregate()使用例子
- 《锦绣未央》吴建豪表情包大全_微信
- 微博粉丝排行榜怎样看?_新浪微博
- 微博粉丝排行榜在啥地方看?_新浪微博
- 微博粉丝怎样刷?新浪微博增加粉丝办法_新浪微博