pandas数值排序的实现实例 pandas数值排序的实现实例

1.按照一列数值进行排序

1.1按照五缺失值的一列进行排序

1.1.1升序排列
1.1.2 降序排列

1.2按照有缺失值的一列进行排序

1.2.1 缺失值显示在最后
1.2.2 缺失值显示在最前面

2.按照多列数值进行排序

本文用到的表格内容如下:

文章图片

排序前先来看一下原始情形:

import pandas as pd?df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df)

result:
姓名年龄成绩
0小明23.078
1小刚NaN89
2小红876.065
3李华65.089
4小美NaN43
5张三34.090
6李四NaN34
7王五98.587

1.按照一列数值进行排序
按照某一列数值进行排序就是整个数据表都要以某一列为准，进行升序或降序
排序需要用到sort_values()方法，在sort_values()方法中要通过by参数指明要排序的列名，通过ascending参数知名升序还是降序。

1.1按照五缺失值的一列进行排序

1.1.1升序排列
该方法默认升序排列(即ascending参数的默认值是True)，使用by参数用来指定需要排序的列名

df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.sort_values(by=["成绩"]))

result:
姓名年龄成绩
6李四NaN34
4小美NaN43
2小红876.065
0小明23.078
7王五98.587
1小刚NaN89
3李华65.089
5张三34.090

【pandas数值排序的实现实例】
1.1.2 降序排列
只要设置ascending参数的值为False,即可实现降序排列

df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.sort_values(by=["成绩"], ascending=False))

result:
姓名年龄成绩
5张三34.090
1小刚NaN89
3李华65.089
7王五98.587
0小明23.078
2小红876.065
4小美NaN43
6李四NaN34

1.2按照有缺失值的一列进行排序

当待排序的列中有缺失值时，可以通过设置na_position参数对缺失值的显示位置进行设置

1.2.1 缺失值显示在最后
该方法默认缺失值显示在最后(na_position参数的默认值是last)

df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.sort_values(by=["成绩"]))df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.sort_values(by=["年龄"]))

result:
姓名年龄成绩
0小明23.078
5张三34.090
3李华65.089
7王五98.587
2小红876.065
1小刚NaN89
4小美NaN43
6李四NaN34

1.2.2 缺失值显示在最前面
只要设置na_position参数的值为first,即可实现缺失值显示在最前面

df = pd.read_excel(r'C:\Users\admin\Desktop\测试.xlsx')print(df.sort_values(by=["年龄"], na_position='first'))

result:
姓名年龄成绩
1小刚NaN89
4小美NaN43
6李四NaN34
0小明23.078
5张三34.090
3李华65.089
7王五98.587
2小红876.065

2.按照多列数值进行排序
按照多列数值排序是指同时依据多列数据进行升序、降序排列。当第一列出现重复值时按照第二列进行排序，第二列出现重复值时按照第三列进行排序，依次类推。
此时在sort_values()方法中需要排序的多个列名要以列表的形式传递给by参数，需要每个排序的列名所对应的排序方式也要以列表的形式传递给ascending参数，二者的列表要一一对应。