目錄
- 1.按照一列數(shù)值進(jìn)行排序
- 1.1按照五缺失值的一列進(jìn)行排序
- 1.2按照有缺失值的一列進(jìn)行排序
- 1.2.1 缺失值顯示在最后
- 1.2.2 缺失值顯示在最前面
- 2.按照多列數(shù)值進(jìn)行排序
本文用到的表格內(nèi)容如下:
排序前先來看一下原始情形:
import pandas as pd
df = pd.read_excel(r'C:\Users\admin\Desktop\測(cè)試.xlsx')
print(df)
result:
姓名 年齡 成績(jī)
0 小明 23.0 78
1 小剛 NaN 89
2 小紅 876.0 65
3 李華 65.0 89
4 小美 NaN 43
5 張三 34.0 90
6 李四 NaN 34
7 王五 98.5 87
1.按照一列數(shù)值進(jìn)行排序
按照某一列數(shù)值進(jìn)行排序就是整個(gè)數(shù)據(jù)表都要以某一列為準(zhǔn),進(jìn)行升序或降序
排序需要用到sort_values()方法,在sort_values()方法中要通過by參數(shù)指明要排序的列名,通過ascending參數(shù)知名升序還是降序。
1.1按照五缺失值的一列進(jìn)行排序
1.1.1升序排列
該方法默認(rèn)升序排列(即ascending參數(shù)的默認(rèn)值是True),使用by參數(shù)用來指定需要排序的列名
df = pd.read_excel(r'C:\Users\admin\Desktop\測(cè)試.xlsx')
print(df.sort_values(by=["成績(jī)"]))
result:
姓名 年齡 成績(jī)
6 李四 NaN 34
4 小美 NaN 43
2 小紅 876.0 65
0 小明 23.0 78
7 王五 98.5 87
1 小剛 NaN 89
3 李華 65.0 89
5 張三 34.0 90
1.1.2 降序排列
只要設(shè)置ascending參數(shù)的值為False,即可實(shí)現(xiàn)降序排列
df = pd.read_excel(r'C:\Users\admin\Desktop\測(cè)試.xlsx')
print(df.sort_values(by=["成績(jī)"], ascending=False))
result:
姓名 年齡 成績(jī)
5 張三 34.0 90
1 小剛 NaN 89
3 李華 65.0 89
7 王五 98.5 87
0 小明 23.0 78
2 小紅 876.0 65
4 小美 NaN 43
6 李四 NaN 34
1.2按照有缺失值的一列進(jìn)行排序
當(dāng)待排序的列中有缺失值時(shí),可以通過設(shè)置na_position參數(shù)對(duì)缺失值的顯示位置進(jìn)行設(shè)置
1.2.1 缺失值顯示在最后
該方法默認(rèn)缺失值顯示在最后(na_position參數(shù)的默認(rèn)值是last)
df = pd.read_excel(r'C:\Users\admin\Desktop\測(cè)試.xlsx')
print(df.sort_values(by=["成績(jī)"]))
df = pd.read_excel(r'C:\Users\admin\Desktop\測(cè)試.xlsx')
print(df.sort_values(by=["年齡"]))
result:
姓名 年齡 成績(jī)
0 小明 23.0 78
5 張三 34.0 90
3 李華 65.0 89
7 王五 98.5 87
2 小紅 876.0 65
1 小剛 NaN 89
4 小美 NaN 43
6 李四 NaN 34
1.2.2 缺失值顯示在最前面
只要設(shè)置na_position參數(shù)的值為first,即可實(shí)現(xiàn)缺失值顯示在最前面
df = pd.read_excel(r'C:\Users\admin\Desktop\測(cè)試.xlsx')
print(df.sort_values(by=["年齡"], na_position='first'))
result:
姓名 年齡 成績(jī)
1 小剛 NaN 89
4 小美 NaN 43
6 李四 NaN 34
0 小明 23.0 78
5 張三 34.0 90
3 李華 65.0 89
7 王五 98.5 87
2 小紅 876.0 65
2.按照多列數(shù)值進(jìn)行排序
按照多列數(shù)值排序是指同時(shí)依據(jù)多列數(shù)據(jù)進(jìn)行升序、降序排列。當(dāng)?shù)谝涣谐霈F(xiàn)重復(fù)值時(shí)按照第二列進(jìn)行排序,第二列出現(xiàn)重復(fù)值時(shí)按照第三列進(jìn)行排序,依次類推。
此時(shí)在sort_values()方法中需要排序的多個(gè)列名要以列表的形式傳遞給by參數(shù),需要每個(gè)排序的列名所對(duì)應(yīng)的排序方式也要以列表的形式傳遞給ascending參數(shù),二者的列表要一一對(duì)應(yīng)。
df = pd.read_excel(r'C:\Users\admin\Desktop\測(cè)試.xlsx')
print(df.sort_values(by=["成績(jī)", "年齡"], ascending=[True, False]))
result:
姓名 年齡 成績(jī)
6 李四 NaN 34
4 小美 NaN 43
2 小紅 876.0 65
0 小明 23.0 78
7 王五 98.5 87
3 李華 65.0 89
1 小剛 NaN 89
5 張三 34.0 90
此時(shí)按照成績(jī)進(jìn)行升序排列,當(dāng)成績(jī)相同時(shí)再按照年齡進(jìn)行降序排列。
到此這篇關(guān)于pandas數(shù)值排序的實(shí)現(xiàn)實(shí)例的文章就介紹到這了,更多相關(guān)pandas數(shù)值排序內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!