Java | Web | Python | ||
---|---|---|---|---|
張三 | 期中 | 68 | 4 | 90 |
期末 | 33 | 63 | 73 | |
李四 | 期中 | 30 | 13 | 68 |
期末 | 14 | 18 | 48 | |
王五 | 期中 | 34 | 66 | 26 |
期末 | 89 | 10 | 35 |
import pandas as pd import numpy as np data = np.random.randint(0,100,size=(6,3)) names = ['張三','李四','王五'] exam = ['期中','期末'] index = pd.MultiIndex.from_product([names,exam]) df = pd.DataFrame(data,index=index,columns=['Java','Web','Python']) # print(df) df
Java | Web | Python | ||
---|---|---|---|---|
張三 | 期中 | 51 | 78 | 47 |
期末 | 39 | 53 | 36 | |
李四 | 期中 | 33 | 60 | 83 |
期末 | 90 | 55 | 3 | |
王五 | 期中 | 37 | 45 | 66 |
期末 | 6 | 82 | 71 |
from_product()在這個(gè)里面的列表中位置不同, 產(chǎn)生的索引頁會(huì)不同
index = pd.MultiIndex.from_product([exam, names]) df = pd.DataFrame(data,index=index,columns=['Java','Web','Python']) # print(df) df
Java | Web | Python | ||
---|---|---|---|---|
期中 | 張三 | 51 | 78 | 47 |
李四 | 39 | 53 | 36 | |
王五 | 33 | 60 | 83 | |
期末 | 張三 | 90 | 55 | 3 |
李四 | 37 | 45 | 66 | |
王五 | 6 | 82 | 71 |
from_product([exam,names])會(huì)將列表中第一個(gè)元素作為最外層索引,依次類推
獲取到我們想要的數(shù)據(jù)
創(chuàng)建數(shù)據(jù)
import pandas as pd s = pd.Series([1,2,3,4,5,6],index=[['張三','張三','李四','李四','王五','王五'], ['期中','期末','期中','期末','期中','期末']]) print(s)
張三 期中 1
期末 2
李四 期中 3
期末 4
王五 期中 5
期末 6
dtype: int64
可以直接使用[]的方式取最外面的一個(gè)層級(jí) s[‘張三']
s['李四'] # 注意:[]取值方式,不可直接使用最外層以外的其他層級(jí),例如:s['期末']
期中 3
期末 4
dtype: int64
使用['外索引', '內(nèi)索引'], 獲取某個(gè)數(shù)據(jù)
注意:[‘張三',‘期末']他們的順序不能變。剝洋蔥原則,從外到內(nèi)一層一層的剝。
s['李四', '期中'] # 李四期中分值 # 注意:['張三','期末']他們的順序不能變。剝洋蔥原則,從外到內(nèi)一層一層的剝。
3
使用[]的切片,獲取數(shù)據(jù)s[:,‘期中']
s[:,'期中'] # 第一個(gè)值為全部的外索引
張三 1
李四 3
王五 5
dtype: int64
# loc 使用方式與 [] 的方式基本一樣 s.loc['張三'] s.loc['張三','期中'] s.loc[:,'期中'] # iloc 的取值并不會(huì)受多層索引影響,只會(huì)根據(jù)數(shù)據(jù)的位置索引進(jìn)行取值, 不推薦
張三 1
李四 3
王五 5
dtype: int64
在對(duì)多層索引DataFrame的取值是,推薦使用 loc() 函數(shù)
import pandas as pd import numpy as np #size參數(shù)是指定生成6行3列的數(shù)組 data = np.random.randint(0,100,size=(6,3)) names = ['張三','李四','王五'] exam = ['期中','期末'] index = pd.MultiIndex.from_product([names,exam]) df = pd.DataFrame(data,index=index,columns=['Java','Web','Python']) df
Java | Web | Python | ||
---|---|---|---|---|
張三 | 期中 | 3 | 40 | 52 |
期末 | 74 | 38 | 85 | |
李四 | 期中 | 7 | 28 | 16 |
期末 | 9 | 25 | 0 | |
王五 | 期中 | 13 | 24 | 8 |
期末 | 49 | 46 | 1 |
三種方式都可以獲取張三期中各科成績
# df.loc['張三','期中'] # df.loc['張三'].loc['期中'] # df.loc[('張三','期中')]
注意:DataFrame中對(duì)行索引的時(shí)候和Series有一個(gè)同樣的注意點(diǎn),就是無法直接對(duì)二級(jí)索引直接進(jìn)行索引,必須讓二級(jí)索引變成一級(jí)索引后才能對(duì)其進(jìn)行索引
創(chuàng)建數(shù)據(jù)
import pandas as pd data = np.random.randint(0,100,size=(9,3)) key1 = ['b','c','a'] key2 = [2,1,3] index = pd.MultiIndex.from_product([key1,key2]) df = pd.DataFrame(data,index=index,columns=['Java','Web','Python']) df
Java | Web | Python | ||
---|---|---|---|---|
b | 2 | 56 | 82 | 81 |
1 | 84 | 16 | 55 | |
3 | 35 | 25 | 86 | |
c | 2 | 76 | 1 | 76 |
1 | 36 | 28 | 94 | |
3 | 79 | 70 | 97 | |
a | 2 | 25 | 17 | 30 |
1 | 38 | 38 | 78 | |
3 | 41 | 75 | 90 |
df.sort_index()
Java | Web | Python | ||
---|---|---|---|---|
a | 1 | 18 | 60 | 74 |
2 | 66 | 87 | 27 | |
3 | 96 | 18 | 64 | |
b | 1 | 72 | 58 | 52 |
2 | 22 | 31 | 22 | |
3 | 31 | 12 | 83 | |
c | 1 | 6 | 54 | 96 |
2 | 9 | 47 | 18 | |
3 | 31 | 63 | 4 |
# 當(dāng)level=0時(shí),ascending=False, 會(huì)根據(jù)第一層索引值進(jìn)行降序排序 df.sort_index(level=0,ascending=False)
Java | Web | Python | ||
---|---|---|---|---|
c | 3 | 79 | 70 | 97 |
2 | 76 | 1 | 76 | |
1 | 36 | 28 | 94 | |
b | 3 | 35 | 25 | 86 |
2 | 56 | 82 | 81 | |
1 | 84 | 16 | 55 | |
a | 3 | 41 | 75 | 90 |
2 | 25 | 17 | 30 | |
1 | 38 | 38 | 78 |
# 當(dāng)level=1時(shí),會(huì)根據(jù)第二層索引值進(jìn)行降序排序 df.sort_index(level=1,ascending=False) # 數(shù)據(jù)會(huì)根據(jù)第二層索引值進(jìn)行相應(yīng)的降序排列, # 如果索引值相同時(shí)會(huì)根據(jù)其他層索引值排列
Java | Web | Python | ||
---|---|---|---|---|
c | 3 | 79 | 70 | 97 |
b | 3 | 35 | 25 | 86 |
a | 3 | 41 | 75 | 90 |
c | 2 | 76 | 1 | 76 |
b | 2 | 56 | 82 | 81 |
a | 2 | 25 | 17 | 30 |
c | 1 | 36 | 28 | 94 |
b | 1 | 84 | 16 | 55 |
a | 1 | 38 | 38 | 78 |
通過level設(shè)置排序的索引層級(jí),其他層索引也會(huì)根據(jù)其排序規(guī)則進(jìn)行排序
到此這篇關(guān)于pandas多層索引的創(chuàng)建和取值以及排序的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas多層索引內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
標(biāo)簽:梅州 石家莊 錫林郭勒盟 昆明 懷化 文山 西寧 浙江
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《pandas多層索引的創(chuàng)建和取值以及排序的實(shí)現(xiàn)》,本文關(guān)鍵詞 pandas,多層,索引,的,創(chuàng),建和,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。