无码免费无线观看在线视频,色综合色综合色综合,久久精品国产亚洲av麻

主頁 > 知識(shí)庫 > pandas多層索引的創(chuàng)建和取值以及排序的實(shí)現(xiàn)

pandas多層索引的創(chuàng)建和取值以及排序的實(shí)現(xiàn)

多層索引的創(chuàng)建

普通-多個(gè)index創(chuàng)建

在創(chuàng)建數(shù)據(jù)的時(shí)候加入一個(gè)index列表,這個(gè)index列表里面是多個(gè)索引列表

Series多層索引的創(chuàng)建方法

import pandas as pd
s = pd.Series([1,2,3,4,5,6],index=[['張三','張三','李四','李四','王五','王五'],
                  ['期中','期末','期中','期末','期中','期末']])
# print(s)
s

張三期中    1
    期末    2
李四期中    3
    期末    4
王五期中    5
    期末    6
dtype: int64

利用 numpy中的隨機(jī)數(shù)

import numpy as np

data = np.random.randint(0,100,size=(6,3))
# np.random.randint(0,100,size=(6,3))是使用numpy中的隨機(jī)模塊random中，生成隨機(jī)整數(shù)方法randint，
# 里面的參數(shù)size是指定生成6行3列的數(shù)據(jù)，并且每個(gè)數(shù)字的范圍在0到100之間

data

array([[44, 66, 67],
    [82, 52, 0],
    [34, 78, 23],
    [38, 4, 43],
    [60, 62, 40],
    [57, 9, 11]])

Dataframe多層索引創(chuàng)建

import pandas as pd
import numpy as np

data = np.random.randint(0,100,size=(6,3))
df = pd.DataFrame(data,index=[['張三','張三','李四','李四','王五','王五'],
               ['期中','期末','期中','期末','期中','期末']],
           columns=['Java','Web','Python'])

df

	Java	Web	Python
張三	期中	68	4	90
張三	期末	33	63	73
李四	期中	30	13	68
李四	期末	14	18	48
王五	期中	34	66	26
王五	期末	89	10	35

簡化創(chuàng)建-from_product()

import pandas as pd
import numpy as np

data = np.random.randint(0,100,size=(6,3))
names = ['張三','李四','王五']
exam = ['期中','期末']
index = pd.MultiIndex.from_product([names,exam])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])
# print(df)
df

	Java	Web	Python
張三	期中	51	78	47
張三	期末	39	53	36
李四	期中	33	60	83
李四	期末	90	55	3
王五	期中	37	45	66
王五	期末	6	82	71

from_product()在這個(gè)里面的列表中位置不同, 產(chǎn)生的索引頁會(huì)不同

index = pd.MultiIndex.from_product([exam, names])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])
# print(df)
df

	Java	Web	Python
期中	張三	51	78	47
	李四	39	53	36
	王五	33	60	83
期末	張三	90	55	3
	李四	37	45	66
	王五	6	82	71

from_product([exam,names])會(huì)將列表中第一個(gè)元素作為最外層索引，依次類推

多層索引的取值

獲取到我們想要的數(shù)據(jù)

獲取多層索引Series中的數(shù)據(jù)

創(chuàng)建數(shù)據(jù)

import pandas as pd
s = pd.Series([1,2,3,4,5,6],index=[['張三','張三','李四','李四','王五','王五'],
                  ['期中','期末','期中','期末','期中','期末']])
print(s)

張三期中    1
    期末    2
李四期中    3
    期末    4
王五期中    5
    期末    6
dtype: int64

可以直接使用[]的方式取最外面的一個(gè)層級(jí) s[‘張三']

s['李四']

# 注意：[]取值方式，不可直接使用最外層以外的其他層級(jí)，例如：s['期末']

期中 3
期末 4
dtype: int64

使用['外索引', '內(nèi)索引'], 獲取某個(gè)數(shù)據(jù)

注意：[‘張三',‘期末']他們的順序不能變。剝洋蔥原則，從外到內(nèi)一層一層的剝。

s['李四', '期中'] # 李四期中分值

# 注意：['張三','期末']他們的順序不能變。剝洋蔥原則，從外到內(nèi)一層一層的剝。

使用[]的切片，獲取數(shù)據(jù)s[:,‘期中']

s[:,'期中'] # 第一個(gè)值為全部的外索引

張三    1
李四    3
王五    5
dtype: int64

使用 loc

loc 使用的是標(biāo)簽suoyin
iloc使用的是位置索引

# loc 使用方式與 [] 的方式基本一樣

s.loc['張三']
s.loc['張三','期中']
s.loc[:,'期中']

# iloc 的取值并不會(huì)受多層索引影響，只會(huì)根據(jù)數(shù)據(jù)的位置索引進(jìn)行取值, 不推薦

張三    1
李四    3
王五    5
dtype: int64

多層索引DataFrame的取值

在對(duì)多層索引DataFrame的取值是，推薦使用 loc() 函數(shù)

import pandas as pd
import numpy as np
#size參數(shù)是指定生成6行3列的數(shù)組
data = np.random.randint(0,100,size=(6,3))
names = ['張三','李四','王五']
exam = ['期中','期末']
index = pd.MultiIndex.from_product([names,exam])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])
df

	Java	Web	Python
張三	期中	3	40	52
張三	期末	74	38	85
李四	期中	7	28	16
李四	期末	9	25	0
王五	期中	13	24	8
王五	期末	49	46	1

三種方式都可以獲取張三期中各科成績

# df.loc['張三','期中']
# df.loc['張三'].loc['期中']
# df.loc[('張三','期中')]

注意：DataFrame中對(duì)行索引的時(shí)候和Series有一個(gè)同樣的注意點(diǎn)，就是無法直接對(duì)二級(jí)索引直接進(jìn)行索引，必須讓二級(jí)索引變成一級(jí)索引后才能對(duì)其進(jìn)行索引

多層索引的排序

使用sort_index() 排序
level參數(shù)可以指定是否按照指定的層級(jí)進(jìn)行排列
第一層索引值為0, 第二層索引的值為1

創(chuàng)建數(shù)據(jù)

import pandas as pd
data = np.random.randint(0,100,size=(9,3))
key1 = ['b','c','a']
key2 = [2,1,3]
index = pd.MultiIndex.from_product([key1,key2])
df = pd.DataFrame(data,index=index,columns=['Java','Web','Python'])

df

		Java	Web	Python
b	2	56	82	81
	1	84	16	55
	3	35	25	86
c	2	76	1	76
	1	36	28	94
	3	79	70	97
a	2	25	17	30
	1	38	38	78
	3	41	75	90

排序

DataFrame按行索引排序的方法是sort_index()
如果直接使用的話,不傳參數(shù), 會(huì)把每一層索引根據(jù)值進(jìn)行升序排序

df.sort_index()

	Java	Web	Python
a	1	18	60	74
	2	66	87	27
	3	96	18	64
b	1	72	58	52
	2	22	31	22
	3	31	12	83
c	1	6	54	96
	2	9	47	18
	3	31	63	4

# 當(dāng)level=0時(shí)，ascending=False, 會(huì)根據(jù)第一層索引值進(jìn)行降序排序
df.sort_index(level=0,ascending=False)

	Java	Web	Python
c	3	79	70	97
	2	76	1	76
	1	36	28	94
b	3	35	25	86
	2	56	82	81
	1	84	16	55
a	3	41	75	90
	2	25	17	30
	1	38	38	78

# 當(dāng)level=1時(shí)，會(huì)根據(jù)第二層索引值進(jìn)行降序排序

df.sort_index(level=1,ascending=False)

# 數(shù)據(jù)會(huì)根據(jù)第二層索引值進(jìn)行相應(yīng)的降序排列，
# 如果索引值相同時(shí)會(huì)根據(jù)其他層索引值排列

	Java	Web	Python
c	3	79	70	97
b	3	35	25	86
a	3	41	75	90
c	2	76	1	76
b	2	56	82	81
a	2	25	17	30
c	1	36	28	94
b	1	84	16	55
a	1	38	38	78

通過level設(shè)置排序的索引層級(jí)，其他層索引也會(huì)根據(jù)其排序規(guī)則進(jìn)行排序

到此這篇關(guān)于pandas多層索引的創(chuàng)建和取值以及排序的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas多層索引內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

pandas組內(nèi)排序,并在每個(gè)分組內(nèi)按序打上序號(hào)的操作
pandas按照列的值排序(某一列或者多列)
pandas的排序和排名的具體使用
使用Pandas對(duì)數(shù)據(jù)進(jìn)行篩選和排序的實(shí)現(xiàn)
Pandas分組與排序的實(shí)現(xiàn)
Pandas之排序函數(shù)sort_values()的實(shí)現(xiàn)
pandas通過索引進(jìn)行排序的示例
pandas groupby分組對(duì)象的組內(nèi)排序解決方案

標(biāo)簽：梅州石家莊錫林郭勒盟昆明懷化文山西寧浙江

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《pandas多層索引的創(chuàng)建和取值以及排序的實(shí)現(xiàn)》，本文關(guān)鍵詞 pandas,多層,索引,的,創(chuàng),建和,；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。