數(shù)據(jù)初始化
import pandas as pd
import numpy as np
a=np.array([['北京','北方','一線','非沿海'],['杭州','南方','二線','非沿海'],['深圳','南方','一線','沿海'],['煙臺(tái)','北方','三線','沿海']])
df=pd.DataFrame(a,index=['一','二','三','四'],columns=['城市','地理','級(jí)別','是否沿海'])
城市 地理 級(jí)別 是否沿海
一 北京 北方 一線 非沿海
二 杭州 南方 二線 非沿海
三 深圳 南方 一線 沿海
四 煙臺(tái) 北方 三線 沿海
選擇某一行
通過loc選擇某一行
loc標(biāo)簽是軸標(biāo)簽,也就是我們的索引名,使用也非常簡(jiǎn)單
城市 杭州
地理 南方
級(jí)別 二線
是否沿海 非沿海
Name: 二, dtype: object
通過iloc選擇某一行
iloc為整數(shù)標(biāo)簽,類似我們使用的元組列表的索引。比如我們想選擇第二行的數(shù)據(jù),第二行的索引則為1.
城市 杭州
地理 南方
級(jí)別 二線
是否沿海 非沿海
Name: 二, dtype: object
選擇某一列
最簡(jiǎn)單的方法選擇某一列
如果我們知道列索引,那么選擇某一列則變得十分簡(jiǎn)單
一 一線
二 二線
三 一線
四 三線
Name: 級(jí)別, dtype: object
通過iloc選則某一列
正如我們上述使用iloc的方法,我們只需傳入行或者列的索引即可。其實(shí)iloc的中括號(hào)里可以輸入兩個(gè)參數(shù)。前面為行,后面為列中間用逗號(hào)隔開。(如果省略了逗號(hào),則默認(rèn)取選擇行)
比如現(xiàn)在我們想選擇第二列,我們只需在逗號(hào)錢輸入: 代表所有的行,后面則輸入1代表第二列
一 北方
二 南方
三 南方
四 北方
Name: 地理, dtype: object
通過loc選擇某一列
和iloc的使用相似,只不過在數(shù)據(jù)篩選中我們不再使用行整數(shù)索引,而是具體的索引值。
一 非沿海
二 非沿海
三 沿海
四 沿海
Name: 是否沿海, dtype: object
選擇某一行的某幾列或某一列的某一行
其實(shí)loc與iloc是dataframe中選擇數(shù)據(jù)最高效的方式,他的功能也十分強(qiáng)大。我們可以隨意組合。
選擇某一行的某幾列
比如我們現(xiàn)在選擇第二行的中間兩列
地理 南方
級(jí)別 二線
Name: 二, dtype: object
當(dāng)然我們也可以不使用整數(shù)索引
df.loc['二':,'地理':'級(jí)別']
地理 級(jí)別
二 南方 二線
三 南方 一線
四 北方 三線
通過行列自由組合去選擇數(shù)據(jù)
比如我們想選擇第二到三行的第二列和第三列
級(jí)別 是否沿海
三 一線 沿海
四 三線 沿海
同樣十分簡(jiǎn)單,通過loc使用效果相同,這里不過多描述
選擇某幾列或者某幾行
選擇某幾列
級(jí)別 是否沿海
一 一線 非沿海
二 二線 非沿海
三 一線 沿海
四 三線 沿海
選擇某幾行
城市 地理 級(jí)別 是否沿海
二 杭州 南方 二線 非沿海
三 深圳 南方 一線 沿海
獲取單個(gè)標(biāo)量值
如果把dataframe看做一個(gè)表格,這里可以看成獲得表格里某個(gè)單元格的值
通過iat去獲取
iat即為整數(shù)標(biāo)簽
'一線'
通過at去獲取
at即為具體的索引值去獲取
'一線'
到此這篇關(guān)于十分鐘輕松掌握dataframe數(shù)據(jù)選擇的文章就介紹到這了,更多相關(guān)dataframe數(shù)據(jù)選擇內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- 對(duì)Python中DataFrame選擇某列值為XX的行實(shí)例詳解
- 根據(jù)DataFrame某一列的值來選擇具體的某一行方法
- python pandas dataframe 行列選擇,切片操作方法