1、讀取方法有按行(單行,多行連續(xù),多行不連續(xù)),按列(單列,多列連續(xù),多列不連續(xù));部分不連續(xù)行不連續(xù)列;按位置(坐標),按字符(索引);按塊(list);函數(shù)有 df.iloc(), df.loc(), df.iat(), df.at(), df.ix()。
2、轉(zhuǎn)換為DF,賦值columns,index,修改添加數(shù)據(jù),取行列索引
data = {'省份': ['北京', '上海', '廣州', '深圳'],
'年份': ['2017', '2018', '2019', '2020'],
'總?cè)藬?shù)': ['2200', '1900', '2170', '1890'],
'高考人數(shù)': ['6.3', '5.9', '6.0', '5.2']}
df = pd.DataFrame(data, columns=['省份', '年份', '總?cè)藬?shù)', '高考人數(shù)', '高數(shù)'],
index=['one', 'two', 'three', 'four'])
df['高數(shù)'] = ['90', '95', '92', '98']
print("行索引:{}".format(list(df.index)))
print("列索引:{}".format(list(df.columns)))
print(df.index[1:3])
print(df.columns[1])
print(df.columns[1:3])
print(df)
行索引:['one', 'two', 'three', 'four']
列索引:['省份', '年份', '總?cè)藬?shù)', '高考人數(shù)', '高數(shù)']
Index(['two', 'three'], dtype='object')
年份
Index(['年份', '總?cè)藬?shù)'], dtype='object')
省份 年份 總?cè)藬?shù) 高考人數(shù) 高數(shù)
one 北京 2017 2200 6.3 90
two 上海 2018 1900 5.9 95
three 廣州 2019 2170 6.0 92
four 深圳 2020 1890 5.2 98
3、iloc不能通過[:, [1:3]]取連續(xù)數(shù)據(jù),取連續(xù)數(shù)據(jù)只能通過 df[df.columns[1:4]],先獲取列索引,再取數(shù)據(jù)。
print(df['省份']) #按列名取列
print(df.省份) #按列名取列
print(df[['省份', '總?cè)藬?shù)']]) #按列名取不連續(xù)列數(shù)據(jù)
print(df[df.columns[1:4]]) #按列索引取連續(xù)列數(shù)據(jù)
print(df.iloc[:, 1]) #按位置取列
print(df.iloc[:, [1, 3]]) #按位置取不連續(xù)列數(shù)據(jù)
one 北京
two 上海
three 廣州
four 深圳
Name: 省份, dtype: object
one 北京
two 上海
three 廣州
four 深圳
Name: 省份, dtype: object
省份 總?cè)藬?shù)
one 北京 2200
two 上海 1900
three 廣州 2170
four 深圳 1890
年份 總?cè)藬?shù) 高考人數(shù)
one 2017 2200 6.3
two 2018 1900 5.9
three 2019 2170 6.0
four 2020 1890 5.2
one 2017
two 2018
three 2019
four 2020
Name: 年份, dtype: object
年份 高考人數(shù)
one 2017 6.3
two 2018 5.9
three 2019 6.0
four 2020 5.2
4、通過df.iloc[](數(shù)字)取行數(shù)據(jù),取部分行部分列時,要先寫行,再寫列;有條件的取數(shù)據(jù)
print(df[1:3]) #按行取數(shù)據(jù),這行代碼結(jié)果沒在下面輸出
print(df[df.高數(shù)>90]) #按行有條件的取數(shù)據(jù),結(jié)果沒輸出
print(df.iloc[1]) #按行取行數(shù)據(jù)
print(df.iloc[1, 3]) #按坐標取
print(df.iloc[[1], [3]]) #按坐標取
print(df.loc[df.index[1:3]]) #按行索引取行,但沒必要
print(df.iloc[1:3]) #按行取連續(xù)數(shù)據(jù)
print(df.iloc[[1, 3]]) 按行取不連續(xù)數(shù)據(jù)
print(df.iloc[[1,2,3], [2,4]]) 取部分行部分列數(shù)據(jù)
省份 上海
年份 2018
總?cè)藬?shù) 1900
高考人數(shù) 5.9
高數(shù) 95
Name: two, dtype: object
5.9
高考人數(shù)
two 5.9
省份 年份 總?cè)藬?shù) 高考人數(shù) 高數(shù)
two 上海 2018 1900 5.9 95
three 廣州 2019 2170 6.0 92
省份 年份 總?cè)藬?shù) 高考人數(shù) 高數(shù)
two 上海 2018 1900 5.9 95
three 廣州 2019 2170 6.0 92
省份 年份 總?cè)藬?shù) 高考人數(shù) 高數(shù)
two 上海 2018 1900 5.9 95
four 深圳 2020 1890 5.2 98
總?cè)藬?shù) 高數(shù)
two 1900 95
three 2170 92
four 1890 98
5、通過df.loc[]索引(字符)取行數(shù)據(jù)。
print(df.loc['two'])
print(df.loc['two', '省份'])
print(df.loc['two':'three'])
print(df.loc[['one', 'three']])
print(df.loc[['one', 'three'], ['省份', '年份']])
省份 上海
年份 2018
總?cè)藬?shù) 1900
高考人數(shù) 5.9
高數(shù) 95
Name: two, dtype: object
上海
省份 年份 總?cè)藬?shù) 高考人數(shù) 高數(shù)
two 上海 2018 1900 5.9 95
three 廣州 2019 2170 6.0 92
省份 年份 總?cè)藬?shù) 高考人數(shù) 高數(shù)
one 北京 2017 2200 6.3 90
three 廣州 2019 2170 6.0 92
省份 年份
one 北京 2017
three 廣州 2019
6、ix,iat,at取行列數(shù)據(jù),此方法不常用,可以使用上面方法即可。
print(df.ix[1:3])
print(df.ix[:, [1, 3]])
print(df.iat[1,3])
print(df.at['two', '省份'])
省份 年份 總?cè)藬?shù) 高考人數(shù) 高數(shù)
two 上海 2018 1900 5.9 95
three 廣州 2019 2170 6.0 92
年份 高考人數(shù)
one 2017 6.3
two 2018 5.9
three 2019 6.0
four 2020 5.2
5.9
上海
到此這篇關(guān)于Pandas讀取行列數(shù)據(jù)最全方法的文章就介紹到這了,更多相關(guān)Pandas讀取行列 內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- pandas 轉(zhuǎn)換成行列表進行讀取與Nan處理的方法
- pandas Dataframe行列讀取的實例