主頁 > 知識(shí)庫 > 詳解pandas映射與數(shù)據(jù)轉(zhuǎn)換

詳解pandas映射與數(shù)據(jù)轉(zhuǎn)換

熱門標(biāo)簽:河南虛擬外呼系統(tǒng)公司 惠州龍門400電話要怎么申請 熱門電銷機(jī)器人 外呼電信系統(tǒng) 電話機(jī)器人哪里有賣 okcc外呼系統(tǒng)怎么調(diào)速度 智能機(jī)器人電銷神器 萬利達(dá)百貨商場地圖標(biāo)注 上海企業(yè)外呼系統(tǒng)

在 pandas 中提供了利用映射關(guān)系來實(shí)現(xiàn)某些操作的函數(shù),具體如下:

  • replace() 函數(shù):替換元素;
  • map() 函數(shù):新建一列;
  • rename() 函數(shù):替換索引。

一、replace() 用映射替換元素

在數(shù)據(jù)處理時(shí),經(jīng)常會(huì)遇到需要將數(shù)據(jù)結(jié)構(gòu)中原來的元素根據(jù)實(shí)際需求替換成新元素的情況。要想用新元素替換原來元素,就需要定義一組映射關(guān)系。在映射關(guān)系中,將舊元素作為鍵,新元素作為值。

例如,創(chuàng)建字典 fruits 用于指明水果標(biāo)識(shí)和水果名稱的映射關(guān)系。

fruits={101:'orange',102:'apple',103:'banana'}

如要將用于存儲(chǔ)水果標(biāo)識(shí)、水果數(shù)量和單價(jià)的 DataFrame 對象中的水果標(biāo)識(shí)替換成水果名稱,就需要運(yùn)用 replace() 函數(shù),通過 fruits 映射關(guān)系來實(shí)現(xiàn)元素的替換。

replace() 函數(shù)的基本語法格式如下:

obj.replace(to_replace=None,value=None,inplace=False,limit=None,regex=
False,method='pad')

函數(shù)中的參數(shù)說明如下:

  • obj:DataFrame 或 Series 對象;
  • to_replace:接收 str、regex、list、dict、Series、int、float 或者 None,表示將被替換的值;
  • value:接收標(biāo)量、字典、列表、str、正則表達(dá)式,默認(rèn)為 None;用于替換與 to_replace 匹配的任何值的值;對于 DataFrame,可以使用值的 dict 來指定每列使用哪個(gè)值(不在 dict 中的列將不會(huì)被填充);還允許使用正則表達(dá)式、字符串和列表或這些對象的 dict;
  • inplace:接收布爾值,默認(rèn)為 False,如果是 True,將修改原來的數(shù)據(jù);
  • limit:接收 int,默認(rèn)為 None,用于限制填充次數(shù);
  • regex:接收 bool 或與 to_replace 相同的類型,默認(rèn)為 False,表示是否將 to_replace 或 value 解釋為正則表達(dá)式,如果是 True,那么 to_replace 必須是一個(gè)字符串,當(dāng)是正則表達(dá)式或正則表達(dá)式的列表、字典或數(shù)組時(shí),to_replace 必須為 None;
  • method:取值為 {'pad','ffill','bfill',無},表示替換時(shí)使用的方法,與缺失值填充方法類似,當(dāng) to_replace 是標(biāo)量、列表或元組時(shí),值為 None。

【例 1】利用 replace() 函數(shù)和映射關(guān)系實(shí)現(xiàn)將水果數(shù)據(jù)框中水果標(biāo)識(shí)替換成水果名稱。
示例代碼 test1.py 如下:

import numpy as np
import pandas as pd
#創(chuàng)建水果標(biāo)識(shí)與水果名稱的映射關(guān)系
fruits = {101:'orange',102:'apple',103:'banana'}
#創(chuàng)建水果數(shù)據(jù)框DataFrame
data = pd.DataFrame({'fru_No':[101,102,103]          ,'fru_Num':[1000,2000,3000]
          ,'price':[3.56,4.2,2.5]})
#用映射替換fru_No列的元素
newDf = data.replace(fruits)
print(newDf)
#輸出如下
 fru_No fru_Num price
0 orange  1000  3.56
1 apple  2000  4.20
2 banana  3000  2.50

replace() 函數(shù)應(yīng)用的示例代碼 example1.py 如下:

import numpy as np
import pandas as pd
from pandas import Series,DataFrame
s = Series([-1000,-999,2,3,4,5,-2000])
#單數(shù)值替換
print(s.replace(-2000,np.nan))
0 -1000.0
1 -999.0
2 2.0
3 3.0
4 4.0
5 5.0
6 NaN

#將多個(gè)數(shù)值替換
print(s.replace([-1000,-999],0))
0 0
1 0
2 2
3 3
4 4
5 5
6 -2000

#不同的值進(jìn)行不同的替換
print(s.replace([-1000,-999],[np.nan,0]))
0 NaN
1 0.0
2 2.0
3 3.0
4 4.0
5 5.0
6 -2000.0

#用字典方式進(jìn)行不同的替換
print(s.replace({-1000:np.nan,-999:0,-2000:np.nan}))
0 NaN
1 0.0
2 2.0
3 3.0
4 4.0
5 5.0
6 NaN

二、用映射添加元素

   在【例 1】中介紹了利用函數(shù)和映射來實(shí)現(xiàn)將水果標(biāo)識(shí)替換成水果名稱的方法。但是有時(shí)需要保留水果標(biāo)識(shí),將水果名稱添加到數(shù)據(jù)集中。

   那么,這時(shí)可利用 map() 函數(shù),通過構(gòu)建 fruits 映射關(guān)系來實(shí)現(xiàn)元素的添加。

map() 函數(shù)是作用于 Series 或 DataFrame 對象的一列,它接收一個(gè)函數(shù)或表示映射關(guān)系的字典作為參數(shù),它的基本語法格式如下:

Series.map(arg,na_action=None)

函數(shù)中的參數(shù)說明如下:

  • arg:接收 function、dict 或 Series,表示映射通信;
  • na_action:取值為{無,'忽略'},默認(rèn)值為 None,如果為'忽略',則傳播 NA 值,而不將它們傳遞給映射對應(yīng)關(guān)系。

【例 2】利用 map() 函數(shù)和映射關(guān)系實(shí)現(xiàn)將水果名稱添加到水果數(shù)據(jù)框中。
示例代碼 test2.py 如下:

import pandas as pd
#創(chuàng)建水果標(biāo)識(shí)與水果名稱的映射關(guān)系
fruits = {101:'orange',102:'apple',103:'banana'}
#創(chuàng)建水果數(shù)據(jù)框DataFrame
data = pd.DataFrame({'fru_No':[101,102,103],'fru_Num':[1000,2000,3000],'price':
          [3.56,4.2,2.5]})
#用映射為data添加fru_name列元素
data['fru_name'] = data['fru_No'].map(fruits)
print(data)
 fru_No fru_Num price fru_name
0 101  1000  3.56 orange
1 102  2000  4.20 apple
2 103  3000  2.50 banana

三、重命名行/列索引

在數(shù)據(jù)處理中,有時(shí)需要使用映射關(guān)系轉(zhuǎn)換軸標(biāo)簽。pandas 的 rename() 函數(shù)是以表示映射關(guān)系的字典對象作為參數(shù),替換軸的索引標(biāo)簽。
rename() 函數(shù)的基本語法格式如下:

DataFrame.rename(mapper=None,index=None,columns=None,axis=None,copy=True,
inplace=False,level=None)
或
Series.rename(index=None,**kwargs)

函數(shù)中的參數(shù)說明如下:

  • mapper、index、columns:接收 dict或 function,表示將 dict 或函數(shù)轉(zhuǎn)換為應(yīng)用于該軸的值,使用 mapper 參數(shù)要指定映射器;使用 columns 參數(shù)可重命名各列;
  • axis:接收 int 或 str,可選,表示映射器定位的軸,可以是軸名稱(“index”,“columns”)或數(shù)字(0,1),默認(rèn)為“index”;
  • copy:接收 boolean,默認(rèn)為 True,表示是否復(fù)制數(shù)據(jù);
  • inplace:接收 boolean,默認(rèn)為 False,如果為 True,將會(huì)修改原來的數(shù)據(jù);
  • level:接收 int 或 level name,默認(rèn)為 None,如果是 MultiIndex,只重命名指定級(jí)別中的標(biāo)簽。

rename() 函數(shù)返回值是 DataFrame 或 Series。
【例 3】利用 rename() 函數(shù)和映射關(guān)系重命名水果數(shù)據(jù)框的行索引和列索引。
示例代碼 test3.py 如下:

import pandas as pd
#創(chuàng)建行索引的映射關(guān)系
reindex = {0:'row1',1:'row2',2:'row3'}
#創(chuàng)建水果數(shù)據(jù)框DataFrame
data = pd.DataFrame({'fru_No':[101,102,103],'fru_Num':[1000,2000,3000],'price':
          [3.56,4.2,2.5]})
 fru_No fru_Num price
0  101 1000  3.56
1  102 2000  4.20
2  103 3000  2.50

#用映射重命名水果數(shù)據(jù)框的行索引,產(chǎn)生新DataFrame,但原數(shù)據(jù)不改變
newDf = data.rename(reindex)
print(newDf)
  fru_No fru_Num price
row1 101  1000  3.56
row2 102  2000  4.20
row3 103  3000  2.50

#用映射重命名水果數(shù)據(jù)框的行索引,產(chǎn)生新DataFrame,但原數(shù)據(jù)改變
newDf = data.rename(reindex,inplace=True)
print(newDf) #newDf是None,data原數(shù)據(jù)改變
#創(chuàng)建列索引的映射關(guān)系
recolumns = {'fru_No':'col1','fru_Num':'col2','price':'col3'}
#用映射重命名水果數(shù)據(jù)框中的行索引和列索引
newDf = data.rename(index=reindex,columns=recolumns)
print(newDf)
  col1 col2 col3
row1 101 1000 3.56
row2 102 2000 4.20
row3 103 3000 2.50

#用映射重命名水果數(shù)據(jù)框的單個(gè)行索引和單個(gè)列索引
newDf = data.rename(index={'row2':'s1'},columns={'fru_No':'111'})
print(newDf)
   111 fru_Num price
row1 101 1000  3.56
s1  102 2000  4.20
row3 103 3000  2.50

注意:rename() 函數(shù)返回一個(gè)經(jīng)過改動(dòng)的新 DataFrame 對象,但原 DataFrame 對象仍保持不變,如果要改變調(diào)用函數(shù)的對象本身,可使用 inplace 選項(xiàng),并將其值設(shè)置為 True。

以上就是詳解pandas映射與數(shù)據(jù)轉(zhuǎn)換的詳細(xì)內(nèi)容,更多關(guān)于pandas映射與數(shù)據(jù)轉(zhuǎn)換的資料請關(guān)注腳本之家其它相關(guān)文章!

您可能感興趣的文章:
  • 利用pandas將非數(shù)值數(shù)據(jù)轉(zhuǎn)換成數(shù)值的方式
  • pandas 數(shù)據(jù)類型轉(zhuǎn)換的實(shí)現(xiàn)
  • Pandas將列表(List)轉(zhuǎn)換為數(shù)據(jù)框(Dataframe)
  • pandas進(jìn)行時(shí)間數(shù)據(jù)的轉(zhuǎn)換和計(jì)算時(shí)間差并提取年月日
  • Pandas實(shí)現(xiàn)數(shù)據(jù)類型轉(zhuǎn)換的一些小技巧匯總
  • pandas 取出表中一列數(shù)據(jù)所有的值并轉(zhuǎn)換為array類型的方法

標(biāo)簽:周口 綏化 百色 秦皇島 周口 綿陽 合肥 淮安

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《詳解pandas映射與數(shù)據(jù)轉(zhuǎn)換》,本文關(guān)鍵詞  詳解,pandas,映射,與,數(shù)據(jù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《詳解pandas映射與數(shù)據(jù)轉(zhuǎn)換》相關(guān)的同類信息!
  • 本頁收集關(guān)于詳解pandas映射與數(shù)據(jù)轉(zhuǎn)換的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章