1.什么是pandas
2.查看pandas版本信息
輸出:
3.常見數(shù)據(jù)類型
常見的數(shù)據(jù)類型:
- 一維: Series
- 二維: DataFrame
- 三維: Panel …
- 四維: Panel4D …
- N維: PanelND …
4.pandas創(chuàng)建Series數(shù)據(jù)類型對(duì)象
1). 通過列表創(chuàng)建Series對(duì)象
array = ["粉條", "粉絲", "粉帶"]
# 如果不指定索引, 默認(rèn)從0開始;
s1 = pd.Series(data=array)
print(s1)
# 如果不指定索引, 默認(rèn)從0開始;
ss1 = pd.Series(data=array, index=['A', 'B', 'C'])
print(ss1)
輸出:
0 粉條
1 粉絲
2 粉帶
dtype: object
A 粉條
B 粉絲
C 粉帶
dtype: object
2). 通過numpy的對(duì)象Ndarray創(chuàng)建Series;
n = np.random.randn(5) # 隨機(jī)創(chuàng)建一個(gè)ndarray對(duì)象;
s2 = pd.Series(data=n)
print(s2)
# 修改元素的數(shù)據(jù)類型;
ss2 = s2.astype(np.int)
print(ss2)
輸出:
0 -1.649755
1 0.607479
2 0.943136
3 -1.794060
4 1.569035
dtype: float64
0 -1
1 0
2 0
3 -1
4 1
dtype: int64
3). 通過字典創(chuàng)建Series對(duì)象;
dict = {string.ascii_lowercase[i]:i for i in range(10)}
s3 = pd.Series(dict)
print(s3)
輸出:
a 0
b 1
c 2
d 3
e 4
f 5
g 6
h 7
i 8
j 9
dtype: int64
5.Series基本操作
共同部分:
import pandas as pd
import numpy as np
import string
array = ["粉條", "粉絲", "粉帶"]
s1 = pd.Series(data=array)
print(s1)
輸出:
0 粉條
1 粉絲
2 粉帶
dtype: object
1). 修改Series索引.index
print(s1.index) #輸出:RangeIndex(start=0, stop=3, step=1)
s1.index = ['A', 'B', 'C']
print(s1)
輸出:
A 粉條
B 粉絲
C 粉帶
dtype: object
2). Series縱向拼接.append
s1.index = ['A', 'B', 'C']
array = ["粉條", "粉絲", "粉帶"]
# 如果不指定索引, 默認(rèn)從0開始;
s2 = pd.Series(data=array)
s3 = s1.append(s2)
print(s3)
輸出:
A 粉條
B 粉絲
C 粉帶
0 粉條
1 粉絲
2 粉帶
dtype: object
3). 刪除指定索引對(duì)應(yīng)的元素.drop(‘index')
s3 = s3.drop('C') # 刪除索引為‘C'對(duì)應(yīng)的值;
print(s3)
輸出:
A 粉條
B 粉絲
0 粉條
1 粉絲
2 粉帶
dtype: object
4). 根據(jù)指定的索引查找元素
print(s3['B']) #粉絲
s3['B'] = np.nan #索引B處的值替換為缺失值
print(s3)
輸出:
A 粉條
B NaN
0 粉條
1 粉絲
2 粉帶
dtype: object
5). 切片操作 — 同列表
print(s3[:2]) #顯示前兩個(gè)元素
print(s3[::-1]) #逆序
print(s3[-2:]) # 顯示最后兩個(gè)元素
輸出:
A 粉條
B NaN
dtype: object
-------------------------
2 粉帶
1 粉絲
0 粉條
B NaN
A 粉條
dtype: object
-------------------------
1 粉絲
2 粉帶
dtype: object
6.Series運(yùn)算
先設(shè)置兩個(gè)Series對(duì)象:
import pandas as pd
import numpy as np
import string
s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
s2 = pd.Series(np.arange(2, 8), index=list(string.ascii_lowercase[2:8]))
print(s1)
print(s2)
按照對(duì)應(yīng)的索引進(jìn)行計(jì)算, 如果索引不同,則填充為Nan;
1).加法add
print(s1 + s2)
print(s1.add(s2))
輸出:
a NaN
b NaN
c 4.0
d 6.0
e 8.0
f NaN
g NaN
h NaN
dtype: float64
2).減法sub
print(s1 - s2)
print(s1.sub(s2))
輸出:
a NaN
b NaN
c 0.0
d 0.0
e 0.0
f NaN
g NaN
h NaN
dtype: float64
3).乘法mul
print(s1 * s2)
print(s1.mul(s2))
輸出:
a NaN
b NaN
c 4.0
d 9.0
e 16.0
f NaN
g NaN
h NaN
dtype: float64
4).除法div
print(s1 / s2)
print(s1.div(s2))
輸出:
a NaN
b NaN
c 1.0
d 1.0
e 1.0
f NaN
g NaN
h NaN
dtype: float64
5).求中位數(shù)median
輸出:
6).求和sum
輸出:
7).最大值max
輸出:
8).最小值min
輸出:
7.特殊的where方法
series中的where方法運(yùn)行結(jié)果和numpy中完全不同
import pandas as pd
import numpy as np
import string
s1 = pd.Series(np.arange(5), index=list(string.ascii_lowercase[:5]))
print(s1)
輸出:
a 0
b 1
c 2
d 3
e 4
dtype: int64
大于3的顯示,不大于3的為NaN
# 對(duì)象中小于3的元素賦值為10;
print(s1.where(s1 > 3, 10))
# 對(duì)象中大于3的元素賦值為10;
print(s1.mask(s1 > 3, 10))
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- 詳細(xì)介紹在pandas中創(chuàng)建category類型數(shù)據(jù)的幾種方法
- 對(duì)pandas中兩種數(shù)據(jù)類型Series和DataFrame的區(qū)別詳解
- Pandas實(shí)現(xiàn)數(shù)據(jù)類型轉(zhuǎn)換的一些小技巧匯總
- Pandas數(shù)據(jù)類型之category的用法