不得不說使用python庫matplotlib繪圖確實比較丑,但使用起來還算是比較方便,做自己的小小研究可以使用。這里記錄一些統(tǒng)計作圖方法,包括pandas作圖和plt作圖。
前提是先導入第三方庫吧
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
然后以下這兩句用于正常顯示中文標簽什么的。
plt.rcParams['font.sans-serif'] = ['SimHei'] # 用來正常顯示中文標簽
plt.rcParams['axes.unicode_minus'] = False # 用來正常顯示負號
當然還有一些最基本的步驟:
plt.xticks(x,xtk,size=12,rotation=50) #設置字體大小和字體傾斜度
plt.xlabel(u'城市') # x軸標簽
plt.ylabel(u'數(shù)量')
plt.title(u'朋友所在城市') # 圖的名稱
plt.legend() # 正常顯示標題
plt.show() # 顯示圖像
plt.close() # 繪圖后養(yǎng)成習慣性的關掉
對于pandas中的二維數(shù)據框,可以直接作圖(Series類型),簡單的折線圖或者曲線圖如下:
sdata.plot(color='r', style='-o')
plt.show()
如果沒有用pandas,直接作曲線圖,可以這樣寫:
plot(x,y, color ='blue', linewidth=2.5, linestyle="--")
1,柱狀圖
rects1=plt.bar( #(x,data) 就是所要畫的二維數(shù)據
left=x, #x 是X坐標軸數(shù)據,即每個塊的x軸起始位置
height=data, #data是Y坐標軸的數(shù)據,即每個塊的y軸高度
width=[0.1,0.2,0.3], #每一個塊的顯示寬度
bottom=[1,2,3], #每一個塊的底部高度
color='y', #塊的顏色
edgecolor='g', #塊的邊界顏色
linewidth=2, #塊的線條寬度
xerr=1, #x軸誤差bar
yerr=1, #y軸誤差bar
ecolor='r', #誤差bar的顏色
capsize=1, #誤差bar的線條寬度
orientation='vertical', #塊的方向 (horizontal,vertical)
align="center", #塊的位置 (center, left, right)
hold=None
)
plt.show()
2,餅圖
plot2=plt.pie(data, # 每個餅塊的實際數(shù)據,如果大于1,會進行歸一化,計算percentage
explode=[0.0,0.1,0.2], # 每個餅塊離中心的距離
colors=['y','r','g'], # 每個餅塊的顏色
labels=['women','men','unknown'], # 每個餅塊的標簽
labeldistance=1.2, # 每個餅塊標簽到中心的距離
autopct='%1.1f%%', # 百分比的顯示格式
pctdistance=0.4, # 百分比到中心的距離
shadow=True, # 每個餅塊是否顯示陰影
startangle=0, # 默認從x軸正半軸逆時針起
radius=1.0 # 餅塊的半徑
)
plt.axis('equal') # 顯示為圓形,避免比例壓縮為橢圓
plt.show()
3,共享X軸,Y軸左右軸標(帕累托分析圖)
數(shù)據樣例如下,名稱為va,類型為Series,左邊為職位名稱,右邊為數(shù)量:
sales 4140
technical 2720
support 2229
IT 1227
product_mng 902
marketing 858
RandD 787
accounting 767
hr 739
management 630
作圖:
fr = pd.Series(va.values.cumsum() / va.values.sum())
va.plot(kind='bar')
fr.plot(color='r',secondary_y=True, style='-o')
plt.annotate(format(fr[7], '.2%'), xy=(7, fr[7]), xytext=(7*0.9, fr[7]*0.9),
arrowprops=dict(arrowstyle='->', connectionstyle='arc3,rad=.2')) # 用于注釋圖形指標
# plt.rcParams['font.sans-serif'] = ['SimHei'] # 用來正常顯示中文標簽
# plt.rcParams['axes.unicode_minus'] = False # 用來正常顯示負號
# plt1 = plt.pie(va.values,
# labels=va.index,
# autopct='%1.1f%%')
plt.xticks(rotation=50) # 設置字體大小和字體傾斜度
plt.show()
左邊為出現(xiàn)的頻率,右邊為累積百分比(這里數(shù)據以降序排列較好,便于直觀地觀察),效果如下:
在pandas中,曲線圖可以直接畫,比如data中有多個屬性,可以直接使用data.plot()。使用plt,若各個屬性需要共用XY軸,那么可以重復plot即可。
4,箱型圖
使用pandas畫箱型圖簡單方便,但是注釋比較麻煩,可以用annotate添加異常點的注釋。若使用之前的數(shù)據va,則先創(chuàng)建二維數(shù)據框再畫圖。如果有多個列為數(shù)字類型,那么可以畫每個列的箱型圖,這里只有一列數(shù)據,如下:
pd.DataFrame(va).boxplot()
plt.show()
使用plt直接進行作圖:
plt.boxplot(data,labels=[],
sym='o',whis=1.5)
其中,data可以是一維的,也可多維,若為多維則lables為每一維度的標簽。sym為異常值的形狀,whis為調節(jié)垂直線段的長度。效果如下:
5,多張圖在一張畫布中,即多個子圖
使用plt:
plt.subplot(221)
plt.plot(x, y1,'r-', lw=2)
plt.subplot(222)
plt.plot(x,y2)
使用pandas:
data.plot(subplots=True, color=['r','b'], style=['-o','-'])
plt.show()
排版方式有不同,pandas是垂直排列,plt可以自己指定位置。pandas效果如下:
補充:Python DataFrame 多條件篩選 使用
我就廢話不多說了,大家還是直接看代碼吧~
DF6
Out[42]:
B C D
0 1 B 10.750
1 3 C 8.875
2 2 T 58.000
3 2 L 57.000
4 3 Y 46.000
DF6[(DF6.B>1) (DF6.D > 10)]
Out[45]:
B C D
2 2 T 58.0
3 2 L 57.0
4 3 Y 46.0
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
您可能感興趣的文章:- Python繪圖之詳解matplotlib
- Python繪圖庫Matplotlib的基本用法
- Python matplotlib實用繪圖技巧匯總
- python matplotlib繪圖實現(xiàn)刪除重復冗余圖例的操作
- python 繪圖模塊matplotlib的使用簡介
- Python matplotlib可視化繪圖詳解