前言
Python是一門實現(xiàn)數(shù)據(jù)可視化很好的語言,他們里面的很多庫可以很好的畫出圖形,形象明了。
今天我們就來說說:Pandas數(shù)據(jù)分析核心支持庫
初識Pandas:
Pandas 是 Python 語言的一個擴展程序庫,用于數(shù)據(jù)分析。
Pandas 是一個開放源碼、BSD 許可的庫,提供高性能、易于使用的數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)分析工具。
Pandas 名字衍生自術(shù)語 “panel data”(面板數(shù)據(jù))和 “Python data analysis”(Python 數(shù)據(jù)分析)。
Pandas 一個強大的分析結(jié)構(gòu)化數(shù)據(jù)的工具集,基礎(chǔ)是 Numpy(提供高性能的矩陣運算),其次數(shù)series,還有一個DataFrame,這三個比較常用。
Pandas 可以從各種文件格式比如 CSV、JSON、SQL、Microsoft Excel 導入數(shù)據(jù)。
Pandas 可以對各種數(shù)據(jù)進行運算操作,比如歸并、再成形、選擇,還有數(shù)據(jù)清洗和數(shù)據(jù)加工特征。
Pandas 廣泛應(yīng)用在學術(shù)、金融、統(tǒng)計學等各個數(shù)據(jù)分析領(lǐng)域。
Pandas的主體:
Pandas 的主要數(shù)據(jù)結(jié)構(gòu)是 Series (一維數(shù)據(jù))與 DataFrame(二維數(shù)據(jù)),這兩種數(shù)據(jù)結(jié)構(gòu)足以處理金融、統(tǒng)計、社會科學、工程等領(lǐng)域里的大多數(shù)典型用例。
Series:帶標簽的一維同構(gòu)數(shù)組,一種類似于一維數(shù)組的對象,它由一組數(shù)據(jù)(各種Numpy數(shù)據(jù)類型)以及一組與之相關(guān)的數(shù)據(jù)標簽(即索引)組成。
DataFrame:帶標簽,大小可變,二維異構(gòu)表格。一個表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個索引)。
Pandas的安裝:
終端輸入,如果你跟我一樣使用Anaconda中的Jupyter進行代表編寫的話,也可以在Anaconda的終端里輸入,之后就可以直接用了,他是Python中的一個庫,使用不需要安裝什么其他軟件,擁有Python編譯器即可。
Pandas的應(yīng)用:
1:導入pandas庫
2:pandas之series
Pandas Series 類似表格中等一個列(column),類似于一維數(shù)組,可以保存任何數(shù)據(jù)類型 Series 由索引(index)和列組成,函數(shù)如下:
pandas.Series( data, index, dtype, name, copy)
參數(shù)說明:
data:一組數(shù)據(jù)(ndarray 類型)。
index:數(shù)據(jù)索引標簽,如果不指定,默認從 0 開始。
dtype:數(shù)據(jù)類型,默認會自己判斷。
name:設(shè)置名稱。
copy:拷貝數(shù)據(jù),默認為 False。
Demo:
FIrst:
import pandas as pd
a = ["shimmer", "zhuzhu", "recently祝祝"]
myvar = pd.Series(a)
print(myvar)
代碼結(jié)果:

Second:可修改索引值、

Third:使用字典創(chuàng)建, key/value 對象,類似字典來創(chuàng)建 Series

Fourth:可以通過索引值的指定來取值

3:pandas之Dataframe
DataFrame 是一個表格型的數(shù)據(jù)結(jié)構(gòu),它含有一組有序的列,每列可以是不同的值類型(數(shù)值、字符串、布爾型值)。DataFrame既有行索引也有列索引,它可以被看做由 Series 組成的字典(共同用一個索引)。

DataFrame 構(gòu)造方法如下:
pandas.DataFrame( data, index, columns, dtype, copy)
參數(shù)說明:
data:一組數(shù)據(jù)(ndarray、series, map, lists, dict 等類型)。
index:索引值,或者可以稱為行標簽。
columns:列標簽,默認為 RangeIndex (0, 1, 2, …, n) 。
dtype:數(shù)據(jù)類型。
copy:拷貝數(shù)據(jù),默認為 False。
Demo:
First:指定列標

Second:列分開插入,通過字典的形式創(chuàng)建

Third:使用字典(key/value),其中字典的 key 為列名:

fourth:通過loc取值,類似于列表里x,index【number】取值

Fifth:可以返回多行數(shù)據(jù),使用 [[ … ]] 格式,… 為各行的索引,以逗號隔開:

Sixth:指定索引值

Seventh:取指定索引值

本篇就到這吧,希望看完這篇文章對你有用。
總結(jié)
到此這篇關(guān)于python學習之panda數(shù)據(jù)分析核心支持庫的文章就介紹到這了,更多相關(guān)python之panda模塊內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Python數(shù)據(jù)分析之繪圖和可視化詳解
- Python數(shù)據(jù)分析之pandas比較操作
- Python數(shù)據(jù)分析入門之數(shù)據(jù)讀取與存儲
- Python數(shù)據(jù)分析入門之教你怎么搭建環(huán)境
- python數(shù)據(jù)分析之公交IC卡刷卡分析
- Python數(shù)據(jù)分析庫pandas高級接口dt的使用詳解
- 用Python 爬取貓眼電影數(shù)據(jù)分析《無名之輩》
- 高考要來啦!用Python爬取歷年高考數(shù)據(jù)并分析