欧美日韩动漫中文字幕,自拍欧美在线综合另类

主頁(yè) > 知識(shí)庫(kù) > python中pandas.read_csv()函數(shù)的深入講解

python中pandas.read_csv()函數(shù)的深入講解

這里將更新最新的最全面的read_csv()函數(shù)功能以及參數(shù)介紹，參考資料來(lái)源于官網(wǎng)。

pandas庫(kù)簡(jiǎn)介

官方網(wǎng)站里詳細(xì)說(shuō)明了pandas庫(kù)的安裝以及使用方法，在這里獲取最新的pandas庫(kù)信息，不過(guò)官網(wǎng)僅支持英文。

pandas是一個(gè)Python包，并且它提供快速，靈活和富有表現(xiàn)力的數(shù)據(jù)結(jié)構(gòu)。這樣當(dāng)我們處理"關(guān)系"或"標(biāo)記"的數(shù)據(jù)（一維和二維數(shù)據(jù)結(jié)構(gòu)）時(shí)既容易又直觀。

pandas是我們運(yùn)用Python進(jìn)行實(shí)際、真實(shí)數(shù)據(jù)分析的基礎(chǔ)，同時(shí)它是建立在NumPy之上的。

csv文件格式簡(jiǎn)介

函數(shù)介紹

pandas.csv() 函數(shù)將逗號(hào)分離的值（csv）文件讀入數(shù)據(jù)框架。還支持可選地將文件讀入塊或?qū)⑵浞纸狻?/p>

函數(shù)原型

源文件

pandas.read_csv(filepath_or_buffer, sep=, delimiter=None, header=‘infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression=‘infer', thousands=None, decimal='.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None, storage_options=None

函數(shù)參數(shù)以及含義

輸入

參數(shù)名	功能以及含義
filepath_or_buffer	字符串。任何有效的字符串路徑都可以，網(wǎng)址也行。
sep	字符串，表示分隔符，默認(rèn)為',' .。一個(gè)字符及以上都可以，注意如果是轉(zhuǎn)義字符要加''
delimiter	字符串，sep的別名，默認(rèn)None
header	int或者int列表，默認(rèn)由推斷出來(lái)。這是用于規(guī)定列名的行號(hào)。
names	類(lèi)似于數(shù)組結(jié)構(gòu)，選擇性使用。這是要使用的列名稱列表，與header共同使用。
index_col	整數(shù)或者字符串或者整數(shù)/字符串列表。指定用作的行標(biāo)簽的列。
usecols	列表，可用可不用。功能是返回列的子集。
squeeze	布爾值，默認(rèn)為False。如果解析的數(shù)據(jù)僅包含一列，則返回一個(gè)Series
prefix	字符串，選擇性使用。沒(méi)有標(biāo)題時(shí)要添加到列號(hào)的前綴
mangle_dupe_cols	布爾值，默認(rèn)為T(mén)rue。重復(fù)的列將被指定為“ X”，“ X.1”，……“ X.N”，而不是“ X”……“ X”。如果列中的名稱重復(fù)，則False將導(dǎo)致數(shù)據(jù)被覆蓋。
dtype	類(lèi)型名稱或者類(lèi)型列的字典，選擇性使用。數(shù)據(jù)或列的數(shù)據(jù)類(lèi)型。
engine	{‘c', ‘python'}，選擇性使用。要使用的解析器引擎。C引擎速度更快，而python引擎當(dāng)前功能更完善。
converters	字典，選擇性使用。轉(zhuǎn)換器，用于轉(zhuǎn)換某些列中的值的函數(shù)的字典。鍵可以是整數(shù)或列標(biāo)簽。
true_value	列表，選擇性使用。視為T(mén)rue的值
false_values	列表，選擇性使用。視為False的值
skipinitialspace	布爾值，默認(rèn)為False。在定界符后跳過(guò)空格。
skiprows	列表或者整數(shù)，選擇性使用。在文件開(kāi)始處要跳過(guò)的行號(hào)（索引為0）或要跳過(guò)的行數(shù)（整數(shù)）。
skipfooter	整數(shù)，默認(rèn)為0。要跳過(guò)的文件底部的行數(shù)（不支持engine =‘c'）。
nrows	整數(shù)，選擇性使用。要讀取的文件行數(shù)。對(duì)于讀取大文件很有用。
na_values	標(biāo)量，字符串，類(lèi)似列表的字典，選擇性使用。識(shí)別為NA / NaN的其他字符串。如果dict通過(guò)，則為特定的每列NA值。默認(rèn)情況下，以下值解釋為NaN：''，'＃N / A'，'＃N / AN / A'，'＃NA'，'-1.＃IND'，'-1.＃QNAN'， ‘-NaN'，'-nan'，‘1.＃IND'，‘1.＃QNAN'，''，‘N / A'，‘NA'，‘NULL'，‘NaN'，‘n / a'，‘nan'，‘null'。
keep_default_na	布爾值，默認(rèn)為T(mén)rue。解析數(shù)據(jù)時(shí)是否包括默認(rèn)的NaN值。
na_filter	布爾值，默認(rèn)為T(mén)rue。檢測(cè)缺失值標(biāo)記（空字符串和na_values的值）。請(qǐng)注意，如果將na_filter傳遞為False，則將忽略keep_default_na和 na_values參數(shù)。
verbose	布爾值，默認(rèn)為False。指示放置在非數(shù)字列中的NA值的數(shù)量。
skip_blank_lines	布爾值，默認(rèn)為T(mén)rue。如果為T(mén)rue，跳過(guò)空白行，并且不解釋為NaN值。
parse_dates	布爾值，整數(shù)列表，名稱列表，列表或字典的列表。默認(rèn)為False。功能是解析為時(shí)間。
infer_datetimes_format	布爾值，默認(rèn)為False。如果啟用True和parse_dates，則pandas將嘗試推斷列中日期時(shí)間字符串的格式，并且如果可以推斷出日期格式，就會(huì)切換到更快的解析它們的方法。
keep_date_col	布爾值，默認(rèn)為False。如果True和parse_dates指定合并多個(gè)列，則保留原始列。
date_parser	函數(shù)，選擇性使用。用于將字符串列序列轉(zhuǎn)換為日期時(shí)間實(shí)例數(shù)組的函數(shù)。
dayfirst	布爾值，默認(rèn)為False。DD / MM格式的日期，國(guó)際和歐洲格式。
cache_dates	布爾值，默認(rèn)為T(mén)rue。如果為T(mén)rue，則使用唯一的轉(zhuǎn)換日期緩存來(lái)應(yīng)用datetime轉(zhuǎn)換。
iterator	布爾值，默認(rèn)為False。返回TextFileReader對(duì)象以進(jìn)行迭代或使用獲取塊 get_chunk()。
chunksize	整數(shù)，選擇性使用。返回TextFileReader對(duì)象以進(jìn)行迭代。
compression	{‘infer', ‘gzip', ‘bz2', ‘zip', ‘xz', None}，默認(rèn)為'infer'。用于對(duì)磁盤(pán)數(shù)據(jù)進(jìn)行即時(shí)解壓縮。設(shè)置為“無(wú)”將不進(jìn)行解壓縮。
thousands	字符串，選擇性使用。千位分隔符。
decimal	字符串，默認(rèn)為'.'。識(shí)別為小數(shù)點(diǎn)的字符（例如，對(duì)于歐洲數(shù)據(jù)，請(qǐng)使用“，”）。
lineterminator	長(zhǎng)度為1的字符串，選擇性使用。用于將文件分成幾行的字符。僅對(duì)C解析器有效。
quotechar	長(zhǎng)度為1的字符串，選擇性使用。用于表示引用項(xiàng)目的開(kāi)始和結(jié)束的字符。
quoting	整數(shù)或者csv.QUOTE_* 實(shí)例，默認(rèn)為0。每個(gè)csv.QUOTE_*常量的控制字段引用行為。使用QUOTE_MINIMAL（0），QUOTE_ALL（1），QUOTE_NONNUMERIC（2）或QUOTE_NONE（3）中的一種。
doublequote	布爾值，默認(rèn)為T(mén)rue。如果指定quotechar而未使用引號(hào)QUOTE_NONE，則指示是否將一個(gè)字段內(nèi)的兩個(gè)連續(xù)的quotechar元素解釋為單個(gè)quotechar元素。
escapechar	長(zhǎng)度為1的字符串，選擇性使用。一字符字符串，用于轉(zhuǎn)義其他字符。
comment	字符串，選擇性使用。指示不應(yīng)分析行的其余部分。如果在一行的開(kāi)頭找到該行，則將完全忽略該行。此參數(shù)必須是單個(gè)字符。
encoding	字符串，選擇性使用。讀/寫(xiě)時(shí)用于UTF的編碼（例如'utf-8'）。
dialect	字符串或者csv.Dialect，選擇性使用。如果提供的話，該參數(shù)將覆蓋為以下參數(shù)的值（默認(rèn)或不）：delimiter, doublequote, escapechar, skipinitialspace, quotechar, and quoting。
error_bad_lines	布爾值，默認(rèn)為T(mén)rue。默認(rèn)情況下，具有太多字段的行（例如，帶有太多逗號(hào)的csv行）將引發(fā)異常，并且不會(huì)返回任何DataFrame。如果為False，則這些“壞行”將從返回的DataFrame中刪除。
warn_bad_lines	布爾值，默認(rèn)為T(mén)rue。如果error_bad_lines為False，而warn_bad_lines為T(mén)rue，則將為每個(gè)“壞行”輸出警告。
delim_whiterspace	布爾值，默認(rèn)為False。指定是否將空格（例如或）用作分隔符。
low_memory	布爾值，默認(rèn)為T(mén)rue。在內(nèi)部對(duì)文件進(jìn)行分塊處理，從而在解析時(shí)減少了內(nèi)存使用。
memory_map	布爾值，默認(rèn)為False。如果為filepath_or_buffer提供了文件路徑，則將文件對(duì)象直接映射到內(nèi)存中，然后直接從那里訪問(wèn)數(shù)據(jù)。使用此選項(xiàng)可以提高性能，因?yàn)椴辉儆腥魏蜪 / O開(kāi)銷(xiāo)。
float_precision	字符串，選擇性使用。指定C引擎應(yīng)將哪個(gè)轉(zhuǎn)換器用于浮點(diǎn)值。
storage_option	字典，選擇性使用。解析特殊的URL。如果為該參數(shù)提供非fsspec URL，則會(huì)引發(fā)錯(cuò)誤。

DataFrame：將逗號(hào)分隔值（csv）文件讀取到DataFrame中。

函數(shù)使用實(shí)例

終端使用范例：

>>>import pandas as pd
>>>pd.read_csv('data.csv')

代碼行使用范例

#導(dǎo)入pandas庫(kù)，并取別名為pd
import pandas as pd
#books.csv與項(xiàng)目不在同一文件夾下使用絕對(duì)路徑，分隔符為';'，出錯(cuò)的行直接跳過(guò)，編碼方式使用"latin-1"，變量books是DataFrame數(shù)據(jù)結(jié)構(gòu)
books = pd.read_csv('D:\coder\python_program\Books.csv', sep=';', error_bad_lines = False, encoding="latin-1")
#查看books的行和列
print(books.shape)
#查看
print(list(books.columns))
print(books.head())

總結(jié)

到此這篇關(guān)于python中pandas.read_csv()函數(shù)的文章就介紹到這了,更多相關(guān)python pandas.read_csv()函數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

Python基礎(chǔ)之pandas數(shù)據(jù)合并
python-pandas創(chuàng)建Series數(shù)據(jù)類(lèi)型的操作
Python數(shù)據(jù)分析之pandas函數(shù)詳解
python基于Pandas讀寫(xiě)MySQL數(shù)據(jù)庫(kù)
pandas讀取excel時(shí)獲取讀取進(jìn)度的實(shí)現(xiàn)
pandas中.loc和.iloc以及.at和.iat的區(qū)別說(shuō)明
淺談Pandas dataframe數(shù)據(jù)處理方法的速度比較
解決使用pandas聚類(lèi)時(shí)的小坑
pandas 使用merge實(shí)現(xiàn)百倍加速的操作
詳細(xì)介紹在pandas中創(chuàng)建category類(lèi)型數(shù)據(jù)的幾種方法
pandas 顛倒列順序的兩種解決方案
pandas調(diào)整列的順序以及添加列的實(shí)現(xiàn)
pandas快速處理Excel,替換Nan,轉(zhuǎn)字典的操作
Python基礎(chǔ)之教你怎么在M1系統(tǒng)上使用pandas

標(biāo)簽：日照安慶錦州天水隨州股票白城西安

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《python中pandas.read_csv()函數(shù)的深入講解》，本文關(guān)鍵詞 python,中,pandas.read,csv,函數(shù),；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題，煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們，我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無(wú)關(guān)。