參數(shù)名 | 功能以及含義 |
---|---|
filepath_or_buffer | 字符串。任何有效的字符串路徑都可以,網(wǎng)址也行。 |
sep | 字符串,表示分隔符,默認(rèn)為',' .。一個(gè)字符及以上都可以,注意如果是轉(zhuǎn)義字符要加'' |
delimiter | 字符串,sep的別名,默認(rèn)None |
header | int或者int列表,默認(rèn)由推斷出來(lái)。這是用于規(guī)定列名的行號(hào)。 |
names | 類(lèi)似于數(shù)組結(jié)構(gòu),選擇性使用。這是要使用的列名稱列表,與header共同使用。 |
index_col | 整數(shù)或者字符串或者整數(shù)/字符串列表。指定用作的行標(biāo)簽的列。 |
usecols | 列表,可用可不用。功能是返回列的子集。 |
squeeze | 布爾值,默認(rèn)為False。如果解析的數(shù)據(jù)僅包含一列,則返回一個(gè)Series |
prefix | 字符串,選擇性使用。沒(méi)有標(biāo)題時(shí)要添加到列號(hào)的前綴 |
mangle_dupe_cols | 布爾值,默認(rèn)為T(mén)rue。重復(fù)的列將被指定為“ X”,“ X.1”,……“ X.N”,而不是“ X”……“ X”。如果列中的名稱重復(fù),則False將導(dǎo)致數(shù)據(jù)被覆蓋。 |
dtype | 類(lèi)型名稱或者類(lèi)型列的字典,選擇性使用。數(shù)據(jù)或列的數(shù)據(jù)類(lèi)型。 |
engine | {‘c', ‘python'},選擇性使用。要使用的解析器引擎。C引擎速度更快,而python引擎當(dāng)前功能更完善。 |
converters | 字典,選擇性使用。轉(zhuǎn)換器,用于轉(zhuǎn)換某些列中的值的函數(shù)的字典。鍵可以是整數(shù)或列標(biāo)簽。 |
true_value | 列表,選擇性使用。視為T(mén)rue的值 |
false_values | 列表,選擇性使用。視為False的值 |
skipinitialspace | 布爾值,默認(rèn)為False。在定界符后跳過(guò)空格。 |
skiprows | 列表或者整數(shù),選擇性使用。在文件開(kāi)始處要跳過(guò)的行號(hào)(索引為0)或要跳過(guò)的行數(shù)(整數(shù))。 |
skipfooter | 整數(shù),默認(rèn)為0。要跳過(guò)的文件底部的行數(shù)(不支持engine =‘c')。 |
nrows | 整數(shù),選擇性使用。要讀取的文件行數(shù)。對(duì)于讀取大文件很有用。 |
na_values | 標(biāo)量,字符串,類(lèi)似列表的字典,選擇性使用。識(shí)別為NA / NaN的其他字符串。如果dict通過(guò),則為特定的每列NA值。默認(rèn)情況下,以下值解釋為NaN:'','#N / A','#N / AN / A','#NA','-1.#IND','-1.#QNAN', ‘-NaN','-nan',‘1.#IND',‘1.#QNAN','',‘N / A',‘NA',‘NULL',‘NaN',‘n / a',‘nan',‘null'。 |
keep_default_na | 布爾值,默認(rèn)為T(mén)rue。解析數(shù)據(jù)時(shí)是否包括默認(rèn)的NaN值。 |
na_filter | 布爾值,默認(rèn)為T(mén)rue。檢測(cè)缺失值標(biāo)記(空字符串和na_values的值)。請(qǐng)注意,如果將na_filter傳遞為False,則將忽略keep_default_na和 na_values參數(shù)。 |
verbose | 布爾值,默認(rèn)為False。指示放置在非數(shù)字列中的NA值的數(shù)量。 |
skip_blank_lines | 布爾值,默認(rèn)為T(mén)rue。如果為T(mén)rue,跳過(guò)空白行,并且不解釋為NaN值。 |
parse_dates | 布爾值,整數(shù)列表,名稱列表,列表或字典的列表。默認(rèn)為False。功能是解析為時(shí)間。 |
infer_datetimes_format | 布爾值,默認(rèn)為False。如果啟用True和parse_dates,則pandas將嘗試推斷列中日期時(shí)間字符串的格式,并且如果可以推斷出日期格式,就會(huì)切換到更快的解析它們的方法。 |
keep_date_col | 布爾值,默認(rèn)為False。如果True和parse_dates指定合并多個(gè)列,則保留原始列。 |
date_parser | 函數(shù),選擇性使用。用于將字符串列序列轉(zhuǎn)換為日期時(shí)間實(shí)例數(shù)組的函數(shù)。 |
dayfirst | 布爾值,默認(rèn)為False。DD / MM格式的日期,國(guó)際和歐洲格式。 |
cache_dates | 布爾值,默認(rèn)為T(mén)rue。如果為T(mén)rue,則使用唯一的轉(zhuǎn)換日期緩存來(lái)應(yīng)用datetime轉(zhuǎn)換。 |
iterator | 布爾值,默認(rèn)為False。返回TextFileReader對(duì)象以進(jìn)行迭代或使用獲取塊 get_chunk()。 |
chunksize | 整數(shù),選擇性使用。返回TextFileReader對(duì)象以進(jìn)行迭代。 |
compression | {‘infer', ‘gzip', ‘bz2', ‘zip', ‘xz', None},默認(rèn)為'infer'。用于對(duì)磁盤(pán)數(shù)據(jù)進(jìn)行即時(shí)解壓縮。設(shè)置為“無(wú)”將不進(jìn)行解壓縮。 |
thousands | 字符串,選擇性使用。千位分隔符。 |
decimal | 字符串,默認(rèn)為'.'。識(shí)別為小數(shù)點(diǎn)的字符(例如,對(duì)于歐洲數(shù)據(jù),請(qǐng)使用“,”)。 |
lineterminator | 長(zhǎng)度為1的字符串,選擇性使用。用于將文件分成幾行的字符。僅對(duì)C解析器有效。 |
quotechar | 長(zhǎng)度為1的字符串,選擇性使用。用于表示引用項(xiàng)目的開(kāi)始和結(jié)束的字符。 |
quoting | 整數(shù)或者csv.QUOTE_* 實(shí)例,默認(rèn)為0。每個(gè)csv.QUOTE_*常量的控制字段引用行為。使用QUOTE_MINIMAL(0),QUOTE_ALL(1),QUOTE_NONNUMERIC(2)或QUOTE_NONE(3)中的一種。 |
doublequote | 布爾值,默認(rèn)為T(mén)rue。如果指定quotechar而未使用引號(hào)QUOTE_NONE,則指示是否將一個(gè)字段內(nèi)的兩個(gè)連續(xù)的quotechar元素解釋為單個(gè)quotechar元素。 |
escapechar | 長(zhǎng)度為1的字符串,選擇性使用。 一字符字符串,用于轉(zhuǎn)義其他字符。 |
comment | 字符串,選擇性使用。指示不應(yīng)分析行的其余部分。如果在一行的開(kāi)頭找到該行,則將完全忽略該行。此參數(shù)必須是單個(gè)字符。 |
encoding | 字符串,選擇性使用。讀/寫(xiě)時(shí)用于UTF的編碼(例如'utf-8')。 |
dialect | 字符串或者csv.Dialect,選擇性使用。如果提供的話,該參數(shù)將覆蓋為以下參數(shù)的值(默認(rèn)或不):delimiter, doublequote, escapechar, skipinitialspace, quotechar, and quoting。 |
error_bad_lines | 布爾值,默認(rèn)為T(mén)rue。 默認(rèn)情況下,具有太多字段的行(例如,帶有太多逗號(hào)的csv行)將引發(fā)異常,并且不會(huì)返回任何DataFrame。如果為False,則這些“壞行”將從返回的DataFrame中刪除。 |
warn_bad_lines | 布爾值,默認(rèn)為T(mén)rue。如果error_bad_lines為False,而warn_bad_lines為T(mén)rue,則將為每個(gè)“壞行”輸出警告。 |
delim_whiterspace | 布爾值,默認(rèn)為False。指定是否將空格(例如或)用作分隔符。 |
low_memory | 布爾值,默認(rèn)為T(mén)rue。在內(nèi)部對(duì)文件進(jìn)行分塊處理,從而在解析時(shí)減少了內(nèi)存使用。 |
memory_map | 布爾值,默認(rèn)為False。如果為filepath_or_buffer提供了文件路徑,則將文件對(duì)象直接映射到內(nèi)存中,然后直接從那里訪問(wèn)數(shù)據(jù)。使用此選項(xiàng)可以提高性能,因?yàn)椴辉儆腥魏蜪 / O開(kāi)銷(xiāo)。 |
float_precision | 字符串,選擇性使用。指定C引擎應(yīng)將哪個(gè)轉(zhuǎn)換器用于浮點(diǎn)值。 |
storage_option | 字典,選擇性使用。解析特殊的URL。如果為該參數(shù)提供非fsspec URL,則會(huì)引發(fā)錯(cuò)誤。 |
返回
DataFrame:將逗號(hào)分隔值(csv)文件讀取到DataFrame中。
終端使用范例:
>>>import pandas as pd >>>pd.read_csv('data.csv')
代碼行使用范例
#導(dǎo)入pandas庫(kù),并取別名為pd import pandas as pd #books.csv與項(xiàng)目不在同一文件夾下使用絕對(duì)路徑,分隔符為';',出錯(cuò)的行直接跳過(guò),編碼方式使用"latin-1",變量books是DataFrame數(shù)據(jù)結(jié)構(gòu) books = pd.read_csv('D:\coder\python_program\Books.csv', sep=';', error_bad_lines = False, encoding="latin-1") #查看books的行和列 print(books.shape) #查看 print(list(books.columns)) print(books.head())
到此這篇關(guān)于python中pandas.read_csv()函數(shù)的文章就介紹到這了,更多相關(guān)python pandas.read_csv()函數(shù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
標(biāo)簽:日照 安慶 錦州 天水 隨州 股票 白城 西安
巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python中pandas.read_csv()函數(shù)的深入講解》,本文關(guān)鍵詞 python,中,pandas.read,csv,函數(shù),;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。