主頁 > 知識(shí)庫 > python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)

python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)

熱門標(biāo)簽:北京電信外呼系統(tǒng)靠譜嗎 地圖標(biāo)注視頻廣告 百度地圖標(biāo)注位置怎么修改 大連crm外呼系統(tǒng) 無錫客服外呼系統(tǒng)一般多少錢 高德地圖標(biāo)注是免費(fèi)的嗎 老人電話機(jī)器人 梅州外呼業(yè)務(wù)系統(tǒng) 洪澤縣地圖標(biāo)注

使用groupby([ ]).size()統(tǒng)計(jì)的結(jié)果,值相同的字段值會(huì)不顯示


如上圖所示,第一個(gè)空著的行是982499 7 3388 1,因?yàn)榇诵信c前面一行的這兩個(gè)字段值是一樣的,所以不顯示。第二個(gè)空著的行是390192 22 4278 1,因?yàn)榇诵信c前面一行的第一個(gè)字段值是一樣的,所以不顯示。這樣的展示方式更直觀,但對(duì)于剛用的人,可能會(huì)讓其以為是缺失值。

如果還不明白可以看下面的全部數(shù)據(jù)及操作。

import pandas as pd
res6 = pd.read_csv('test.csv')
res6.shape
(12, 3)
res6.columns
Index(['user_id', 'cate', 'shop_id'], dtype='object')
res6.info()
class 'pandas.core.frame.DataFrame'>
RangeIndex: 12 entries, 0 to 11
Data columns (total 3 columns):
user_id    12 non-null int64
cate       12 non-null int64
shop_id    12 non-null int64
dtypes: int64(3)
memory usage: 368.0 bytes
res6.describe()

user_id cate shop_id
count 1.200000e+01 12.000000 12.000000
mean 6.468688e+05 10.666667 3594.000000
std 3.988181e+05 6.665151 373.271775
min 2.421410e+05 7.000000 3388.000000
25% 3.901920e+05 7.000000 3388.000000
50% 4.938730e+05 7.000000 3388.000000
75% 9.824990e+05 10.250000 3586.250000
max 1.558165e+06 23.000000 4278.000000

res6

user_id cate shop_id
0 390192 20 4178
1 390192 23 4179
2 390192 22 4278
3 1021819 7 3388
4 242141 7 3388
5 283284 7 3388
6 1558165 7 3388
7 533696 7 3388
8 982499 7 3388
9 493873 7 3388
10 493873 7 3388
11 982499 7 3389

res6['user_id'].value_counts()

390192     3
982499     2
493873     2
242141     1
1021819    1
533696     1
1558165    1
283284     1
Name: user_id, dtype: int64
res6.groupby(['user_id']).size().sort_values(ascending=False)

user_id
390192     3
982499     2
493873     2
1558165    1
1021819    1
533696     1
283284     1
242141     1
dtype: int64

res6.groupby(['user_id', 'cate']).size().sort_values(ascending=False)

user_id  cate
982499   7       2
493873   7       2
1558165  7       1
1021819  7       1
533696   7       1
390192   23      1
         22      1
         20      1
283284   7       1
242141   7       1
dtype: int64
res6_test = res6.groupby(['user_id', 'cate', 'shop_id']).size().sort_values(ascending=False)
res6_test
user_id  cate  shop_id
493873   7     3388       2
1558165  7     3388       1
1021819  7     3388       1
982499   7     3389       1
               3388       1
533696   7     3388       1
390192   23    4179       1
         22    4278       1
         20    4178       1
283284   7     3388       1
242141   7     3388       1
dtype: int64

到此這篇關(guān)于python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas多列分組統(tǒng)計(jì)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

您可能感興趣的文章:
  • Python Pandas分組聚合的實(shí)現(xiàn)方法
  • 詳解python pandas 分組統(tǒng)計(jì)的方法
  • Python Pandas實(shí)現(xiàn)數(shù)據(jù)分組求平均值并填充nan的示例
  • Python學(xué)習(xí)筆記之pandas索引列、過濾、分組、求和功能示例
  • Python Pandas的簡單使用教程
  • Python pandas入門系列之眾數(shù)和分位數(shù)
  • Python pandas求方差和標(biāo)準(zhǔn)差的方法實(shí)例
  • python geopandas讀取、創(chuàng)建shapefile文件的方法
  • 使用Python pandas讀取CSV文件應(yīng)該注意什么?
  • 利用python Pandas實(shí)現(xiàn)批量拆分Excel與合并Excel
  • python pandas分組聚合詳細(xì)

標(biāo)簽:岳陽 清遠(yuǎn) 泉州 長春 洛陽 怒江 吉林 安慶

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)》,本文關(guān)鍵詞  python,中,pandas,對(duì),多列,進(jìn)行,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)》相關(guān)的同類信息!
  • 本頁收集關(guān)于python中pandas對(duì)多列進(jìn)行分組統(tǒng)計(jì)的實(shí)現(xiàn)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章