99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
2021-01-27 閱讀量: 544
?python中g(shù)roupby 函數(shù)的用法

于數(shù)據(jù)的分組和分組運(yùn)算主要是指groupby函數(shù)的應(yīng)用,具體函數(shù)的規(guī)則如下:


df[](指輸出數(shù)據(jù)的結(jié)果屬性名稱).groupby([df[屬性],df[屬性])(指分類的屬性,數(shù)據(jù)的限定定語,可以有多個).mean()(對于數(shù)據(jù)的計算方式——函數(shù)名稱)

舉例如下:

print(df["評分"].groupby([df["地區(qū)"],df["類型"]]).mean())

#上面語句的功能是輸出表格所有數(shù)據(jù)中不同地區(qū)不同類型的評分?jǐn)?shù)據(jù)平均值


二、單類分組

A.groupby("性別")

image.png

首先,我們有一個變量A,數(shù)據(jù)類型是DataFrame


想要按照【性別】進(jìn)行分組


得到的結(jié)果是一個Groupby對象,還沒有進(jìn)行任何的運(yùn)算。



describe()

描述組內(nèi)數(shù)據(jù)的基本統(tǒng)計量


A.groupby("性別").describe().unstack()

image.png

* 只有數(shù)字類型的列數(shù)據(jù)才會計算統(tǒng)計


* 示例里面數(shù)字類型的數(shù)據(jù)有兩列 【班級】和【身高】



但是,我們并不需要統(tǒng)計班級的均值等信息,只需要【身高】,所以做一下小的改動:


A.groupby("性別")["身高"].describe().unstack()

image.png

unstack()

索引重排


上面的例子里面用到了一個小的技巧,讓運(yùn)算結(jié)果更便于對比查看,感興趣的同學(xué)可以自行去除unstack,比較一下顯示的效果



三、多類分組

A.groupby( ["班級","性別"])

image.png

單獨(dú)用groupby,我們得到的還是一個 Groupby 對象。



mean()

組內(nèi)均值計算


DataFrame的很多函數(shù)可以直接運(yùn)用到Groupby對象上。


我們還可以一次運(yùn)用多個函數(shù)計算


A.groupby( ["班級","性別"]).agg([np.sum, np.mean, np.std]) # 一次計算了三個

image.png

agg()

分組多個運(yùn)算



對分組進(jìn)行過濾,保留滿足()條件的分組


以上就是 groupby 最經(jīng)常用到的功能了。


用 first(),tail()截取每組前后幾個數(shù)據(jù)


用 apply()對每組進(jìn)行(自定義)函數(shù)運(yùn)算


用 filter()選取滿足特定條件的分組


62.9467
0
關(guān)注作者
收藏
評論(0)

發(fā)表評論

暫無數(shù)據(jù)
推薦帖子