99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁大數(shù)據(jù)時代怎么利用pandas實現(xiàn)區(qū)間頻率分布的展現(xiàn)?
怎么利用pandas實現(xiàn)區(qū)間頻率分布的展現(xiàn)?
2023-05-04
收藏

Pandas是Python中用于數(shù)據(jù)分析和處理的常用工具,它提供了一系列方便易用的數(shù)據(jù)結構和函數(shù)。在數(shù)據(jù)分析中,我們經(jīng)常需要對數(shù)據(jù)進行頻率分布的計算和展示,而Pandas提供了很多方便的函數(shù)可以實現(xiàn)這一功能。本文將介紹如何使用Pandas來計算和展示區(qū)間頻率分布。

什么是區(qū)間頻率分布?

區(qū)間頻率分布是指將連續(xù)的數(shù)值型數(shù)據(jù)按照一定的區(qū)間劃分,然后統(tǒng)計每個區(qū)間內(nèi)數(shù)據(jù)出現(xiàn)的次數(shù)或占比情況。例如,我們有一組考試成績數(shù)據(jù),需要將其按照一定的分數(shù)區(qū)間劃分,然后統(tǒng)計每個區(qū)間內(nèi)的學生人數(shù)或占比情況。通過區(qū)間頻率分布,我們可以更清晰地了解數(shù)據(jù)的分布情況,發(fā)現(xiàn)數(shù)據(jù)中的規(guī)律和異常點,從而為后續(xù)的數(shù)據(jù)分析和處理提供支持。

準備數(shù)據(jù)

首先我們需要準備一組數(shù)值型數(shù)據(jù),用于演示如何實現(xiàn)區(qū)間頻率分布。這里我們使用numpy隨機生成一組服從正態(tài)分布的數(shù)據(jù):

import numpy as np

data = np.random.normal(loc=10, scale=3, size=1000)

上述代碼生成了一組均值為10,標準差為3,大小為1000的正態(tài)分布數(shù)據(jù)。接下來我們可以使用Pandas將這組數(shù)據(jù)轉(zhuǎn)換Series對象:

import pandas as pd

s = pd.Series(data)

計算區(qū)間頻率分布

有了原始數(shù)據(jù)之后,我們需要將其按照一定的區(qū)間劃分,并統(tǒng)計每個區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù)或占比情況。在Pandas中,我們可以使用cut函數(shù)實現(xiàn)對數(shù)據(jù)的區(qū)間劃分,再配合value_counts函數(shù)統(tǒng)計每個區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù)。例如,將上述數(shù)據(jù)按照5個等寬區(qū)間進行劃分,可以實現(xiàn)如下:

bins = pd.cut(s, bins=5, include_lowest=True)
counts = bins.value_counts(sort=False)
print(counts)

上述代碼首先調(diào)用了cut函數(shù)將數(shù)據(jù)按照5個等寬區(qū)間進行劃分,并通過參數(shù)include_lowest=True將最小值包含在第一個區(qū)間內(nèi)。然后使用value_counts函數(shù)統(tǒng)計每個區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù),sort=False表示不進行排序。

輸出結果如下所示:

(4.562, 7.44]      8
(7.44, 10.303]   303
(10.303, 13.166] 537
(13.166, 16.029] 131
(16.029, 18.892]  21
dtype: int64

可以看到,上述代碼將數(shù)據(jù)按照5個等寬區(qū)間劃分,并統(tǒng)計了每個區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù)。例如,(7.44, 10.303]區(qū)間內(nèi)有303個數(shù)據(jù)。

除了計算每個區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù)之外,我們還可以計算每個區(qū)間內(nèi)數(shù)據(jù)的占比情況。這可以通過將value_counts函數(shù)的normalize參數(shù)設置為True來實現(xiàn)。例如,計算每個區(qū)間內(nèi)數(shù)據(jù)的占比情況可以實現(xiàn)如下:

bins = pd.cut(s, bins=5, include_lowest=True)
proportions = bins.value_counts(sort=False, normalize=True)
print(proportions)

輸出結果如下所示:

(4.562, 7.44]     0.008
(7.44, 10.303]    0.303
(10.303, 13.166]  0.537
(13.166, 16.029]  0.131
(16.029, 18.892]  0

.021 dtype: float64


可以看到,上述代碼將數(shù)據(jù)按照5個等寬區(qū)間劃分,并統(tǒng)計了每個區(qū)間內(nèi)數(shù)據(jù)的占比情況。例如,(7.44, 10.303]區(qū)間內(nèi)的數(shù)據(jù)占總數(shù)的30.3%。

# 可視化展示

除了計算區(qū)間頻率分布之外,我們還需要將其進行可視化展示,以便更直觀地了解數(shù)據(jù)的分布情況。在Pandas中,我們可以使用plot函數(shù)實現(xiàn)對區(qū)間頻率分布的可視化展示。例如,將上述數(shù)據(jù)按照5個等寬區(qū)間進行劃分,并繪制成直方圖,可以實現(xiàn)如下:

```python
bins = pd.cut(s, bins=5, include_lowest=True)
counts = bins.value_counts(sort=False)

counts.plot(kind='bar', rot=0)

上述代碼將數(shù)據(jù)按照5個等寬區(qū)間劃分,并統(tǒng)計了每個區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù)。然后調(diào)用plot函數(shù)將結果繪制成直方圖,kind='bar'表示繪制條形圖,rot=0表示不對橫軸標簽進行旋轉(zhuǎn)。

輸出結果如下所示:

frequency_distribution

可以看到,上述代碼將數(shù)據(jù)按照5個等寬區(qū)間劃分,并將結果繪制成直方圖。在直方圖中,每個條形代表一個區(qū)間,條形的高度表示該區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù)。通過直方圖,我們可以更清晰地了解數(shù)據(jù)的分布情況,例如數(shù)據(jù)是否符合正態(tài)分布等。

總結

本文介紹了如何使用Pandas實現(xiàn)區(qū)間頻率分布的計算和展示。具體來說,我們通過cut函數(shù)將數(shù)據(jù)按照一定的區(qū)間劃分,并配合value_counts函數(shù)統(tǒng)計每個區(qū)間內(nèi)數(shù)據(jù)的出現(xiàn)次數(shù)或占比情況;同時,通過plot函數(shù)將計算結果進行可視化展示,以便更直觀地了解數(shù)據(jù)的分布情況。區(qū)間頻率分布是數(shù)據(jù)分析中常用的基礎操作之一,熟練掌握其原理和實現(xiàn)方法對于數(shù)據(jù)分析工作非常重要。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }