99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀基本描述數(shù)據(jù)匯總的圖形顯示
基本描述數(shù)據(jù)匯總的圖形顯示
2016-09-25
收藏

基本描述數(shù)據(jù)匯總的圖形顯示

除了在大部分統(tǒng)計或圖形數(shù)據(jù)表示軟件包中使用的條形圖、餅圖和線圖之外,還有一些常用的圖用于顯示數(shù)據(jù)匯總和分布,包括直方圖、分位數(shù)圖、q-q圖、散布圖和局部回歸(loess)曲線。對于數(shù)據(jù)的直觀觀察,這些圖是非常有幫助的。

直方圖(或頻率直方圖)是一種概括給定屬性分布的圖形方法。屬性A的直方圖將A的數(shù)據(jù)分布劃分成不相交的子集或桶。通常,每個桶的寬度是一致的。每個桶用一個矩形表示,其高度等于桶中的值計數(shù)或相對頻率。如果A是分類的,如車型或商品類型,則對A的每個已知值畫一個矩形,而結果圖更多地稱作條形圖。如果A是數(shù)值的,更多地使用術語直方圖。對于數(shù)值屬性,構造直方圖的劃分規(guī)則在2.5.4節(jié)討論。例如,在等寬的直方圖中,每個桶代表數(shù)值屬性A的等寬值域。

表2-1 AllElectronics的一個分店銷售的商品單價數(shù)據(jù)集

圖2-4顯示表2-1中數(shù)據(jù)的直方圖,其中,桶定義成等寬的,代表增量20美元,而頻率是商品的銷售數(shù)量。直方圖至少有一個世紀了,是一種廣泛使用的單變量圖形方法。然而,對于比較單變量觀測組,它可能不如分位數(shù)圖、q-q圖和盒圖方法有效。

 
圖2-4 表2-1中數(shù)據(jù)集的直方圖

分位數(shù)圖(quantile plot)是一種觀察單變量數(shù)據(jù)分布的簡單有效方法。首先,它顯示給定屬性的所有數(shù)據(jù)(允許用戶評估總的情況和不尋常的出現(xiàn))。其次,它繪出了分位數(shù)信息。

這一步使用的機制與2.2.2節(jié)討論的百分位數(shù)計算稍微有點不同。設xi (i = 1, ., N)是按遞增序排序的數(shù)據(jù),使得x1是最小的觀測值,而xN是最大的。每個觀測值xi與一個百分數(shù)fi配對,指出大約100fi%的數(shù)據(jù)小于或等于xi。我們說“大約”,因為可能沒有一個精確的小數(shù)值fi,使得數(shù)據(jù)的fi%小于或等于xi。注意,0.25分位數(shù)對應于四分位數(shù)Q1,0.50分位數(shù)對應于中位數(shù),而0.75分位數(shù)對應于Q3。令

這些數(shù)由1/2N(稍大于0)到1-1/2N(稍小于1),以相同的步長1/N遞增。在分位數(shù)圖中,xi 對著fi畫出。這使得我們可以基于分位數(shù)比較不同的分布。例如,給定兩個不同時間段銷售數(shù)據(jù)的分位數(shù)圖,我們一眼就可以比較它們的Q1,中位數(shù),Q3,以及其他fi值。圖2-5顯示了表2-1單價數(shù)據(jù)的分位數(shù)圖。

 
圖2-5 表2-1單價數(shù)據(jù)的分位數(shù)圖

分位數(shù)-分位數(shù)圖或q-q圖對著另一個對應的分位數(shù),繪制一個單變量分布的分位數(shù)。它是一種強有力的可視化工具,使得用戶可以觀察從一個分布到另一個是否有移位。

假定對于變量單價有兩個觀測集,取自兩個不同的分店。設x1, ., xN是取自第一個分店的數(shù)據(jù),y1, ., yM是取自第二個分店的數(shù)據(jù),每組數(shù)據(jù)都按遞增序排序。如果M = N(即每個集合中的點數(shù)相等),則我們簡單地對著xi畫yi,其中yi和xi都是各自數(shù)據(jù)集的第(i-0.5) / N個分位數(shù)。如果M < N(即第二個分店的觀測值比第一個少),則可能只有M個點在q-q圖中。這里,yi是y數(shù)據(jù)的第(i-0.5) / M個分位數(shù),對著x數(shù)據(jù)的第(i-0.5) / M個分位數(shù)畫。在典型情況下,該計算涉及插值。

圖2-6顯示在給定的時間段,AllElectronics的兩個不同分店銷售的商品單價數(shù)據(jù)的分位數(shù)分位數(shù)圖。每個點對應于每個數(shù)據(jù)集的相同的分位數(shù),并顯示分店1與分店2相對的銷售商品單價。例如,左下角的最低點對應于分位數(shù)0.03。(為幫助比較,我們也畫了一條直線,代表對于給定的分位數(shù),兩個分店的單價相同的情況。此外,加黑的點分別對應于Q1、中位數(shù)和Q3。)我們看到,在分位數(shù)0.03,分店1銷售的商品單價比分店2稍低。換言之,在分店1銷售
的商品3%低于或等于40美元,而在分店2銷售的商品3%低于或等于42美元。在最高分位數(shù),我們看到分店2的商品單價稍微低于分店1。一般地,我們注意到分店1的分布相對于分店2有一個移位,分店1銷售的商品單價趨向于比分店2低。

散布圖(scatter plot)是確定兩個數(shù)值屬性之間看上去是否有聯(lián)系、模式或趨勢的最有效的圖形方法之一。為構造散布圖,每個值對視為一個代數(shù)坐標對,并作為一個點畫在平面上。圖2-7 顯示表2-1中數(shù)據(jù)集的散布圖。散布圖是一種觀察雙變量數(shù)據(jù)有用的方法,用于觀察點的簇和離群點,或考察相關聯(lián)系的可能性。在圖2-8中,我們看到兩個不同數(shù)據(jù)集中兩個屬性之間的正相關和負相關的例子。圖2-9顯示了三種情況,每個數(shù)據(jù)集的兩個屬性之間都不存在相關聯(lián)系。

 
圖2-6 兩個不同分店的單價數(shù)據(jù)的分位數(shù)-分位數(shù)圖

 
圖2-7 表2-1中數(shù)據(jù)的散布圖

 
圖2-8 散布圖可以用來發(fā)現(xiàn)屬性之間的a)正相關或b)負相關

 
圖2-9 三種情況,其中每個數(shù)據(jù)集中兩個屬性之間都不存在觀察到的相關

 
圖2-10 表2-1中數(shù)據(jù)集的loess曲線

在處理多個屬性時,散布圖矩陣(scatter-plot matrix)是散布圖的一種有用的擴充。給定n個屬性,散布圖矩陣是散布圖的n×n柵格,提供每個屬性(或維)與每個其他屬性的可視化表示。隨著所研究的屬性數(shù)量增加,散布圖的有效性降低。在這種情況下,用必要進行諸如放大(zooming)和搖動(panning)等用戶交互操作,幫助有效地解釋單個散布圖。

loess曲線是另一種重要的圖形探查工具,它添加一條光滑曲線到散布圖,以便更好地理解依賴模式。loess一詞是“局部回歸”(local regression)的縮寫。圖2-10顯示表2-1中數(shù)據(jù)集的loess曲線。

為了擬合loess曲線,需要設置兩個參數(shù)—光滑參數(shù)α,被回歸擬合的多項式的次數(shù)λ。α可以是正數(shù)(典型值在1/4~1之間),而λ可以是1或2。選擇α的目的是產(chǎn)生一個擬合,它盡59 ~可能光滑,而不過分破壞數(shù)據(jù)中潛在的模式。曲線隨α增大而變得更光滑。然而,可能出現(xiàn)擬60 合不足,表明可能“丟失”數(shù)據(jù)模式。如果α太小,跟蹤了潛在的模式,但可能過分擬合數(shù)據(jù),曲線中的局部“擺動”可能不被數(shù)據(jù)支持。如果數(shù)據(jù)的潛在模式具有“溫和的”曲率,而沒有局部極大和極小,則局部線性擬合通常就足夠了(λ = 1)。然而,如果存在局部極大和極小,則二次擬合(λ = 2)一般做得更好,它遵循數(shù)據(jù)模式并且保持局部光滑性。

總而言之,描述性數(shù)據(jù)匯總提供了數(shù)據(jù)總體行為的有價值的洞察。通過幫助識別噪聲和離群點,它們對于數(shù)據(jù)清理特別有用。


數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調,回調的第一個參數(shù)驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }