99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀數(shù)據(jù)可視化之旅(三):數(shù)據(jù)圖表的選擇(中)
數(shù)據(jù)可視化之旅(三):數(shù)據(jù)圖表的選擇(中)
2019-09-23
收藏
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

作者 | Destiny

來源 | 木東居士

0x00 前言

數(shù)據(jù)圖表的選擇(上),分享了「時序數(shù)據(jù)」和「比例數(shù)據(jù)」的可視化圖表方案。

不同的數(shù)據(jù)類型、不同的闡述目的,決定了數(shù)據(jù)可視化展現(xiàn)形式的差異。因此,今天這篇文章,主要是分享兩類不同的可視化目的及其可選擇的圖表形式。

  • 「對比型數(shù)據(jù)」:
  • 對比兩組或兩組以上數(shù)據(jù)的差異。
  • 「分布型數(shù)據(jù)」:
  • 研究數(shù)據(jù)分布的集中趨勢、離散程度、偏態(tài)和峰度等。
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

0x01 對比型數(shù)據(jù)可視化

在實際工作中,我們經(jīng)常需要對比多組數(shù)據(jù)之間的差異,而這些差異通常是通過不同的標記和視覺通道體現(xiàn)出來。

  • 高度差異/寬度差異:
  • 柱狀圖條形圖。
  • 面積差異:
  • 面積圖、氣泡圖
  • 字號差異:
  • 單詞云圖。
  • 形狀差異:
  • 星狀圖。

1.柱狀圖

在《數(shù)據(jù)圖表的選擇(上)》有寫到,柱狀圖是離散時間數(shù)據(jù)可視化的方式之一,只不過這里的系列值的數(shù)據(jù)類型是「時間」而已。

柱狀圖除了可以用于離散時間數(shù)據(jù)的可視化,更多的是用于比較不同分類數(shù)據(jù)的可視化,且柱狀圖的數(shù)據(jù)條數(shù),最好不要超過12條。

以下根據(jù)數(shù)據(jù)類別的個數(shù)和可視化的目的,細化柱狀圖的圖表選擇:

  • 單一柱狀圖
  • 適合單一類別的數(shù)據(jù)比對,也適合表示離散型時序數(shù)據(jù)的趨勢。
  • 重疊型柱狀圖
  • 適合兩個類別的數(shù)據(jù)對比,半透明柱形條,代表某項指標的「目標值」,內(nèi)部偏窄且不透明的柱形條表示某項指標的「實際完成情況」。
  • 通常會搭配折線圖使用,折線圖則表示目標完成率。
  • 并列柱狀圖
  • 適合兩個或三個數(shù)據(jù)類別的對比,若數(shù)據(jù)類別超出3個,不建議使用并列柱狀圖。
  • 堆疊柱狀圖
  • 適合既要對比總體的數(shù)據(jù),又要對比總體各構(gòu)成項的數(shù)據(jù),但是總體各構(gòu)成項一般不要大于5個,若大于5個,可按占總體的比例進行歸類,展示TOP5的分類,剩下則歸為「其他」。
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

2.條形圖

條形圖,可以視為是柱狀圖的一種變體,在大部分情況下,是可以互換的。那么在哪些情況下,條形圖能比柱狀圖更好的展示數(shù)據(jù)呢?

  • 條形圖,相比柱狀圖而言,可以展示更多的數(shù)據(jù)條數(shù),一般不要超過30條。
  • 若分類項的文本過長時,柱狀圖的文本需要進行旋轉(zhuǎn)才能不重疊,不利于閱讀,而條形圖就就沒有這個缺點。
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

3.面積圖

面積圖,是折線圖的一種延伸,其實就是折線圖折線圖投影到X軸的直線所圍成的面積。

按照對比方式的不同,面積圖可以分為:「重疊對比型面積圖」和「堆砌對比型面積圖」,兩者的區(qū)別如下。

  • 重疊對比型:
  • 所有系列的面積基線都是X軸,系列之間有重疊和覆蓋的關(guān)系。
  • 堆砌對比型:
  • 只有底層系列的面積基線和X軸重合,其他系列都是堆砌在它們下面一組的數(shù)據(jù)上面。

面積圖,一般也是用于趨勢分析中。

當需要分析各個系列,隨時間的變化趨勢時,此時使用「重疊對比型面積圖」比較合適;當既需要分析整體隨時間的變化趨勢,又要了解整體的各構(gòu)成項隨時間的變化趨勢時,使用「堆砌對比型面積圖」比較合適。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

4.氣泡圖

氣泡圖,和散點圖的區(qū)別是,氣泡圖一般是用于三維數(shù)據(jù)的可視化,而散點圖是用于二維數(shù)據(jù)的可視化。

散點圖中,圓點的面積是相同的,主要是通過圓點在坐標軸中的坐標點(X,Y)確定的位置,來映射數(shù)據(jù)。

氣泡圖,是通過氣泡的面積大小來對比數(shù)據(jù)的圖形方式,它除了可以反映散點圖中坐標點X、Y的相關(guān)關(guān)系,還有一個維度的數(shù)據(jù)可以映射到氣泡的面積大小上,因此「氣泡圖」可以在二維平面展示三維信息的數(shù)據(jù)。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

如上圖所示,左側(cè)的氣泡圖,每個氣泡展示了三個屬性的信息,X-代表人均GDP,Y-代表對應(yīng)國家的平均壽命,Z-即氣泡的大小,代表對應(yīng)國家的人口數(shù)量。所以,相較于散點圖而言,氣泡圖除了可以展示X、Y兩個變量間的相關(guān)關(guān)系,同時還可以對比主體另一個維度的數(shù)據(jù),并且這個數(shù)據(jù)是映射到氣泡的大小上的。

當只有一個系列時,只需要一種氣泡圖只需要一種顏色即可。當有多個系列時,不同系列之間可以用顏色來區(qū)別。

5.單詞云圖

單詞云圖,主要是用于網(wǎng)絡(luò)文本中詞頻數(shù)據(jù)的可視化,如關(guān)鍵詞搜索,文章高頻詞,熱點事件關(guān)鍵詞等。

單詞云圖,是通過單詞的字號大小來反映詞頻的大小,字號越大,詞頻越高。通常,為了達到貼合主體的特征,以及視覺美觀的目的,用戶可以自定義單詞云的配色方案、背景形狀等設(shè)計層面的個性化。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

通過單詞云圖,用戶可以快速找出網(wǎng)站搜索的高頻詞匯、了解文章的主旨、get到熱點事件的關(guān)鍵信息。但是要注意一點,單次云圖只適合表示一組文本數(shù)據(jù)的對比,不適合多個類別的文本數(shù)據(jù)之間的比較。

6.雷達圖/星狀圖

當需要對比一個主體、或多個主體本身,在不同維度上的特征時,雷達圖和星狀圖是不錯的選擇。

雷達圖和星狀圖的區(qū)別是:

  • 雷達圖是一體多維的數(shù)據(jù),即可視化的對象是一個主體,只是這個主體具有多個維度上的數(shù)據(jù)特征。
  • 對比的是,同一個主體,在不同維度上的數(shù)值,可以看出主體在不同維度上的偏向。
  • 星狀圖是多體多維的數(shù)據(jù),即可視化的對象是多個主體,且多個主體維度相同,且單個主體具有多個維度上的數(shù)據(jù)特征。
  • 對比的是,多個主體,在同一維度上的數(shù)值,可以看出不同主體之間的差異和側(cè)重點。

簡單理解就是,雷達圖可以視為是星狀圖中的一行記錄。而且,一般情況下,會給予不同維度上的數(shù)值一定的權(quán)重,從而算出各個主體的綜合得分,我們的芝麻信用分就是這么來的。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

0x02 分布型數(shù)據(jù)可視化

數(shù)據(jù)的分布特征,是統(tǒng)計學(xué)中「描述性統(tǒng)計」模塊研究的內(nèi)容。要對數(shù)據(jù)的分布情況進行可視化呈現(xiàn),首先需要了解數(shù)據(jù)的描述性度量(集中趨勢、離散程度、偏態(tài)和峰度),通過這些反映數(shù)據(jù)分布特征的關(guān)鍵指標,才能確定能夠使用哪些圖表來進行可視化展示。

描述性統(tǒng)計的相關(guān)內(nèi)容,可以參考這篇文章《統(tǒng)計學(xué)第1篇 描述性統(tǒng)計》。

1.直方圖

我們常用的直方圖,主要有「頻數(shù)直方圖」和「頻率直方圖」,它們都是用于展示離散型分組數(shù)據(jù)的分布情況。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

繪制直方圖,有如下幾步:

  • 首先,要對數(shù)據(jù)進行分組,然后統(tǒng)計每個分組內(nèi)數(shù)據(jù)元的頻數(shù)和頻率。
  • 其次,在平面直角坐標系中,橫軸標出每個組數(shù)據(jù)的下限和上限,即上圖中的a和b。
  • 最后,縱軸表示頻數(shù)或頻率,每個矩形的高代表對應(yīng)的頻數(shù)或頻率,即上圖中的h。

若縱軸表示的是頻數(shù),則是「頻數(shù)直方圖」;若縱軸展示的是「頻率」,則為「頻率直方圖」,如上圖所示。

「頻數(shù)分布直方圖」中,頻數(shù)乘以組距得出每個分組的數(shù)量,可以看出頻數(shù)分布直方圖是用面積來表示頻數(shù)的,和柱狀圖條形圖)是用長方形的高度(寬度)表示數(shù)量是有本質(zhì)性區(qū)別的。

2.莖葉圖

莖葉圖一般適合數(shù)據(jù)為整數(shù)的數(shù)據(jù)的可視化,就目前而言,我工作中用得比較少,簡單講下用法。

莖葉圖的原理是,將一組數(shù)據(jù)按照數(shù)據(jù)位數(shù)進行比較,將數(shù)據(jù)中的高位數(shù)作為樹莖,低位數(shù)作為樹葉。假設(shè)有如下一組數(shù)據(jù):

3,7,9,14,15,16,25,26,29,36,41,43,45,46,49

數(shù)據(jù)范圍頻數(shù)0-9310-19320-29330-39140-495

對應(yīng)的樹莖和樹葉可以表示為:

樹莖樹葉03791456256936413569

圖形化表示為:

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

3.箱線圖

在描述性統(tǒng)計中,有涉及到分位數(shù)相關(guān)的知識,其中比較常用的是四分位數(shù),即一組數(shù)據(jù)中的下四分位數(shù)Q1、中位數(shù)、上四分位數(shù)Q3,關(guān)于分位數(shù)的概念不清楚的同學(xué)可以自行查閱相關(guān)資料。

一組數(shù)據(jù)中的四分位數(shù),加上這組數(shù)據(jù)的最大值、最小值,這5個特征值,就可以繪制一個箱線圖。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

箱線圖釋義

  • 箱子的中間一條線,是數(shù)據(jù)的中位數(shù),代表了樣本數(shù)據(jù)的平均水平。
  • 箱子的上下限,分別是數(shù)據(jù)的上四分位數(shù)Q3和下四分位數(shù)Q1,這代表箱體部分包含了數(shù)據(jù)集中50%的數(shù)據(jù),因此,箱子的寬度(四分位距=Q3-Q1)在一定程度上反映了數(shù)據(jù)的離散程度。
  • 在箱子的上方和下方,又各有一條線,有時候代表著最大最小值,有時候代表的是上下內(nèi)限。如果有點位于內(nèi)限之外,理解成“異常值”就好。

箱線圖常用的場景有如下幾類:

(1)對比多組數(shù)據(jù)的分布情況。

(2)檢測數(shù)據(jù)中的異常值或離群點。

4.概率密度圖

若要描述連續(xù)型隨機變量其分布規(guī)律,概率密度圖是一種很直觀表現(xiàn)形式。

在數(shù)學(xué)中,連續(xù)型隨機變量的概率密度函數(shù)是一個描述這個隨機變量的輸出值,在某個確定的取值點附近的可能性的函數(shù),簡單理解就是,連續(xù)型隨機變量取值某個確定數(shù)值的概率,即為縱切直線與概率密度函數(shù)交點的縱坐標的值。而隨機變量的取值落在某個區(qū)域之內(nèi)的概率則為概率密度函數(shù)在這個區(qū)域上的積分,也就是區(qū)間的上下限與概率密度曲線圍成的面積。

通過圖形化的方式,我們可以清楚的看到隨機變量分布的對稱性情況,以及隨機變量取值是集中還是分散,這些可以通過偏態(tài)系數(shù)和峰度系數(shù)來度量,此處不深入闡釋。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

5.散點圖/氣泡圖

可參照上述氣泡圖描述部分,不重復(fù)贅述。

但是需要記住散點圖氣泡圖的區(qū)別:

  • 散點圖,一般是用于研究兩個變量之間的相關(guān)關(guān)系,可以是一個類別數(shù)據(jù),也可以是多類別數(shù)據(jù),但是都是二維的數(shù)組(x,y)。
  • 氣泡圖,除了具體散點圖的功能以外,還可以用氣泡的面積來映射第三個維度的數(shù)據(jù),對應(yīng)的數(shù)據(jù)形式是(x,y,z),同樣可以用于多組或多類別數(shù)據(jù)的比較。

6.熱力圖

熱力圖,是通過密度函數(shù)進行可視化,用于表示地圖中點的密度的熱圖?,F(xiàn)階段,熱力圖在地圖、網(wǎng)頁分析、業(yè)務(wù)數(shù)據(jù)分析等其他領(lǐng)域也有較為廣泛的應(yīng)用。

  • 熱力地圖:
  • 比如我們?nèi)粘J褂玫膶?dǎo)航APP,通過熱力圖來表示各個路況的擁擠程度,顏色越深表示人員越多,對應(yīng)路段也就越擁擠,有了熱力圖可以很直觀的看到區(qū)域內(nèi)的人群流量,方便駕車人士進行路線規(guī)劃。
  • 網(wǎng)頁熱力分析:
  • 常見的網(wǎng)頁熱力圖,有按鼠標點擊位置的熱力圖、按鼠標移動軌跡的熱力圖、按內(nèi)容點擊的熱力圖。
  • 還有一種是獲取用戶眼球在屏幕上的移動軌跡熱力圖,不過這種因為涉及到用戶隱私,獲取數(shù)據(jù)的難度很大。
  • 通過網(wǎng)頁熱力分析,可以直觀清楚地看到頁面上每一個區(qū)域的訪客興趣焦點,從而為營銷推廣、用戶體驗優(yōu)化提供依據(jù)。
  • 業(yè)務(wù)數(shù)據(jù)分析:
  • 帶有地理信息屬性的數(shù)據(jù)、或者離散時間屬性的數(shù)據(jù),也可以使用熱力圖來進行數(shù)據(jù)展示。
<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

7.地圖

當數(shù)據(jù)帶有地理型信息屬性時,首選的可視化圖表為地圖。按照展示的數(shù)據(jù)空間劃分,地圖可以分為二維平面地圖和三維立體地圖。

比如我們常用的導(dǎo)航軟件、天氣預(yù)報、降水量、臺風(fēng)移動路線等都和地理信息相掛鉤,這些數(shù)據(jù)一般也是在地圖上進行呈現(xiàn),給人以直觀的視覺體驗。

<a href='/map/shujukeshihua/' style='color:#000;font-size:inherit;'>數(shù)據(jù)可視化</a>之旅(三):數(shù)據(jù)圖表的選擇(中)

0xFF 總結(jié)

無論是要對比數(shù)據(jù),還是研究數(shù)據(jù)的分布情況,都需要根據(jù)數(shù)據(jù)的類型、數(shù)據(jù)的特征來確定可視化的最佳方式。

根據(jù)數(shù)據(jù)之間的關(guān)系、分析目的、數(shù)據(jù)特征,來選擇和確定相應(yīng)的圖表類型,這個是可視化過程中需要牢牢把握的要點。圖表的目的,是為了更直觀、準確的呈現(xiàn)數(shù)據(jù)背后的信息和知識,不同數(shù)據(jù)關(guān)系應(yīng)該選擇什么圖表都是有套路的可循的。

但是,如果只是為了使用某個覺得高大上的圖表,而不管數(shù)據(jù)的特征是否適用,則是舍本逐末的做法,最終的可視化效果也必定是不理想的。

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務(wù)器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }