Tableau是一款非常棒的數(shù)據(jù)可視化商業(yè)軟件,通過拖拉拽的方式迅速的實(shí)現(xiàn)數(shù)據(jù)可視化。而且該軟件可以連接任何一種數(shù)據(jù)庫,在處理大型數(shù)據(jù)時(shí)一點(diǎn)都不遜色。
缺點(diǎn)是其無法從事數(shù)據(jù)分析和挖掘工作,幸運(yùn)的是,從Tableau的8.0開始,Tableau與R語言打通,可以在Tableau中運(yùn)行R腳本,從而將R語言的分析或挖掘結(jié)果在Tableau中展示。
如何實(shí)現(xiàn)Tableau和R語言的聯(lián)手繪制可視化圖表呢?
首先需要在R中下載Rserve包
install.packages(‘Rserve’)
library(Rserve)
啟動(dòng)R服務(wù)器
Rserve()
其次,通過Tableau連接R語言。
在Tableau界面下連接R語言:“幫助”——“設(shè)置和性能”——“管理R連接”,輸入服務(wù)器及端口號(hào)即可成功連接(這里的服務(wù)器是本地機(jī)算計(jì),故服務(wù)器填’localhost’)。

一、如何將統(tǒng)計(jì)學(xué)意義的異常值尋找出來?
通過R創(chuàng)建異常值字段:


上圖的異常值判斷標(biāo)準(zhǔn)是:超過上四分位數(shù)的1.5倍四分位距或低于下四分位數(shù)的1.5倍四分位距。
二、連續(xù)變量的預(yù)測(cè)
雖然Tableau可以直接繪制趨勢(shì)線,并根據(jù)趨勢(shì)線做預(yù)測(cè),但是這僅僅是一個(gè)因變量與一個(gè)自變量之間的趨勢(shì)關(guān)系,如下圖繪制的利潤趨勢(shì)僅僅與時(shí)間維度相關(guān):

如果影響利潤的因素由銷售數(shù)量、銷售額和折扣率三個(gè)變量組成,該如何將回歸后的預(yù)測(cè)體現(xiàn)在圖中呢?
通過R擬合預(yù)測(cè)值:


從圖中的結(jié)果顯示,預(yù)測(cè)與實(shí)際的趨勢(shì)一致,是一個(gè)比較理想的預(yù)測(cè)模型。
三、聚類分析
聚類分析是數(shù)據(jù)挖掘中無監(jiān)督的算法之一,R語言可以非常便捷的實(shí)現(xiàn)各種聚類算法,如K-Means、K中心、EM期望最大法、層次分析等,下面就是要K均值算法的距離結(jié)果在Tableau中展示:


強(qiáng)大的可視化工具與強(qiáng)大的統(tǒng)計(jì)分析工具讓你的工作變得更加高效和方便








暫無數(shù)據(jù)