
使用R語言繪制其他圖形之相關(guān)系數(shù)圖
雖然cor()函數(shù)可以非常方便快捷的計算出連續(xù)變量之間的相關(guān)系數(shù),但當(dāng)變量非常多時,返回的相關(guān)系數(shù)一定時讀者看的眼花繚亂。
下面就以R自帶的mtcars數(shù)據(jù)集為例,講講相關(guān)系數(shù)圖的繪制:
cor(mtcars[1:7])
很顯然,這么多數(shù)字堆在一起肯定很難快速的發(fā)現(xiàn)變量之間的相關(guān)性大小,如果可以將相關(guān)系數(shù)可視化,就能彌補一大堆數(shù)字的缺陷了。這里介紹corrplot包中的corrplot()函數(shù)進(jìn)行相關(guān)系數(shù)的可視化,首先來看看該函數(shù)的語法和一些重要參數(shù):
corrplot(corr,
method = c("circle", "square", "ellipse", "number", "shade", "color", "pie"),
type = c("full", "lower", "upper"), add = FALSE,
col = NULL, bg = "white", title = "", is.corr = TRUE,
diag = TRUE, outline = FALSE, mar = c(0,0,0,0),
addgrid.col = NULL, addCoef.col = NULL, addCoefasPercent = FALSE,
order = c("original", "AOE", "FPC", "hclust", "alphabet"),
hclust.method = c("complete", "ward", "single", "average",
"mcquitty", "median", "centroid"),
addrect = NULL, rect.col = "black", rect.lwd = 2,
tl.pos = NULL, tl.cex = 1,
tl.col = "red", tl.offset = 0.4, tl.srt = 90,
cl.pos = NULL, cl.lim = NULL,
cl.length = NULL, cl.cex = 0.8, cl.ratio = 0.15,
cl.align.text = "c",cl.offset = 0.5,
addshade = c("negative", "positive", "all"),
shade.lwd = 1, shade.col = "white",
p.mat = NULL, sig.level = 0.05,
insig = c("pch","p-value","blank", "n"),
pch = 4, pch.col = "black", pch.cex = 3,
plotCI = c("n","square", "circle", "rect"),
lowCI.mat = NULL, uppCI.mat = NULL, ...)
corr:需要可視化的相關(guān)系數(shù)矩陣
method:指定可視化的方法,可以是圓形、方形、橢圓形、數(shù)值、陰影、顏色或餅圖形
type:指定展示的方式,可以是完全的、下三角或上三角
col:指定圖形展示的顏色,默認(rèn)以均勻的顏色展示
bg:指定圖的背景色
title:為圖形添加標(biāo)題
is.corr:是否為相關(guān)系數(shù)繪圖,默認(rèn)為TRUE,同樣也可以實現(xiàn)非相關(guān)系數(shù)的可視化,只需使該參數(shù)設(shè)為FALSE即可
diag:是否展示對角線上的結(jié)果,默認(rèn)為TRUE
outline:是否繪制圓形、方形或橢圓形的輪廓,默認(rèn)為FALSE
mar:具體設(shè)置圖形的四邊間距
addgrid.col:當(dāng)選擇的方法為顏色或陰影時,默認(rèn)的網(wǎng)格線顏色為白色,否則為灰色
addCoef.col:為相關(guān)系數(shù)添加顏色,默認(rèn)不添加相關(guān)系數(shù),只有方法為number時,該參數(shù)才起作用
addCoefasPercent:為節(jié)省繪圖空間,是否將相關(guān)系數(shù)轉(zhuǎn)換為百分比格式,默認(rèn)為FALSE
order:指定相關(guān)系數(shù)排序的方法,可以是原始順序(original)、特征向量角序(AOE)、第一主成分順序(FPC)、層次聚類順序(hclust)和字母順序,一般”AOE”排序結(jié)果都比”FPC”要好
hclust.method:當(dāng)order為hclust時,該參數(shù)可以是層次聚類中ward法、最大距離法等7種之一
addrect:當(dāng)order為hclust時,可以為添加相關(guān)系數(shù)圖添加矩形框,默認(rèn)不添加框,如果想添加框時,只需為該參數(shù)指定一個整數(shù)即可
rect.col:指定矩形框的顏色
rect.lwd:指定矩形框的線寬
tl.pos:指定文本標(biāo)簽(變量名稱)的位置,當(dāng)type=full時,默認(rèn)標(biāo)簽位置在左邊和頂部(lt),當(dāng)type=lower時,默認(rèn)標(biāo)簽在左邊和對角線(ld),當(dāng)type=upper時,默認(rèn)標(biāo)簽在頂部和對角線,d表示對角線,n表示不添加文本標(biāo)簽
tl.cex:指定文本標(biāo)簽的大小
tl.col:指定文本標(biāo)簽的顏色
cl.pos:圖例(顏色)位置,當(dāng)type=upper或full時,圖例在右表(r),當(dāng)type=lower時,圖例在底部,不需要圖例時,只需指定該參數(shù)為n
addshade:只有當(dāng)method=shade時,該參數(shù)才有用,參數(shù)值可以是negtive/positive和all,分表表示對負(fù)相關(guān)系數(shù)、正相關(guān)系數(shù)和所有相關(guān)系數(shù)添加陰影。注意:正相關(guān)系數(shù)的陰影是45度,負(fù)相關(guān)系數(shù)的陰影是135度
shade.lwd:指定陰影的線寬
shade.col:指定陰影線的顏色
雖然該函數(shù)的參數(shù)比較多,但可以組合各種參數(shù),靈活實現(xiàn)各種各樣的相關(guān)系數(shù)圖。下面就舉幾個例子:
library(corrplot)
corr <- cor(mtcars[,1:7])
#參數(shù)全部默認(rèn)情況下的相關(guān)系數(shù)圖
corrplot(corr = corr)
#指定數(shù)值方法的相關(guān)系數(shù)圖
corrplot(corr = corr, method="number", col="black", cl.pos="n")
#按照特征向量角序(AOE)排序相關(guān)系數(shù)圖
corrplot(corr = corr, order = 'AOE')
#同時添加相關(guān)系數(shù)值
corrplot(corr = corr, order ="AOE", addCoef.col="grey")
#選擇方法為color
corrplot(corr = corr, method = 'color', order ="AOE", addCoef.col="grey")
我覺得這幅圖比上面的圓形圖要清爽很多
#繪制圓形輪廓相關(guān)系數(shù)圖
corrplot(corr = corr, col = wb, order="AOE", outline=TRUE, cl.pos="n")
這個圖看起來非常像圍棋
#自定義背景色
corrplot(corr = corr, col = wb, bg="gold2", order="AOE", cl.pos="n")
#混合方法之上三角為圓形,下三角為數(shù)字
corrplot(corr = corr,order="AOE",type="upper",tl.pos="d")
corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")
這幅圖將顏色、圓的大小和數(shù)值型相關(guān)系數(shù)相結(jié)合,更容易發(fā)現(xiàn)變量之間的相關(guān)性
#混合方法之上三角為圓形,下三角為方形
corrplot(corr = corr,order="AOE",type="upper",tl.pos="d")
corrplot(corr = corr,add=TRUE, type="lower", method="square",order="AOE",diag=FALSE,tl.pos="n", cl.pos="n")
#混合方法之上三角為圓形,下三角為黑色數(shù)字
corrplot(corr = corr,order="AOE",type="upper",tl.pos="tp")
corrplot(corr = corr,add=TRUE, type="lower", method="number",order="AOE", col="black",diag=FALSE,tl.pos="n", cl.pos="n")
個人更傾向于上圖的展現(xiàn)形式,既清爽又能很好的反映變量間的相關(guān)系數(shù)。
#以層次聚類法排序
corrplot(corr = corr, order="hclust")
#以層次聚類法排序,并繪制3個矩形框
corrplot(corr = corr, order="hclust", addrect = 3, rect.col = "black")
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03