
小白學數(shù)據(jù)分析--相關分析之距離分析在道具購買量的
前幾天,寫過一篇關于相關分析的的文章,很多人都看到了并有很多人在咨詢關于這篇文章的一些內(nèi)容,相關分析是一類很有用的分析方法,如之前所提到的,相關分析由三部分組成,前幾日的文章是講了其中第一部分,第二部分是偏相關分析,第三部分就是復相關分析,說白了其實就是相關分析變量的多少來確定這三部分的。今天這里不談偏相關分析,以為網(wǎng)友給我截圖,問我下面的成交量相關系數(shù)的是怎么算出來的,其實這個就是復相關的典型應用,多變量的相關分析。插一句,該圖來自于騰訊大講堂15-市場研究及數(shù)據(jù)分析理念及方法概要介紹。大家如果需要,請到百度文庫或者聯(lián)系我都OK。
今天將通過Excel和SPSS向大家說說怎么來進行多變量的相關分析,既然是游戲數(shù)據(jù)分析,那么自然少不了如何利用游戲數(shù)據(jù)實現(xiàn)多變量的相關分析。在游戲數(shù)據(jù)分析方面,很多的數(shù)據(jù)都可以進行相關分析,比如界面按鈕的點擊次數(shù),今天我們選取游戲道具的購買量進行相關分析。
我們知道游戲道具非常多,換句話說如果進行相關分析,盡管相關分析可以滿足我們的計算要求,但是對于我們后期的評估和決策帶來非常大不便利,所以這里建議大家做道具的相關分析先進行道具分類,比如FPS游戲中把AK47,M4A1歸類為突擊步槍,或者再高一個類別,武器,這樣在不同的分類維度下進行相關分析,便于我們從不同的高度和角度來進行分析和決策。以下所示為示例數(shù)據(jù)(模擬),可以看到有7個品類的道具,從101-107,取出來共計10周的數(shù)據(jù)。
下面我們來看如何通過Excel進行多變量的相關分析。如何打開數(shù)據(jù)分析,選擇相關分析,在上次文章已經(jīng)提到了,這里不再累述,這里打開一下的對話框。
選擇數(shù)據(jù),數(shù)據(jù)區(qū)域選擇B1:H1,選擇好輸出區(qū)域,點擊確定,得到如下的相似矩陣:
有關這個矩陣的分析稍后在說完SPSS的操作再講解,下面看看SPSS如何進行相關分析。在SPSS中,有專門的模塊進行多變量的相關分析。SPSS中針對相關分析的三部分設置了三部分模塊進行獨立的分析。多變量的相關分析在SPSS中叫做距離分析,相對偏相關分析通過控制一些被認為次要的變量的影響得到兩個變量之間的相關系數(shù),距離分析解決的問題更加復雜,因為實際應用時每一個變量都攜帶了一定的信息,但是彼此在某些方面又是重疊的,舉個例子,比如有個變量叫做突擊步槍,突擊步槍的銷售量代表了AK47,M4A1等突擊步槍的銷售情況和信息,同時突擊步槍也屬于武器類別,與機槍等類別又有交叉,因為機槍和突擊步槍都屬于武器類別。
距離分析是對變量之間相似或者不相似程度的測度,通過計算一對變量之間的廣義距離,將距離較小的變量歸為一類,距離較大的變量歸為其他類,這也是為聚類分析、因子分析打下基礎。有關距離分析的更多詳細內(nèi)容這里不再累述,大家可以自己百度。
具體操作如下,首先看到SPSS中展示的數(shù)據(jù),此為101-107系列道具的銷售量:
之后選擇分析|相關|距離界面,選擇界面如下所示:
彈出對話框,如下所示,將var101-var107選入變量框中,此處最少包含兩個變量。
計算距離包括兩個兩選擇項,個案間和變量間,表示輸出結果是個案或者變量間距離分析值。度量標準包括不相似性和相似性兩個選項以及一個度量按鈕。不相似性表示測度方法為不相似性測度。此時如果點擊度量,彈出來距離:非相似性度量對話框,如下圖所示:
有關該方面知識在這里不作解釋和闡述,主要來看距離:相似性對話框的設置,首先如下圖所示:
度量標準選擇區(qū)間|Pearson相關性,轉(zhuǎn)換值標準化|Z得分,其他的選項默認就可以了,這里簡單解釋一下幾個選擇的含義。Pearson相關性表示兩個值矢量之間的積矩相關性,是定矩數(shù)據(jù)的缺省相似性測量。轉(zhuǎn)換值是在計算距離之前對變量進行標準化的方法,這里使用Z得分,Z得分表示將值標準化到均值為0且標準差為1的Z得分,但同時注意標準化要指定標準化對象,這里是變量。
在完成以上的設置后,點擊確定將會輸出結果,上面的為案例處理摘要,下面的為距離分析的近似矩陣。
下面我們結合Excel和SPSS的分析結果來具體分析一下,在Excel的分析結果中,我們發(fā)現(xiàn)105系列道具相關性最弱,那么這個品類就需要我們?nèi)ミM一步探究一下。從SPSS的結果來看,105系列道具確實相關性系數(shù)較低,其次是103系列道具相關系數(shù)也比較低,但是從總體的Excel和SPSS分析結果來看,101與106、102與106、103與105、104與106、107與102相關性很高,這就是我們得出的結論,最后我們來看看這幾個類別道具具體指的是什么:
101:突擊步槍
102:沖鋒槍
103:機槍
104:狙擊步槍
105:shouqiang
106:投擲武器
107:近戰(zhàn)武器
故而從這里我們再來看一下,大概了解了FPS游戲的玩家作戰(zhàn)配置,突擊步槍+投擲武器;沖鋒槍+投擲武器;機槍+投擲武器;狙擊步槍+投擲武器;沖鋒槍+近戰(zhàn)武器。當然這種配置不是絕對的,還要考慮游戲本身在這方面的設計情況,比如很多游戲主武器是突擊步槍,副武器是沖鋒槍,這種情況是要結合業(yè)務來考慮,而最終我們通過分析得出的結果,也要根據(jù)具體的需要進行篩選和調(diào)整。
以上是相關性分析的最復雜的一部分,希望解決一部分網(wǎng)友的疑問,這種方法的參考性和實際利用性還需要進一步檢驗和證明,屬于探索內(nèi)容,請使用者慎重考慮。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎用法到實戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無論 ...
2025-09-18MySQL 大表拆分與關聯(lián)查詢效率:打破 “拆分必慢” 的認知誤區(qū) 在 MySQL 數(shù)據(jù)庫管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結構數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結構數(shù)據(jù)(如數(shù)據(jù)庫表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預期算子的內(nèi)涵、作用與應用解析 動態(tài)隨機一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結構數(shù)據(jù)特征價值的專業(yè)核心 表結構數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲的結構化數(shù)據(jù),如數(shù)據(jù)庫表、Excel 表、 ...
2025-09-17Excel 導入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實戰(zhàn)應用 在用 Python(如 pandas 庫)處理 Excel 數(shù)據(jù)時,“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗與 t 檢驗:差異、適用場景與實踐應用 在數(shù)據(jù)分析與統(tǒng)計學領域,假設檢驗是驗證研究假設、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結構數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結構數(shù)據(jù)(以 “行 - 列” 存儲的結構化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計劃中 rows 數(shù)量的準確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對象的 text 與 content:區(qū)別、場景與實踐指南 在 Python 進行 HTTP 網(wǎng)絡請求開發(fā)時(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結構數(shù)據(jù)價值的核心操盤手 表格結構數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫表)是企業(yè)最基礎、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請求工具對比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長浮點數(shù)據(jù)的科學計數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長浮點數(shù)據(jù)時的科學計數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務數(shù)據(jù)分析步驟的落地者與價值優(yōu)化者 業(yè)務數(shù)據(jù)分析是企業(yè)解決日常運營問題、提升執(zhí)行效率的核心手段,其價值 ...
2025-09-12用 SQL 驗證業(yè)務邏輯:從規(guī)則拆解到數(shù)據(jù)把關的實戰(zhàn)指南 在業(yè)務系統(tǒng)落地過程中,“業(yè)務邏輯” 是連接 “需求設計” 與 “用戶體驗 ...
2025-09-11塔吉特百貨孕婦營銷案例:數(shù)據(jù)驅(qū)動下的精準零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當下,精準營銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務數(shù)據(jù)分析:概念辨析與協(xié)同價值 在數(shù)據(jù)驅(qū)動決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實踐到業(yè)務價值挖掘 在數(shù)據(jù)分析場景中,聚類分析作為 “無監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價值導向 統(tǒng)計模型作為數(shù)據(jù)分析的核心工具,并非簡單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10