
SAS市場(chǎng)研究應(yīng)用介紹:對(duì)應(yīng)分析
一.對(duì)應(yīng)分析(Correspondence analysis)介紹
前二周我們簡(jiǎn)單講了SAS市場(chǎng)研究應(yīng)用,聯(lián)合分析與離散選擇偏好。
組合分析用來(lái)評(píng)價(jià)消費(fèi)者偏好。如果將產(chǎn)品看成一些屬性的組合,那么組合分析可以決定哪種屬性對(duì)決定產(chǎn)品偏好最重要,以及哪種屬性水平的組合是最受偏好的。
組合分析是用來(lái)發(fā)掘消費(fèi)者的偏好,指出了消費(fèi)者將選擇購(gòu)買哪種組合。在市場(chǎng)研究中,消費(fèi)者實(shí)際做的選擇是一種利益行為,那么用離散選擇分析方法來(lái)直接分析消費(fèi)者的選擇是明智的。
但在市場(chǎng)研究中常常會(huì)遇到分類數(shù)據(jù),那么對(duì)應(yīng)分析是一種可以在列聯(lián)表中生動(dòng)呈現(xiàn)出縱列關(guān)系的工具。
本周帶大家認(rèn)識(shí)下對(duì)應(yīng)分析,幫助大家以后在市場(chǎng)研究碰到并解決分類數(shù)據(jù)的快速實(shí)現(xiàn)方法。
對(duì)應(yīng)分析(Correspondence analysis)也稱關(guān)聯(lián)分析、R-Q型因子分析,是近年新發(fā)展起來(lái)的一種多元相依變量統(tǒng)計(jì)分析技術(shù),通過分析由定性變量構(gòu)成的交互匯總表來(lái)揭示變量間的聯(lián)系??梢越沂就蛔兞康母鱾€(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系。
主要應(yīng)用在市場(chǎng)細(xì)分,市場(chǎng)研究、產(chǎn)品定位、地質(zhì)研究以及計(jì)算機(jī)工程等領(lǐng)域中。原因在于,它是一種視覺化的數(shù)據(jù)分析方法,它能夠?qū)捉M看不出任何聯(lián)系的數(shù)據(jù),通過視覺上可以接受的定位圖展現(xiàn)出來(lái)。
它最大特點(diǎn)是能把眾多的樣品和眾多的變量同時(shí)作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來(lái),具有直觀性。另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及中間過程,可以從因子載荷圖上對(duì)樣品進(jìn)行直觀的分類,而且能夠指示分類的主要參數(shù)(主因子)以及分類的依據(jù),是一種直觀、簡(jiǎn)單、方便的多元統(tǒng)計(jì)方法。
二對(duì)應(yīng)基本思想
對(duì)應(yīng)分析的基本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例結(jié)構(gòu)以點(diǎn)的形式在較低維的空間中表示出來(lái)。它最大特點(diǎn)是能把眾多的樣品和眾多的變量同時(shí)作到同一張圖解上,將樣品的大類及其屬性在圖上直觀而又明了地表示出來(lái),具有直觀性。
另外,它還省去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及中間過程,可以從因子載荷圖上對(duì)樣品進(jìn)行直觀的分類,而且能夠指示分類的主要參數(shù)(主因子)以及分類的依據(jù),是一種直觀、簡(jiǎn)單、方便的多元統(tǒng)計(jì)方法。
我們歸納可以分為點(diǎn):
? 首先,編制兩品質(zhì)型變量的交叉列聯(lián)表,將交叉列聯(lián)表中的每個(gè)數(shù)據(jù)單元看成兩變量在相應(yīng)類別上的對(duì)應(yīng)點(diǎn);
? 然后,對(duì)應(yīng)分析將變量及變量之間的聯(lián)系同時(shí)反映在一張二維或三維的散點(diǎn)圖上,并使聯(lián)系密切的類別點(diǎn)較集中,聯(lián)系疏遠(yuǎn)的類別點(diǎn)較分散;
? 最后,通過觀察對(duì)應(yīng)分布圖就能直觀地把握變量類別之間的聯(lián)系.
對(duì)應(yīng)分析方法的優(yōu)缺點(diǎn)
? 定性變量劃分的類別越多,這種方法的優(yōu)越性越明顯
? 揭示行變量類間與列變量類間的聯(lián)系
? 將類別的聯(lián)系直觀地表現(xiàn)在圖形中
? 不能用于相關(guān)關(guān)系的假設(shè)檢驗(yàn)
? 維數(shù)有研究者自定
? 受極端值的影響
三對(duì)應(yīng)分析的主要步驟
對(duì)應(yīng)分析法整個(gè)處理過程由兩部分組成:表格和關(guān)聯(lián)圖。
對(duì)應(yīng)分析法中的表格是一個(gè)二維的表格,由行和列組成。每一行代表事物的一個(gè)屬性,依次排開。列則代表不同的事物本身,它由樣本集合構(gòu)成,排列順序并沒有特別的要求。
在關(guān)聯(lián)圖上,各個(gè)樣本都濃縮為一個(gè)點(diǎn)集合,而樣本的屬性變量在圖上同樣也是以點(diǎn)集合的形式顯示出來(lái)。
四利用SAS應(yīng)用:對(duì)應(yīng)分析
以sasuser中的cars為例,此例中,被訪者要求提供他們汽車和個(gè)人情況的信息,包括汽車的原產(chǎn)國(guó)和家庭地位等。
1. 簡(jiǎn)單對(duì)應(yīng)分析:
簡(jiǎn)單的對(duì)應(yīng)分析處理由若干行和列組成的列聯(lián)表。選擇cars數(shù)據(jù)集和correspondence analysis,點(diǎn)擊OK。
進(jìn)入變量界面后,選擇origin,即汽車的原產(chǎn)國(guó)作為列變量(column),選擇marital,即家庭狀況,作為行變量(row),分析類型選擇簡(jiǎn)單對(duì)應(yīng)分析(simple correspondence analysis),結(jié)果如下:
此圖是用新的兩個(gè)維度來(lái)解釋行變量和列變量,類似主成分分析,第一維度,或者第一主成分,可以稱為“原產(chǎn)地維度”,第二維度可以稱為“家庭狀況維度”。可以看出,married和single兩個(gè)點(diǎn)最接近,注意比較只能在列變量之間,或者行變量之間。但是若將每個(gè)點(diǎn)做與原點(diǎn)之間的連線后,會(huì)發(fā)現(xiàn),american這條線與married w kids這條線之間的距離最近。可以通過結(jié)果菜單中的慣量表(顯示每個(gè)維度的信息)、統(tǒng)計(jì)、頻數(shù)等來(lái)查看更多結(jié)果。
2. 多維一致分析
回到變量界面,選擇多維一致性分析(multiple correspondence analysis),多維一致性分析只需要列變量,將origin,type,size,home,sex,income,和marital選入列變量,點(diǎn)擊OK。通過慣量表可知,此時(shí)一共用了12個(gè)維度。
圖中只顯示了第一維和第二維的關(guān)系,如果想加入更多維度,可以在變量窗口中用“選項(xiàng)”按鈕添加,接著右擊圖,圖形—坐標(biāo)軸變量,可以改變x,y軸的維度。
五對(duì)應(yīng)分析圖解七種方式
對(duì)應(yīng)分析是一種多元相依變量統(tǒng)計(jì)分析技術(shù),通過分析由定性變量構(gòu)成的交互匯總表來(lái)揭示變量間的聯(lián)系??梢越沂就蛔兞康母鱾€(gè)類別之間的差異,以及不同變量各個(gè)類別之間的對(duì)應(yīng)關(guān)系,所有對(duì)于交匯出來(lái)的圖表展示和解釋也相當(dāng)介紹,這里給大家簡(jiǎn)單介紹七種.
以下文章內(nèi)容的圖片來(lái)自:百度文庫(kù)<對(duì)應(yīng)分析>PPT介紹,作者不詳.
第一:距離定理
第二余弦定理
第三原點(diǎn)定理
第四象限分析
第五發(fā)展方向
第六細(xì)分角度
第七圓心定理
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開的話題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開始提取前,需先判斷 TIF 文件的類型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專業(yè)操盤手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10