
多重應(yīng)答數(shù)據(jù)深度分析方法及其SPSS操作_數(shù)據(jù)分析師考試
多重應(yīng)答(Multiple Response),又稱多選題,是市場調(diào)查研究中十分常見的數(shù)據(jù)形式。多重應(yīng)答數(shù)據(jù)本質(zhì)上屬于分類數(shù)據(jù),但由于各選項均是對同一個問題的回答,之間存在一定的相關(guān),將各選項單獨進行分析并不恰當(dāng)。對多重應(yīng)答數(shù)據(jù)最常見的分析是使用SPSS中的“Multiple Response”命令,通過定義變量集的方式,對選項進行簡單的頻數(shù)分析和交叉分析。筆者認(rèn)為,該分析方法對調(diào)查數(shù)據(jù)的開發(fā)利用往往是不夠的,我們還可以使用其他分析方法對數(shù)據(jù)信息進行深度挖掘。
一、兩種數(shù)據(jù)錄入方式
比如說在某次民意調(diào)查中,我們希望了解公眾評價宜居城市時,到底是城市的哪一些特征決定人們對該城市宜居性的評估。為此,我們在研究中設(shè)計了14項標(biāo)準(zhǔn)請被訪者從中選出他們在進行宜居評價時最看重的5項標(biāo)準(zhǔn)(關(guān)于宜居標(biāo)準(zhǔn)的具體探討,參見本刊2006年第8期)。
選項包括:
![]() |
這是一道典型的多重應(yīng)答題。統(tǒng)計軟件中對多重應(yīng)答的標(biāo)準(zhǔn)紀(jì)錄方式有兩種:(1)多重二分法(Multiple dichotomy method)。對于多項選擇題的每一個選項看作一個變量來定義。0代表沒有被選中,1代表被選中。這樣,多項選擇題中有幾個選項,就會變成有幾個單選變量。這些單選變量的選項都只有兩個,即0或1。比如在上述例子中,我們就可以設(shè)置14個單選變量,來標(biāo)示某選項是否被選中;(2)多重分類法(Multiple category method)。多項選擇題中有幾個選項,就定義幾個單選變量。每個變量的選項都一樣,都和多項選擇題的選項相同。每個變量代表被調(diào)查者的一次選擇,即紀(jì)錄的是被選中的選項的代碼。如上述例子中,我們可以設(shè)置X1~X5共5個變量,每個變量的選項兼為從1到14的14項宜居標(biāo)準(zhǔn)。很多情況下,當(dāng)問卷中不限定被訪者可選擇的選項數(shù)量時,被調(diào)查者可能不會全部選項都選,因此在數(shù)據(jù)錄入時,一般從這些變量的最前面幾個變量開始錄入,這樣最后面幾個變量自然就是缺失值。當(dāng)被調(diào)查者對多項選擇題中的選項全部選擇時,這些變量中都有一個選項代碼,此時沒有缺失值。
事實上,假如被訪者所選擇的各項選之間不涉及順序問題(如上述例子中,不需要受訪者給出哪種因素最重要,哪種次重要),那么這兩種輸入方法所表達(dá)的數(shù)據(jù)信息是一樣的。但在實際操作中,如果選擇項較多,而被調(diào)查者最多只選擇其中少數(shù)幾項時,采用多重二分法錄入就顯得繁瑣,輸入數(shù)據(jù)時容易出錯。尤其是當(dāng)樣本量增大時,采用多重二分法錄入就大大增加了錄入的工作量,不利于提高工作效率。為此,一般的市場調(diào)查公司大都采用多重分類法的錄入方式。
二、兩種數(shù)據(jù)錄入格式的轉(zhuǎn)換
實際上,只有多重二分法的錄入方式才是符合統(tǒng)計分析原則的數(shù)據(jù)排列格式,能夠直接進行后續(xù)的統(tǒng)計推斷。多重分類法只是一種簡化紀(jì)錄方式,需要轉(zhuǎn)化為前者后方可進行統(tǒng)計推斷。
采用多重分類法錄入的數(shù)據(jù)如果要轉(zhuǎn)化成虛擬變量(選項為0或1)的形式,以上述公眾宜居標(biāo)準(zhǔn)的選擇為例,可以采用如下操作命令:
COUNT
New_x1=X1 X2 X3 X4 X5 (1).
EXECUTE.
其中New_x1代表受訪者是否選擇“社會安全”該選項。顯然,如果在X1~X5中受訪者選擇了“1”(社會安全)選項,那么New_x1的取值為1,如果在X1~X5中受訪者沒有選擇“1”,那么New_x1的取值為0。以同樣的思路,我們就可以設(shè)置變量New_x2~New_x14了。這樣,通過上述數(shù)據(jù)轉(zhuǎn)換,我們就把X1~X5共5個變量轉(zhuǎn)化成了New_x1~New_x14共14個虛擬變量了。
三、多重應(yīng)答數(shù)據(jù)交叉分析
(一)多重應(yīng)答卡方檢驗
在SPSS操作中,多重應(yīng)答變量通過定義變量集之后就可以直接與其他變量進行交叉分析了。這種操作方法使用方便,但是其缺陷是在SPSS操作界面上無法直接實現(xiàn)卡方檢驗。為此,本文介紹一種進行卡方檢驗的間接方法。
解決方法與操作:
第一步:根據(jù)需要做出一個有多重應(yīng)答問題的交叉表,如表1
表 1 多重應(yīng)答交叉表
![]() |
第二步:構(gòu)成一個與第一步中結(jié)構(gòu)相同的頻數(shù)全部為“1”的交叉表??梢酝ㄟ^如下操作實現(xiàn)。
在SPSS中,新增加兩個變量。
變量I的構(gòu)成方式:從1到6,重復(fù)3次;
變量II的構(gòu)成方式:1重復(fù)6次,2重復(fù)6次,3重復(fù)6次。
第三步:按照第一步產(chǎn)生的交叉表內(nèi)的頻數(shù),構(gòu)造變量III。以變量III為權(quán)重,對應(yīng)交叉表中每個組成元素的位置進行加權(quán)。
最后的結(jié)果如下圖:
圖 1 生成三個變量
![]() |
第四步:最后就可以利用加權(quán)后的數(shù)據(jù),直接選擇SPSS中的“Descriptive Statistics”中的“Crosstabs”命令直接進行交叉分析和卡方檢驗了。
(二)多重應(yīng)答數(shù)據(jù)多元交叉比較法
使用上述檢驗方法操作相對比較復(fù)雜,且不能比較具體的每一個選項與其他變量的檢驗情況。為此,我們也可以將轉(zhuǎn)化后的每一個“虛擬變量”與其他變量(如性別)直接進行卡方檢驗。
比如在上述“宜居標(biāo)準(zhǔn)”這個例子中,我們把代表不同宜居標(biāo)準(zhǔn)的New_x1~New_x14共14個虛擬變量與“性別”、“戶口”、“收入”和“年齡”進行交叉列聯(lián)分析和卡方顯著性檢驗,為了使檢驗結(jié)果具有可比較性,我們把這4個背景變量都設(shè)置為只有兩項取值(如收入分為低收入和高收入,年齡分為18~35歲和35歲以上,戶口情況分為本地戶口和外地戶口),這樣做出的交叉分析就具有共同的自由度(df=1),可以對各自的卡方值的大小進行比較。檢驗結(jié)果顯示,城市不同性別、不同收入、不同戶口的市民存在顯著差異的宜居因素兼為2個;但是城市不同年齡段人群認(rèn)為的宜居因素卻有5個存在顯著性差異。由此可見,不同年齡段的人群在對宜居的標(biāo)準(zhǔn)判斷上存在更大的多元化傾向。在建設(shè)宜居城市時,為了盡量滿足各類群體的需求,可以從先滿足不同年齡段市民的宜居需求著手。
表 2 不同類別群體的宜居因素差異比較
![]() |
注:▲表示該宜居因素在對應(yīng)的類別群體中存在顯著性差異P<0.05
因子分析是利用降維的思想,由研究原始變量相關(guān)矩陣內(nèi)部的依賴關(guān)系出發(fā),把一些具有錯綜復(fù)雜關(guān)系的變量歸結(jié)為少數(shù)幾個綜合因子的一種多變量統(tǒng)計分析方法。因子分析的思想始于1904年查爾斯?斯皮爾曼(Charles Spearman)對學(xué)生成績的研究,近年來,隨著電子計算機的發(fā)展,人們將因子分析的理論成功地應(yīng)用于市場研究領(lǐng)域。
例如,某年我們對982名跨國企業(yè)經(jīng)理人和普通員工進行了一項調(diào)查,其中有一題我們讓受訪者選出他們認(rèn)為的中資跨國企業(yè)與外資跨國企業(yè)相比,在發(fā)展中最急需解決的三項問題是什么,并按重要性排序。
1.資金2.人才3.新制度4.信息5.相關(guān)政策6.知識與技術(shù)
請排序:第一重要問題_____;第二重要問題_____;第三重要問題_____。
面對上述問題,簡單的頻數(shù)分析顯然不能綜合地反映問題。而因子分析法不僅可以進行綜合分析,發(fā)現(xiàn)公因子,而且還可以得到更多的信息。
對上述的選項按三級李克特量表進行處理:凡是選為第一重要因素的賦予10分,選為第二重要因素的賦予7分,選為第三重要因素的賦予4分,沒有被選中的因素都設(shè)為0分,新設(shè)置6個變量(問題的選項有6項),將每個人的回答情況由原來3個變量轉(zhuǎn)換為資金、人才、新制度、信息、相關(guān)政策、知識與技術(shù)6個變量。具體轉(zhuǎn)換方法如表3。
表 3 變量的轉(zhuǎn)換
![]() |
然后對新生成的6個變量進行因子分析,分析結(jié)果顯示,前4個因子的方差貢獻率達(dá)到了87.6%。具體結(jié)果顯示如下:
表 4 旋轉(zhuǎn)后各選項在所提取公因子中的負(fù)荷系數(shù)
![]() |
從表中可以看出第一個公因子是資金與新制度;第二個公因子是人才和知識與技術(shù);第三個公因子是相關(guān)政策;第四個公因子是信息。這說明中國的跨國企業(yè)在發(fā)展中最急需解決的問題是資金與新制度,其次是人才和知識與技術(shù),再次是相關(guān)政策、信息。該分析結(jié)果與頻數(shù)分析基本一致。并且從因子分析中我們還可得到更多的相關(guān)信息。如第一公因子為資金與新制度,但是兩個變量的因子載荷符合是相反的,這說明越是關(guān)心“資金”的人,越不重視制度創(chuàng)新;其次,信息這一選項被排在最后,從一個側(cè)面說明中資跨國企業(yè)與外資跨國企業(yè)相比還處于粗放發(fā)展階段,更需要資金、人才和技術(shù)支持,信息的功能尚未有效發(fā)揮。 |
五、多重應(yīng)答數(shù)據(jù)Logistic回歸分析
為了了解不同人群的應(yīng)答特征,可以將多重應(yīng)答情況作為因變量,相應(yīng)的人群特征變量作為影響因素。由于所有選項均為選中或不選中兩種取值,因此所有的因變量均為二分類,即建立多元Logistic模型。
Logistic回歸方程的基本形式為:
![]() |
其中,p為事件發(fā)生率,xi為影響因素,bi為影響系數(shù),a為常數(shù)項。
下面我們以一個具體的例子來說明。
問題【針對企業(yè)家提問】:下面我將讀出一些對企業(yè)家的形象描述,請告訴我其中哪些是您個人期望塑造的企業(yè)家形象?【可多選】
選項:
![]() |
因篇幅所限,這里僅對“關(guān)心公益事業(yè)的”這一選項的影響因素加以分解。
在該Logistic模型中,因變量為在多項選擇中是否選擇了“關(guān)心公益事業(yè)”這一選項,選了的賦值為1,沒有選的賦值為0。
自變量中的離散變量經(jīng)過虛擬變量處理。性別以女性為參照類,戶口類型以農(nóng)村戶口為參照類,婚姻狀況以未婚為參照類,文化程度以本科及以上為參照類。另外,從分布來看,個人年收入嚴(yán)重偏態(tài)分布,故取自然對數(shù),使之整體服從正態(tài)分布。
自變量中,我們還設(shè)計了“后物質(zhì)主義傾向”這一變量。物質(zhì)主義和后物質(zhì)主義是關(guān)于價值觀的一對概念,傳統(tǒng)的強調(diào)經(jīng)濟增長和物質(zhì)安全的價值觀為物質(zhì)主義,而新流行的強調(diào)自由、精神生活和生活質(zhì)量的價值觀為后物質(zhì)主義。我們以“您是否關(guān)注當(dāng)前的環(huán)境保護問題”來測量企業(yè)家的后物質(zhì)主義傾向。因為環(huán)保問題是目前的熱門話題,與企業(yè)家的利他主義、社會責(zé)任等后現(xiàn)代意識密切相關(guān)。該變量以“不太關(guān)注”為參照組。
表 5 Logistic 回歸結(jié)果:是否選擇“關(guān)心公益事業(yè)的”
![]() |
Logistic回歸統(tǒng)計結(jié)果表明,假設(shè)模型整體檢驗十分顯著(卡方值為239.016,p=0.0001)。除婚姻狀況、后物質(zhì)主義中的“比較關(guān)注”以及部分受教育程度對因變量的影響不顯著外,其他因素均顯著。總的來說,女性企業(yè)家比男性企業(yè)家更喜歡呈現(xiàn)出“關(guān)注公益事業(yè)”的形象;城市企業(yè)家比農(nóng)村企業(yè)家更傾向于呈現(xiàn)出“關(guān)注公益事業(yè)”的形象;收入越高、學(xué)歷越高、后物質(zhì)主義傾向越強的企業(yè)家更希望呈現(xiàn)“關(guān)注公益事業(yè)”的形象。
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動決策的時代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計的實用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動決策的時代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點,而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報考到取證的全攻略? 在數(shù)字經(jīng)濟蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗:捕捉數(shù)據(jù)背后的時間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗:數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨特的門控機制,在 ...
2025-07-07統(tǒng)計學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動態(tài)、了解消費者需求的重要途徑,而統(tǒng)計學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03