
2、SPSS特性:
3、數(shù)據(jù)的編輯
常量
- 數(shù)值型常量:除了普通寫法外還可以用科學(xué)計(jì)數(shù)法,如:1.3E18;
- 字符型常量:用單引號(hào)或雙引號(hào)括起來如果字符中包含單引號(hào),則必須使用雙引號(hào);
- 日期常量:日期個(gè)數(shù)的數(shù)據(jù),一般需要使用日期函數(shù)進(jìn)行轉(zhuǎn)換;
變量
- 變量名長(zhǎng)度不能超過8;
- 三種基本的類型:數(shù)值、字符和日期;
- 可以在variable view界面設(shè)定變量的長(zhǎng)度及小數(shù)位、變量的描述、變量值的描述、missing值、顯示寬度、對(duì)齊方式和變量的測(cè)度方式;
變量的測(cè)試方式
- Scale:定距變量,如:身高、體重等;
- Ordinal:定序變量,如:教育程度、級(jí)別等;
- Nominal:定類變量,如:性別、民族等;
操作符與表達(dá)式
- 三種基本的運(yùn)算:數(shù)學(xué)、關(guān)系和邏輯
- 數(shù)學(xué)運(yùn)算符:+ – * / ** ()
- 關(guān)系運(yùn)算符:> >= < <= = ~=
- 邏輯運(yùn)算符:&(AND) |(OR) ~(NOT)
- 三種運(yùn)算對(duì)應(yīng)三種表達(dá)式
常用的數(shù)據(jù)操作命令
Data->Sort Cases
Transform->Rank Cases
Transform->Count
Transform->Recode
Transform->Automatic Recode
Transform->Compute
Data->Transpose
Data->Split Files
Data->Merge Files
Compute
- 數(shù)值型:compute num1=value.
- 字符型:String A(a11).compute a=’hello world’.
- 日期型:compute data1=date.mdy(month,day, year).
Rocode
- recode variable name(old value=new value).
- recode variable name(old value=new value) into new variable name.
- 字符型變量使用auto recode
Split file
- 有的時(shí)候需要對(duì)變量做些分組的分析,但一些分析方法并不提供分組變量的設(shè)置選項(xiàng)這就需要用到Split file命令;
- 例如使用 Descriptives 做描述性分析,如果想分年齡做分析,這樣就可以用年齡變量做為分組變量;
- 可以看到這里的Split其實(shí)是分組,而不是拆分文件;
analyze all case分析所有的樣本,不產(chǎn)生分組;
compare groups產(chǎn)生對(duì)比分析組;
output by groups分組輸入分析結(jié)果;
Merge File
- add cases 合并變量相同,但是case不同的文件;
- add variables合并變量不同,case相同的文件這里的變量不同可以是部分的變量不同,case相同也可以是一個(gè)文件的case是另外一個(gè)文件的子集;
數(shù)據(jù)的分類匯總
- 使用Aggregate命令
- 指定分類變量對(duì)觀測(cè)量進(jìn)行分組,對(duì)每組觀測(cè)量的各變量求描述統(tǒng)計(jì)量;
檢查重復(fù)的數(shù)據(jù)
- 使用identify duplicate cases
數(shù)據(jù)的加權(quán)
- 使用weight case
選取一定的case進(jìn)行分析
- 使用select cases:在對(duì)數(shù)據(jù)的子集進(jìn)行分析的時(shí)候需要用到這個(gè)命令;
常用的數(shù)學(xué)函
- 取絕對(duì)值:abs(數(shù)字型表達(dá)式)
- 求余數(shù)函數(shù):mod(數(shù)字型表達(dá)式,模數(shù)),模數(shù)不能為0該函數(shù)在需要對(duì)某一變量求模數(shù)的余數(shù)時(shí)使用,如果對(duì)一個(gè)順序編號(hào)或自然數(shù)序列求模數(shù)的余數(shù),可將該序列按模數(shù)等距分類,從而實(shí)行等距抽樣;
- 四舍五入函數(shù):rnd(數(shù)字型表達(dá)式)
- 開方函數(shù):sqrt(數(shù)字型表達(dá)式)
四、基本的統(tǒng)計(jì)分析
SPSS統(tǒng)計(jì)分析概述:
- 針對(duì)不同類型的數(shù)據(jù)選取不同的分析方法,正確的分析方法是得到正確結(jié)果的關(guān)鍵;
- spss提供數(shù)字分析和圖形分析兩種分析形式;
- 高級(jí)分析之前一般都需要做描述性統(tǒng)計(jì)分析,把握數(shù)據(jù)的規(guī)律對(duì)分析解釋數(shù)據(jù)有很好的引導(dǎo)和幫助作用;
Descriptive Statistics
– Frequencies:頻數(shù)分析
– Descriptives:描述統(tǒng)計(jì)
– Explore:探索分析
– Crosstabs:列聯(lián)表分析
– Ratio:比率分析
Descriptives
– 可以對(duì)變量進(jìn)行標(biāo)準(zhǔn)化;
Explore
– Explore是對(duì)連續(xù)性變量進(jìn)行探索性分析最有效的工具;
– 考察數(shù)據(jù)的奇異性和分布特征;
– 箱盒圖、莖葉圖、正態(tài)檢驗(yàn)圖及方差齊次性檢驗(yàn);
Crosstabs
– 數(shù)據(jù)類型要求為分類變量;
– 二維或多維交叉頻數(shù)表(列聯(lián)表),分析事物(變量)之間的相互影響和關(guān)系;
– 可以做卡方檢驗(yàn),來分析行列變量之間是否存在相關(guān)性;
分類變量統(tǒng)計(jì)描述常用指標(biāo)
– 統(tǒng)計(jì)量:
? 頻數(shù)、頻率、累計(jì)頻數(shù)、累計(jì)頻率、眾數(shù)
? 比:任意兩個(gè)變量之比
性別比,貨物/銷售人員比
構(gòu)成比:部分占總體的比例
? 率:事件的發(fā)生強(qiáng)度
– 圖形:
? 條圖、餅圖
Spss操作
– 單個(gè)變量的分析
? Analyze…Descriptive Statistics…Frequcencies
– 多個(gè)變量的分析
? Analyze…Descriptive Statistics…Crosstabs
– 條圖
? Graph…(interactive…)bar
– 餅圖
? Graph…(interactive…)pie
連續(xù)變量的描述指標(biāo)
– 頻數(shù)表Frequency
? 直觀的方法:分布類型分布特征
– 集中趨勢(shì)Central tendency
? 均數(shù)mean 中位數(shù)median 眾數(shù)mode
– 離散趨勢(shì)Dispersion tendency
? 全距Range
? 方差Variance 標(biāo)準(zhǔn)差std.deviation
如何計(jì)算各個(gè)描述統(tǒng)計(jì)量
– Analyze->Descriptive Statistics->Frequcencies…
– Analyze->Descriptive Statistics->Descriptives…
– Analyze->compare means->means…
? 如何用圖形描述連續(xù)變量
– Graph…Interactive…Histogram
? 如何應(yīng)用Explore對(duì)連續(xù)變量進(jìn)行探索性分析
– Analyze->Descriptive Statistics->Explore…
Basic Tables過程:對(duì)分類/定量資料進(jìn)行各種復(fù)雜格式的描述;
? General Tables過程:在同一張表格內(nèi)同時(shí)對(duì)分類資料、連續(xù)資料和多選題數(shù)據(jù)進(jìn)行匯總功能非常強(qiáng)大,但使用上相對(duì)復(fù)雜;
? Custom Tables過程:含有表格預(yù)覽窗口,并可在制表過程中控制結(jié)果;
? Multiple Response Sets/Tables過程:專門為多選題數(shù)據(jù)設(shè)計(jì)的制表過程;
? Tables of Frequencies過程:在同一張表格中對(duì)多個(gè)分類變量同時(shí)輸出頻數(shù)表;