99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁大數(shù)據(jù)時代SAS編程PROC步——描述性統(tǒng)計量分析_數(shù)據(jù)分析師培訓?
SAS編程PROC步——描述性統(tǒng)計量分析_數(shù)據(jù)分析師培訓?
2015-05-15
收藏

SAS編程PROC步——描述性統(tǒng)計量分析_數(shù)據(jù)分析師培訓



描述性統(tǒng)計指標的計算可以用四個不同的過程來實現(xiàn),它們分別是means過程、summary過程、univariate過程以及tabulate過程。它們在功能范圍和具體的操作方法上存在一定的差別,下面我們大概了解一下它們的異同點。

相同點:他們均可計算出均數(shù)、標準差、方差、標準誤、總和、加權值的總和、最大值、最小值、全距、校正的和未校正的離差平方和、變異系數(shù)、樣本分布位置的t檢驗統(tǒng)計量、遺漏數(shù)據(jù)和有效數(shù)據(jù)個數(shù)等,均可應用by語句將樣本分割為若干個更小的樣本,以便分別進行分析。

不同點:

(1)means過程、summary過程、univariate過程可以計算樣本的偏度(skewness)和峰度(kurtosis),而tabulate過程不計算這些統(tǒng)計量;

(2)univariate過程可以計算出樣本的眾數(shù)(mode),其它三個過程不計算眾數(shù);

(3)summary過程執(zhí)行后不會自動給出分析的結果,須引用output語句和print過程來顯示分析結果,而其它三個過程則會自動顯示分析的結果;

(4)univariate過程具有統(tǒng)計制圖的功能,其它三個過程則沒有;

(5)tabulate過程不產(chǎn)生輸出資料文件(存儲各種輸出數(shù)據(jù)的文件),其它三個均產(chǎn)生輸出資料文件。

  統(tǒng)計制圖的過程均可以實現(xiàn)對樣本分布特征的圖形表示,一般情況下可以使用的有chart過程、plot過程、gchart過程和gplot過程。大家有沒有發(fā)現(xiàn)前兩個和后兩個只有一個字母‘g’(代表graph)的差別,其實它們之間(只差一個字母g的過程之間)的統(tǒng)計描述功能是相同的,區(qū)別僅在于繪制出的圖形的復雜和美觀程度。

chart過程和plot過程繪制的圖形類似于我們用文本字符堆積起來的圖形,只能概括地反映出資料分布的大體形狀,實際上這兩個過程繪制的圖形并不能稱之為圖形,因為他根本就沒有涉及一般意義上圖形的任何一種元素(如顏色、分辨率等)。而gchart過程和gplot過程給出的是真正意義上的圖形,可以用很多的語句和選項來控制圖形的各方面的性質(zhì)和特征。

chart和gchart與plot和gplot的區(qū)別則體現(xiàn)在不同的作圖功能,前兩個過程可以繪制出的圖形主要有條形圖(包括橫條和豎條)、圓圖、環(huán)形圖和星形圖等,后兩個過程通常用一個記錄中的兩個變量值表示點的坐標來繪制圖形,如散點圖和線圖等。

描述性統(tǒng)計過程的一般格式

 1. means過程的一般格式

proc means 選項列表;

by 變量名稱(分組變量);

class 變量名稱(分組變量);

freq變量名稱(數(shù)值變量,用以表示相應記錄出現(xiàn)的頻數(shù))

weight變量名稱(數(shù)值變量,用以表示相應記錄的權重系數(shù))

 var 變量名稱(待分析的數(shù)值變量);

run;

Proc means 語句后的選項主要用來指定所要計算的統(tǒng)計量,默認情況下,Means過程會給出頻數(shù)、均數(shù)、標準差、最大值和最小值等,其余統(tǒng)計量的計算均需要在選項中指定。class語句所指定的分組變量用來進行分組,而by語句所指定的分組變量是用來將數(shù)據(jù)分為若干個更小的樣本,以便SAS分別在各小樣本內(nèi)進行各自獨立的處理。freq語句和weight語句分別引導代表記錄出現(xiàn)頻數(shù)和權重系數(shù)的數(shù)值變量。var語句引導所要進行分析的所有變量的列表,SAS將對var語句所引導的所有變量分別進行描述性統(tǒng)計分析

2. summary過程的一般格式

proc summary 選項列表;

 by 變量名稱(分組變量);

 class 變量名稱(分組變量);

 freq變量名稱(數(shù)值變量,用以表示相應記錄出現(xiàn)的頻數(shù))

 weight變量名稱(數(shù)值變量,用以表示相應記錄的權重系數(shù))

 output <統(tǒng)計量關鍵字=自定義變量名>

 var 變量名稱(待分析的數(shù)值變量);

run;

summary過程的格式和means過程可以說是完全相同的,各條語句和選項的含義也是相同的,包括在means過程中未列出的output語句也可以應用于means過程,只是此語句在summary過程應用較多(這樣才能將分析結果顯示出來),所以才將其列入一般格式中。output語句用來對分析結果輸出為數(shù)據(jù)文件進行控制,其后的選項可有可無,若無則SAS按照默認方式進行。“out=數(shù)據(jù)集名”用來定義輸出數(shù)據(jù)文件的文件名稱,文件名的格式和數(shù)據(jù)步中數(shù)據(jù)文件名相同?!敖y(tǒng)計量關鍵字=自定義變量名”用來自定義輸出數(shù)據(jù)文件中各種統(tǒng)計量的變量名稱,前者是系統(tǒng)定義的(和proc語句后選項中的統(tǒng)計量關鍵字完全相同),必須正確無誤,后者可自行定義。默認狀態(tài)下輸出統(tǒng)計量只有頻數(shù)、均數(shù)、標準差、最大值和最小值,在默認狀態(tài)不能滿足需要時這一選項則是必需的。

3. univariate過程的一般格式

proc univariate 選項列表;

 by 變量名稱(分組變量);

 class 變量名稱(分組變量);

 freq變量名稱(數(shù)值變量,用以表示相應記錄出現(xiàn)的頻數(shù))

 weight變量名稱(數(shù)值變量,用以表示相應記錄的權重系數(shù))

 histogram 變量名稱/選項列表

 output <統(tǒng)計量關鍵字=自定義變量名>

pctlpts=<百分位數(shù)…> <指定需要的百分位數(shù)>

pctlpre=<新變量名列> <指定所需百分位數(shù)對應的輸出變量名>

 var 變量名稱(待分析的數(shù)值變量);

run;

univariate過程和以上兩個過程的格式非常相似,相同的語句和選項其含義也相同,所不同的是某些統(tǒng)計量只能在univariate過程中計算(如眾數(shù)),以及univariate過程中所具有的繪圖功能。histogram語句即用來指示SAS對其后所指定的變量繪制直方圖,其后的選項用來指示SAS添加不同類型的擬合圖形(如正態(tài)分布的分布密度曲線)。

  4. tabulate過程的一般格式

proc tabulate 選項列表;

 by 變量名稱(分組變量);

 class 變量名稱(分組變量);

 freq變量名稱(數(shù)值變量,用以表示相應記錄出現(xiàn)的頻數(shù))

 weight變量名稱(數(shù)值變量,用以表示相應記錄的權重系數(shù))

 table <<頁變量表達式>,<行變量表達式>,<列變量表達式>>

 var 變量名稱(待分析的數(shù)值變量,統(tǒng)計量列入相應的表單元格);

run;

tabulate過程和上述幾個過程的格式也基本相似,相同的語句和選項也代表相同的含義。最大的不同也是tabulate過程中最為重要的是table語句,他用來定義表格的具體格式以及表格中所要包括的統(tǒng)計量。

5. gchart過程的一般格式

proc gchart 選項列表;

 圖形關鍵詞變量名稱/選項列表

run;

 

圖形關鍵字

繪制的圖形類型

block

方塊圖

hbar

水平的條形圖

hbar3d

水平的三維條形圖

vbar

豎立的條形圖

vbar3d

豎立的三維條形圖

pie

圓圖

pie3d

三維圓圖

donut

環(huán)形圖

star

星形圖

 

此過程格式簡單,復雜的地方在于圖形關鍵字(每個圖形關鍵字對應一種圖形類型)所引導的語句,這里是控制圖形類型及圖形要素的地方,涉及到眾多的關鍵字和選項。gchart過程可以使用的圖形關鍵字及其所繪制的圖形類型見下表(表2.1)。

  表2.1gchart過程可以使用的圖形關鍵字及其所繪制的圖形類型

圖形關鍵字后的變量名用以指定進行圖形描述時的分組變量,可以是數(shù)值型的(此時以各組的組中值為分組的標志),也可以是字符型的。其后的選項比較重要的有:(1)type=統(tǒng)計量關鍵字,表示以圖形對變量(sumvar所指定的變量)的哪一種統(tǒng)計量進行描述,比如頻數(shù)(freq)、均數(shù)(mean)、總計(sum)、頻數(shù)百分比(pctn)等;(2)subgroup=變量名(分組變量),指定要進行分組(各組段內(nèi)再分組)的變量;(3)sumvar=變量名(數(shù)值變量),指定要進行統(tǒng)計計算的變量,也就是“type=統(tǒng)計量關鍵字”選項中統(tǒng)計量的計算所依據(jù)的變量。其它的選項較少用到或系統(tǒng)默認值即可基本滿足要求,這里還是少羅嗦,以后用到再說。

  6. gplot過程的一般格式

proc gplot 選項列表;

 bubble 散點圖表達式

 bubble2 散點圖表達式

 plot散點圖表達式

 plot2散點圖表達式

run;

  從gplot過程的一般格式中我們就可看出,此過程只能繪制兩種類型的圖形,bubble語句指示SAS繪制泡狀散點圖,plot語句指示SAS繪制點狀散點圖。bubble2語句和plot2語句指示SAS在同一區(qū)域內(nèi)(bubble2和bubble在同一區(qū)域,plot2和plot在同一區(qū)域)繪制第二個圖形,兩者的橫坐標相同(同一變量),縱坐標分別位于左右兩側(可以是同一變量,也可以是兩個不同的變量)。

  7. 散點圖表達式的一般形式為:

  (1)bubble和bubble2語句:縱坐標變量名*橫坐標變量名=泡尺寸變量名(變量值以泡的大小表示),三者均應為數(shù)值變量;

 ?。?)plot和plot2語句:縱坐標變量名*橫坐標變量名<=n/分類變量名>,此處等號及其后的部分可以省略,此時SAS以默認的散點類型繪制散點圖;若等號后為n(n為正整數(shù),是散點類型的編號),SAS則以指定的編號對應的散點類型繪制散點圖;若等號后為分類變量名(可為字符型或數(shù)值型,為數(shù)值型時作為離散型變量處理,每一個值將被當作一個類別),此變量的具體值(或與每個具體值對應的圖形)將被作為散點用來繪制散點圖

chart過程和plot過程的一般格式及各選項使用方法分別與gchart過程和gplot過程是基本相同的,不同之處僅在于后兩者中涉及到有關三維和圖形元素(顏色等)的語句和選項在前兩者中是無效的。例如vbar3d語句在chart過程中無效,bubble語句在plot過程中無效。其余的語句和選項使用方法完全相同,所以在掌握了gchart過程和gplot過程后,chart過程和plot過程你會不學自通。
描述性統(tǒng)計關鍵字及其含義

SAS中可計算的描述性統(tǒng)計量多達二十余種,大部分可在以上介紹的前四個過程中計算,個別統(tǒng)計量在某些過程中不能計算,大家需要注意,要不然系統(tǒng)顯示錯誤信息時還不知道是怎么回事。

  我經(jīng)常遇到這種情況,系統(tǒng)提示錯誤(此類提示信息顯示在log窗口中)時總是摸不著頭腦,費半天勁才能搞明白。沒辦法,摸著石頭過河嘛!不過這樣也并非一無是處,最起碼可以積累很多使用經(jīng)驗。

  下表(表2.2)列出SAS中可以計算的所有描述性統(tǒng)計量關鍵字及其含義,供大家使用時參考。

表2.2SAS中可以計算的描述性統(tǒng)計量關鍵字及其含義

關鍵字

所代表的含義

n

有效數(shù)據(jù)記錄數(shù)

nmiss

缺失數(shù)據(jù)記錄數(shù)

mean

均數(shù)

std

標準差

stderr

標準誤

var

方差

median

中位數(shù)

mode

眾數(shù)

cv

變異系數(shù)

max

最大值

min

最小值

range

全距

sum

總計

sumwgt

加權值總計

css

校正的離均差平方和

uss

未校正的離均差平方和

clm

可信限(上下界值)

lclm

可信限下側界值

uclm

可信限上側界值

skew(skewness)

偏度

kurt(kurtosis)

峰度

t

分布位置假設檢驗之t統(tǒng)計量

probt

上述t統(tǒng)計量對應的概率值

q1

第一四分位數(shù)

q3

第三四分位數(shù)

qrange

四分位數(shù)間距

p1

第一百分位數(shù)

p5

第五百分位數(shù)

p10

第十百分位數(shù)

p90

第九十百分位數(shù)

p95

第九十五百分位數(shù)

p99

第九十九百分位數(shù)


推薦學習書籍
《CDA一級教材》適合CDA一級考生備考,也適合業(yè)務及數(shù)據(jù)分析崗位的從業(yè)者提升自我。完整電子版已上線CDA網(wǎng)校,累計已有10萬+在讀~

免費加入閱讀:https://edu.cda.cn/goods/show/3151?targetId=5147&preview=0

數(shù)據(jù)分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個參數(shù)驗證碼對象,之后可以使用它調(diào)用相應的接口 initGeetest({ // 以下 4 個配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }