99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁(yè)精彩閱讀SAS數(shù)據(jù)分析完整筆記_數(shù)據(jù)分析師?
SAS數(shù)據(jù)分析完整筆記_數(shù)據(jù)分析師?
2014-11-15
收藏


SAS數(shù)據(jù)分析完整筆記_數(shù)據(jù)分析師



1.        SAS INSIGHT啟動(dòng):

方法1:Solution→Analysis→Interactive Date Analysis

方法2:在命令欄內(nèi)輸入insight

方法3:程序編輯窗口輸入以下代碼,然后單擊 Submit按鈕;

Proc insight;

Run;

1.1 一維數(shù)據(jù)分析

用 sas insight做直方圖、盒形圖、馬賽克圖。

直方圖:Analysis→Histogram/Bar Chart

盒形圖:Analysis→Box plot

馬賽克圖:Analysis→Box plot/Mosaic plot(Y)

1.2 二維數(shù)據(jù)分析

散點(diǎn)圖:Analysis→Scattery plot(Y X)

曲線圖:Analysis→Line plot( Y X)

1.3 三維數(shù)據(jù)分析

旋轉(zhuǎn)圖:Analysis→Rotationg Plot

曲面圖:Analysis→Rotationg Plot  設(shè)置 Fit Surface

等高線圖:Analysis→Countor plot

1.4 分布分析

包括:直方圖、盒形圖、各階矩、分位數(shù)表,直方圖擬合密度曲線,對(duì)特定分布進(jìn)行檢驗(yàn)。

1.4.   1  Analysis→Distribution(Y)

第一部分為盒形圖,第二部分為直方圖,第三部分為各階矩,第四部分為分位數(shù)表。

1.4.2  添加密度估計(jì)

A:參數(shù)估計(jì):給出各種已知分布(正態(tài),指數(shù)等),只需要對(duì)其中參數(shù)進(jìn)行估計(jì);

Curves→Parametric Density

B:核估計(jì):對(duì)密度函數(shù)沒(méi)有做假設(shè),曲線性狀完全依賴(lài)于數(shù)據(jù);

Curves→Kernel Density

1.4.3 分布檢驗(yàn)

Curves→CDF confidence band

Curves→Test for Distribution

1.5 曲線擬合

Analysis→Fit(Y X):分析兩個(gè)變量之間的關(guān)系

1.6 多變量回歸

Analysis→Fit(Y X)

1.7 方差分析

Analysis→Fit(Y X)

1.8 相關(guān)系數(shù)計(jì)算

Analysis→Multivariate

1.9 主成分分析

Analysis→Multivariate

2.SAS ANALYST啟動(dòng):

方法1:Solution→Analysis→Analyst

方法2:在命令欄內(nèi)輸入analyst

2.1 分類(lèi)計(jì)算統(tǒng)計(jì)量:Data→Summarize by group

2.2 隨機(jī)抽樣:Data→Random Sample

2.3 生成報(bào)表:Report→Tables

2.4 變量計(jì)算:Date→Transform

2.5 繪制統(tǒng)計(jì)圖

2.5.1 條形圖:Graph→Bar Chart→Horizontal

2.5.2 餅圖:Graph→Pie Chart

2.5.3 直方圖:Graph→Histogram

2.5.4 概率圖:Graph→Probality plot

2.5.5 散點(diǎn)圖:Graph→Scatter plot

2.6 統(tǒng)計(jì)分析與計(jì)算

2.6.1 計(jì)算描述性統(tǒng)計(jì)量

Statistics →Descriptive→Summart Statistics 只計(jì)算簡(jiǎn)單統(tǒng)計(jì)量

Statistics →Descriptive→Distribution 可計(jì)算一個(gè)變量的分布信息

Statistics →Descriptive→Correlations可計(jì)算變量之間的相關(guān)關(guān)系

Statistics →Descriptive→Frequency counts 可計(jì)算頻數(shù)

2.6.2 列聯(lián)表分析

Statistics →Table Analysis

2.7假設(shè)檢驗(yàn)

2.7.1單樣本均值Z檢驗(yàn): 檢驗(yàn)單樣本均值與某個(gè)給定的數(shù)值之間的關(guān)系

Statistics →Hypothesis tests  →One-Sample Z-test for a mean

2.7.2單樣本均值t檢驗(yàn):適用于不了解變量的方差情形

推斷該樣本來(lái)自的總體均數(shù)μ與已知的某一總體均屬μ0是否相等

Statistics →Hypothesis tests → One-Sample t-test for a mean

2.7.3單樣本比例檢驗(yàn):檢驗(yàn)取離散值的變量取某個(gè)值的比例

Statistics →Hypothesis tests →One-Sample test for a proportion

2.7.4單樣本方差檢驗(yàn):檢驗(yàn)樣本方差是否等于給定的值。零假設(shè)方差等于某個(gè)給定的。

Statistics →Hypothesis tests→One-Sample test for a variance

2.7.5兩樣本均值t檢驗(yàn):獨(dú)立的兩個(gè)總體的均值是否相等或者是否相差給定的值

Statistics →Hypothesis tests →Two-Sample t-test for means

2.7.6成對(duì)樣本均值t檢驗(yàn):成對(duì)樣本檢驗(yàn)中總體是相關(guān)的。

Statistics →Hypothesis tests →Two-Sample paired t-test for means

2.7.7兩樣本比例檢驗(yàn):檢驗(yàn)兩個(gè)總體中某個(gè)比例的值是否相等。

Statistics →Hypothesis tests →Two-Sample test for proportions

2.7.8兩樣本方差檢驗(yàn)

Statistics →Hypothesis tests→Two Sample test for variance

2.8ANOVA過(guò)程

2.8.1單因素ANOVA過(guò)程

Statistics →ANOVA→One-Way Anova

2.8.2非參數(shù)的單因素方差分析:適用于正態(tài)分布假定或方差相等假設(shè)不能滿足的單因素問(wèn)題

Statistics →ANOVA→nonparameter one-way Anova test

Wilcoxon法、Median法、Van der Waerden法、Savage法。

2.8.2因素方差分析:實(shí)驗(yàn)結(jié)果是連續(xù)數(shù)值而分類(lèi)變量是兩個(gè)以上的離散型數(shù)值。

Statistics →ANOVA→Factorial Anova

2.8.3線性模型:用最小二乘法擬合一般線性模型

Statistics →ANOVA→Linear Model

2.9回歸分析:Statistics →Regression

2.9.1simple回歸:簡(jiǎn)單一類(lèi)回歸分析,單一的自變量,單一的因變量,模型可以是一次、二次、三次。

Statistics →Regression→simple

2.9.2linear回歸:線性回歸,回歸模型可以有多個(gè)因變量,多個(gè)自變量,但是對(duì)因變量分別進(jìn)行回歸

Statistics →Regression→linear

2.9.3logistic回歸:用于解決因變量是一個(gè)二元變量

Statistics →Regression→logistic

 

3.報(bào)表以及圖形輸出

3.1 print過(guò)程

Proc print data = sasuser.score;     //數(shù)據(jù)庫(kù).數(shù)據(jù)集

Run;

Proc print data = sasuser.score;

Var name math Chinese;               //變量

Run;

Proc print data = sasuser.score  noobs;    //去掉第一列(觀測(cè)序號(hào))

Var name math Chinese;

Run;

Proc  print  data= sasuser.score;

Where sex in(‘f’);                       //通過(guò)where語(yǔ)句

Run;

Proc print data = sasuser.score noobs label;

Title ‘女生成績(jī)單’;

Label name =‘姓名’

      Sex =‘性別’

      Math = ‘?dāng)?shù)學(xué)’

      Chinese = ‘語(yǔ)文’

      English =  ‘英語(yǔ)’;

Where sex in(‘f’);

Run;

Title “the sas system”;  //恢復(fù)系統(tǒng)標(biāo)題

Proc  print  data = sasuser.score;

Footnote = ‘分?jǐn)?shù)列表’;     //加分?jǐn)?shù)列表的腳注

Run;

Proc sort  data = sasuser.score;

By  sex;

Run;

Proc  print  data = sasuser.score;     //使用by分組輸出前用sort排序

By sex;

Run;

Proc  print  data = sasuser.score;

Sum math;

Run;

3.2 tabulate過(guò)程

Proc tabulate data =數(shù)據(jù)集名稱(chēng);

Class 分類(lèi)變量;

Var 分析變量;

Table 頁(yè)面說(shuō)明 行維說(shuō)明 列維說(shuō)明/選項(xiàng);

Run;

3.3 sort過(guò)程

Proc sort data = 數(shù)據(jù)集名稱(chēng);   //默認(rèn)升序排列

  By 變量名;

Run;

Proc sort data = 數(shù)據(jù)集名稱(chēng);  

  By   descending  變量名;   //降序排列

Run;

3.4  means過(guò)程:數(shù)量(N)、均值(Mean)、標(biāo)準(zhǔn)差(Std Dev)、最大值(Maximum)、最小值(Minimum)

Proc means  data = sasuser.stock;

 Var  price;

Run;

3.5 univariate過(guò)程

Proc univariate data =數(shù)據(jù)集;

Var 分析變量;

Run;

結(jié)果:

Moments:統(tǒng)計(jì)量的各階矩,例如一階矩就是均值,二階矩就是方差等;

Basic Statistical Measures:基本統(tǒng)計(jì)量;

Tests for location:檢驗(yàn)均值是否為零;

Quantiles:分位數(shù)表;

Extreme Observations:極端觀測(cè)值。

3.6 freq過(guò)程:離散變量的分布情況

Proc freq data =數(shù)據(jù)集名;

Tables  變量名;

Run;

結(jié)果:

變量取值、頻數(shù)、百分比、累計(jì)頻數(shù)、;累計(jì)百分比

3.7 corr過(guò)程:相關(guān)系數(shù)

Proc corr data =數(shù)據(jù)集;

Var 變量名  變量名;

Run;

結(jié)果:

簡(jiǎn)單統(tǒng)計(jì)量

相關(guān)系數(shù)及p值

3.8 gplot過(guò)程:繪制散點(diǎn)圖和曲線圖,繪制回歸曲線。

Proc gplot  data = 數(shù)據(jù)集名稱(chēng);

Symbol 曲線類(lèi)型;

Plot 豎軸變量*橫軸變量;

Run;

 

Proc gplot data = sasuser.score;

Symbol I = none  v=star;

Plot English*Chinese;

Run;

 

3.9  gchart過(guò)程:繪制直方圖、餅圖、三維直方圖等。

Proc gchart data = 數(shù)據(jù)集名稱(chēng);

Vbar/pie/block =變量;

Run;

3.10 G3D過(guò)程繪制三維曲面

Proc g3d data =數(shù)據(jù)集;

Plot 變量x*變量y=變量z;

Run;

gcontour過(guò)程:畫(huà)出曲面的等高線

Proc gcontour data =數(shù)據(jù)集名;

Plot x*y=z;

Run;

 

4.基本統(tǒng)計(jì)分析

4.1正態(tài)性檢驗(yàn):univariate過(guò)程

Proc univariate data= sasuser.stock normal;

Var  eps;

Run;

Proc univariate data= sasuser.stock normal;

Var  eps;

Histogram eps;                  //畫(huà)出直方圖

Probplot eps;                   //畫(huà)出概率分布圖

Run;

4.2單變量均值檢驗(yàn)

4.2.1如果一個(gè)變量服從正態(tài)分布,那么可以用t檢驗(yàn)來(lái)對(duì)變量進(jìn)行均值檢驗(yàn)

Proc ttest data =數(shù)據(jù)集  ho = 均值;

Var 檢驗(yàn)變量;

Run;

4.2.2t檢驗(yàn)還可以檢驗(yàn)方差相同的兩個(gè)獨(dú)立樣本均值是否相等

Proc ttest data =數(shù)據(jù)集;

Class 分類(lèi)變量;

Var 檢驗(yàn)變量;

Run;

結(jié)果

第一部分簡(jiǎn)單統(tǒng)計(jì)量

第二部分t檢驗(yàn)結(jié)果

第三部分兩者方差是否相等檢驗(yàn)

T檢驗(yàn)要求兩個(gè)獨(dú)立樣本都必須服從正態(tài)分布,如果不服從正態(tài)分布,則無(wú)法進(jìn)行t檢驗(yàn)。這時(shí)可用非參數(shù)的方法,常用的非參數(shù)方法是NPAR1WAY過(guò)程,它是 noparameter 1 way縮寫(xiě)。

4.3成對(duì)總體均值檢驗(yàn)

4.4回歸分析:reg(回歸)過(guò)程、rsreg(二次響應(yīng)面回歸)過(guò)程、orthoreg(病態(tài)數(shù)據(jù)回歸)過(guò)程、nlin(非線性回歸)過(guò)程、transreg(變換回歸)過(guò)程、calis(線性結(jié)果方程和路徑分析)過(guò)程、glm(一般線性回歸)過(guò)程、genmod(廣義線性回歸)過(guò)程

4.4.1 REG過(guò)程

Proc reg data = 輸入數(shù)據(jù)集 選項(xiàng);

Var 變量列表;

Model 因變量 = 自變量列表;

Print 輸出結(jié)果;

Plot 診斷圖形;

Run;

4.4.2 nlin過(guò)程

指明模型的表達(dá)式并給定系數(shù)初值

4.4.3glm過(guò)程:使用最小二乘法回歸線性模型,還可以進(jìn)行回歸,分差,協(xié)方差,多變量方差、偏相關(guān)系數(shù)分析(文章來(lái)自:CDA數(shù)據(jù)分析師培訓(xùn)官網(wǎng)

4.5方差分析

4.5.1單因素方差分析

Proc anova data =數(shù)據(jù)集名稱(chēng);

Class 因素;

Model 實(shí)驗(yàn)結(jié)果 =因素;

Run;

Proc anova data =數(shù)據(jù)集名稱(chēng);

Class 因素;

Model 實(shí)驗(yàn)結(jié)果 =因素;

Means  brand;

Run;

Proc anova data =數(shù)據(jù)集名稱(chēng);

Class 因素;

Model 實(shí)驗(yàn)結(jié)果 =因素;

Means  brand/t;       //t檢驗(yàn)

Run;

Proc anova data =數(shù)據(jù)集名稱(chēng);

Class 因素;

Model 實(shí)驗(yàn)結(jié)果 =因素;

Means  brand/bon;       //bonferroni t檢驗(yàn)   控制第一類(lèi)錯(cuò)誤的概率,但是具有較大第二類(lèi)錯(cuò)誤概率

Run;

Proc anova data =數(shù)據(jù)集名稱(chēng);

Class 因素;

Model 實(shí)驗(yàn)結(jié)果 =因素;

Means  brand/regwq;       //regwq檢驗(yàn)   控制第一類(lèi)錯(cuò)誤的概率

Run;

Proc anova data =數(shù)據(jù)集名稱(chēng);

Class 因素;

Model 實(shí)驗(yàn)結(jié)果 =因素;

Means  brand/tukey;       //tukey檢驗(yàn)   控制第一類(lèi)錯(cuò)誤的概率,但是第二類(lèi)錯(cuò)誤概率通常高于regwq檢驗(yàn)

Run;

4.5.2多因素方差分析

4.5.3列聯(lián)表檢驗(yàn)

Proc freq data = 數(shù)據(jù)集;

Tables 因素a*因素b / chisq;

Weight 實(shí)驗(yàn)結(jié)果;

Run;

5相關(guān)知識(shí)

因變量—Depender (Y)

自變量—Independent  (X1 X2…)


數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼

若不方便掃碼,搜微信號(hào):CDAshujufenxi

數(shù)據(jù)分析師資訊
更多

OK
客服在線
立即咨詢(xún)
客服在線
立即咨詢(xún)
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機(jī)數(shù)防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調(diào)用 initGeetest 進(jìn)行初始化 // 參數(shù)1:配置參數(shù) // 參數(shù)2:回調(diào),回調(diào)的第一個(gè)參數(shù)驗(yàn)證碼對(duì)象,之后可以使用它調(diào)用相應(yīng)的接口 initGeetest({ // 以下 4 個(gè)配置參數(shù)為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺(tái)檢測(cè)極驗(yàn)服務(wù)器是否宕機(jī) new_captcha: data.new_captcha, // 用于宕機(jī)時(shí)表示是新驗(yàn)證碼的宕機(jī) product: "float", // 產(chǎn)品形式,包括:float,popup width: "280px", https: true // 更多配置參數(shù)說(shuō)明請(qǐng)參見(jiàn):http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計(jì)時(shí)完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請(qǐng)輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請(qǐng)輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }