99999久久久久久亚洲,欧美人与禽猛交狂配,高清日韩av在线影院,一个人在线高清免费观看,啦啦啦在线视频免费观看www

熱線電話:13121318867

登錄
首頁精彩閱讀SAS數據分析完整筆記_數據分析師?
SAS數據分析完整筆記_數據分析師?
2014-11-15
收藏


SAS數據分析完整筆記_數據分析師



1.        SAS INSIGHT啟動:

方法1:Solution→Analysis→Interactive Date Analysis

方法2:在命令欄內輸入insight

方法3:程序編輯窗口輸入以下代碼,然后單擊 Submit按鈕;

Proc insight;

Run;

1.1 一維數據分析

用 sas insight做直方圖、盒形圖、馬賽克圖。

直方圖:Analysis→Histogram/Bar Chart

盒形圖:Analysis→Box plot

馬賽克圖:Analysis→Box plot/Mosaic plot(Y)

1.2 二維數據分析

散點圖:Analysis→Scattery plot(Y X)

曲線圖:Analysis→Line plot( Y X)

1.3 三維數據分析

旋轉圖:Analysis→Rotationg Plot

曲面圖:Analysis→Rotationg Plot  設置 Fit Surface

等高線圖:Analysis→Countor plot

1.4 分布分析

包括:直方圖、盒形圖、各階矩、分位數表,直方圖擬合密度曲線,對特定分布進行檢驗。

1.4.   1  Analysis→Distribution(Y)

第一部分為盒形圖,第二部分為直方圖,第三部分為各階矩,第四部分為分位數表。

1.4.2  添加密度估計

A:參數估計:給出各種已知分布(正態(tài),指數等),只需要對其中參數進行估計;

Curves→Parametric Density

B:核估計:對密度函數沒有做假設,曲線性狀完全依賴于數據;

Curves→Kernel Density

1.4.3 分布檢驗

Curves→CDF confidence band

Curves→Test for Distribution

1.5 曲線擬合

Analysis→Fit(Y X):分析兩個變量之間的關系

1.6 多變量回歸

Analysis→Fit(Y X)

1.7 方差分析

Analysis→Fit(Y X)

1.8 相關系數計算

Analysis→Multivariate

1.9 主成分分析

Analysis→Multivariate

2.SAS ANALYST啟動:

方法1:Solution→Analysis→Analyst

方法2:在命令欄內輸入analyst

2.1 分類計算統(tǒng)計量:Data→Summarize by group

2.2 隨機抽樣:Data→Random Sample

2.3 生成報表:Report→Tables

2.4 變量計算:Date→Transform

2.5 繪制統(tǒng)計圖

2.5.1 條形圖:Graph→Bar Chart→Horizontal

2.5.2 餅圖:Graph→Pie Chart

2.5.3 直方圖:Graph→Histogram

2.5.4 概率圖:Graph→Probality plot

2.5.5 散點圖:Graph→Scatter plot

2.6 統(tǒng)計分析與計算

2.6.1 計算描述性統(tǒng)計量

Statistics →Descriptive→Summart Statistics 只計算簡單統(tǒng)計量

Statistics →Descriptive→Distribution 可計算一個變量的分布信息

Statistics →Descriptive→Correlations可計算變量之間的相關關系

Statistics →Descriptive→Frequency counts 可計算頻數

2.6.2 列聯(lián)表分析

Statistics →Table Analysis

2.7假設檢驗

2.7.1單樣本均值Z檢驗: 檢驗單樣本均值與某個給定的數值之間的關系

Statistics →Hypothesis tests  →One-Sample Z-test for a mean

2.7.2單樣本均值t檢驗:適用于不了解變量的方差情形

推斷該樣本來自的總體均數μ與已知的某一總體均屬μ0是否相等

Statistics →Hypothesis tests → One-Sample t-test for a mean

2.7.3單樣本比例檢驗:檢驗取離散值的變量取某個值的比例

Statistics →Hypothesis tests →One-Sample test for a proportion

2.7.4單樣本方差檢驗:檢驗樣本方差是否等于給定的值。零假設方差等于某個給定的。

Statistics →Hypothesis tests→One-Sample test for a variance

2.7.5兩樣本均值t檢驗:獨立的兩個總體的均值是否相等或者是否相差給定的值

Statistics →Hypothesis tests →Two-Sample t-test for means

2.7.6成對樣本均值t檢驗:成對樣本檢驗中總體是相關的。

Statistics →Hypothesis tests →Two-Sample paired t-test for means

2.7.7兩樣本比例檢驗:檢驗兩個總體中某個比例的值是否相等。

Statistics →Hypothesis tests →Two-Sample test for proportions

2.7.8兩樣本方差檢驗

Statistics →Hypothesis tests→Two Sample test for variance

2.8ANOVA過程

2.8.1單因素ANOVA過程

Statistics →ANOVA→One-Way Anova

2.8.2非參數的單因素方差分析:適用于正態(tài)分布假定或方差相等假設不能滿足的單因素問題

Statistics →ANOVA→nonparameter one-way Anova test

Wilcoxon法、Median法、Van der Waerden法、Savage法。

2.8.2因素方差分析:實驗結果是連續(xù)數值而分類變量是兩個以上的離散型數值。

Statistics →ANOVA→Factorial Anova

2.8.3線性模型:用最小二乘法擬合一般線性模型

Statistics →ANOVA→Linear Model

2.9回歸分析:Statistics →Regression

2.9.1simple回歸:簡單一類回歸分析,單一的自變量,單一的因變量,模型可以是一次、二次、三次。

Statistics →Regression→simple

2.9.2linear回歸:線性回歸,回歸模型可以有多個因變量,多個自變量,但是對因變量分別進行回歸

Statistics →Regression→linear

2.9.3logistic回歸:用于解決因變量是一個二元變量

Statistics →Regression→logistic

 

3.報表以及圖形輸出

3.1 print過程

Proc print data = sasuser.score;     //數據庫.數據集

Run;

Proc print data = sasuser.score;

Var name math Chinese;               //變量

Run;

Proc print data = sasuser.score  noobs;    //去掉第一列(觀測序號)

Var name math Chinese;

Run;

Proc  print  data= sasuser.score;

Where sex in(‘f’);                       //通過where語句

Run;

Proc print data = sasuser.score noobs label;

Title ‘女生成績單’;

Label name =‘姓名’

      Sex =‘性別’

      Math = ‘數學’

      Chinese = ‘語文’

      English =  ‘英語’;

Where sex in(‘f’);

Run;

Title “the sas system”;  //恢復系統(tǒng)標題

Proc  print  data = sasuser.score;

Footnote = ‘分數列表’;     //加分數列表的腳注

Run;

Proc sort  data = sasuser.score;

By  sex;

Run;

Proc  print  data = sasuser.score;     //使用by分組輸出前用sort排序

By sex;

Run;

Proc  print  data = sasuser.score;

Sum math;

Run;

3.2 tabulate過程

Proc tabulate data =數據集名稱;

Class 分類變量;

Var 分析變量;

Table 頁面說明 行維說明 列維說明/選項;

Run;

3.3 sort過程

Proc sort data = 數據集名稱;   //默認升序排列

  By 變量名;

Run;

Proc sort data = 數據集名稱;  

  By   descending  變量名;   //降序排列

Run;

3.4  means過程:數量(N)、均值(Mean)、標準差(Std Dev)、最大值(Maximum)、最小值(Minimum)

Proc means  data = sasuser.stock;

 Var  price;

Run;

3.5 univariate過程

Proc univariate data =數據集;

Var 分析變量;

Run;

結果:

Moments:統(tǒng)計量的各階矩,例如一階矩就是均值,二階矩就是方差等;

Basic Statistical Measures:基本統(tǒng)計量;

Tests for location:檢驗均值是否為零;

Quantiles:分位數表;

Extreme Observations:極端觀測值。

3.6 freq過程:離散變量的分布情況

Proc freq data =數據集名;

Tables  變量名;

Run;

結果:

變量取值、頻數、百分比、累計頻數、;累計百分比

3.7 corr過程:相關系數

Proc corr data =數據集;

Var 變量名  變量名;

Run;

結果:

簡單統(tǒng)計量

相關系數及p值

3.8 gplot過程:繪制散點圖和曲線圖,繪制回歸曲線。

Proc gplot  data = 數據集名稱;

Symbol 曲線類型;

Plot 豎軸變量*橫軸變量;

Run;

 

Proc gplot data = sasuser.score;

Symbol I = none  v=star;

Plot English*Chinese;

Run;

 

3.9  gchart過程:繪制直方圖、餅圖、三維直方圖等。

Proc gchart data = 數據集名稱;

Vbar/pie/block =變量;

Run;

3.10 G3D過程繪制三維曲面

Proc g3d data =數據集;

Plot 變量x*變量y=變量z;

Run;

gcontour過程:畫出曲面的等高線

Proc gcontour data =數據集名;

Plot x*y=z;

Run;

 

4.基本統(tǒng)計分析

4.1正態(tài)性檢驗:univariate過程

Proc univariate data= sasuser.stock normal;

Var  eps;

Run;

Proc univariate data= sasuser.stock normal;

Var  eps;

Histogram eps;                  //畫出直方圖

Probplot eps;                   //畫出概率分布圖

Run;

4.2單變量均值檢驗

4.2.1如果一個變量服從正態(tài)分布,那么可以用t檢驗來對變量進行均值檢驗

Proc ttest data =數據集  ho = 均值;

Var 檢驗變量;

Run;

4.2.2t檢驗還可以檢驗方差相同的兩個獨立樣本均值是否相等

Proc ttest data =數據集;

Class 分類變量;

Var 檢驗變量;

Run;

結果

第一部分簡單統(tǒng)計量

第二部分t檢驗結果

第三部分兩者方差是否相等檢驗

T檢驗要求兩個獨立樣本都必須服從正態(tài)分布,如果不服從正態(tài)分布,則無法進行t檢驗。這時可用非參數的方法,常用的非參數方法是NPAR1WAY過程,它是 noparameter 1 way縮寫。

4.3成對總體均值檢驗

4.4回歸分析:reg(回歸)過程、rsreg(二次響應面回歸)過程、orthoreg(病態(tài)數據回歸)過程、nlin(非線性回歸)過程、transreg(變換回歸)過程、calis(線性結果方程和路徑分析)過程、glm(一般線性回歸)過程、genmod(廣義線性回歸)過程

4.4.1 REG過程

Proc reg data = 輸入數據集 選項;

Var 變量列表;

Model 因變量 = 自變量列表;

Print 輸出結果;

Plot 診斷圖形;

Run;

4.4.2 nlin過程

指明模型的表達式并給定系數初值

4.4.3glm過程:使用最小二乘法回歸線性模型,還可以進行回歸,分差,協(xié)方差,多變量方差、偏相關系數分析(文章來自:CDA數據分析師培訓官網

4.5方差分析

4.5.1單因素方差分析

Proc anova data =數據集名稱;

Class 因素;

Model 實驗結果 =因素;

Run;

Proc anova data =數據集名稱;

Class 因素;

Model 實驗結果 =因素;

Means  brand;

Run;

Proc anova data =數據集名稱;

Class 因素;

Model 實驗結果 =因素;

Means  brand/t;       //t檢驗

Run;

Proc anova data =數據集名稱;

Class 因素;

Model 實驗結果 =因素;

Means  brand/bon;       //bonferroni t檢驗   控制第一類錯誤的概率,但是具有較大第二類錯誤概率

Run;

Proc anova data =數據集名稱;

Class 因素;

Model 實驗結果 =因素;

Means  brand/regwq;       //regwq檢驗   控制第一類錯誤的概率

Run;

Proc anova data =數據集名稱;

Class 因素;

Model 實驗結果 =因素;

Means  brand/tukey;       //tukey檢驗   控制第一類錯誤的概率,但是第二類錯誤概率通常高于regwq檢驗

Run;

4.5.2多因素方差分析

4.5.3列聯(lián)表檢驗

Proc freq data = 數據集;

Tables 因素a*因素b / chisq;

Weight 實驗結果;

Run;

5相關知識

因變量—Depender (Y)

自變量—Independent  (X1 X2…)


數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
客服在線
立即咨詢
') } function initGt() { var handler = function (captchaObj) { captchaObj.appendTo('#captcha'); captchaObj.onReady(function () { $("#wait").hide(); }).onSuccess(function(){ $('.getcheckcode').removeClass('dis'); $('.getcheckcode').trigger('click'); }); window.captchaObj = captchaObj; }; $('#captcha').show(); $.ajax({ url: "/login/gtstart?t=" + (new Date()).getTime(), // 加隨機數防止緩存 type: "get", dataType: "json", success: function (data) { $('#text').hide(); $('#wait').show(); // 調用 initGeetest 進行初始化 // 參數1:配置參數 // 參數2:回調,回調的第一個參數驗證碼對象,之后可以使用它調用相應的接口 initGeetest({ // 以下 4 個配置參數為必須,不能缺少 gt: data.gt, challenge: data.challenge, offline: !data.success, // 表示用戶后臺檢測極驗服務器是否宕機 new_captcha: data.new_captcha, // 用于宕機時表示是新驗證碼的宕機 product: "float", // 產品形式,包括:float,popup width: "280px", https: true // 更多配置參數說明請參見:http://docs.geetest.com/install/client/web-front/ }, handler); } }); } function codeCutdown() { if(_wait == 0){ //倒計時完成 $(".getcheckcode").removeClass('dis').html("重新獲取"); }else{ $(".getcheckcode").addClass('dis').html("重新獲取("+_wait+"s)"); _wait--; setTimeout(function () { codeCutdown(); },1000); } } function inputValidate(ele,telInput) { var oInput = ele; var inputVal = oInput.val(); var oType = ele.attr('data-type'); var oEtag = $('#etag').val(); var oErr = oInput.closest('.form_box').next('.err_txt'); var empTxt = '請輸入'+oInput.attr('placeholder')+'!'; var errTxt = '請輸入正確的'+oInput.attr('placeholder')+'!'; var pattern; if(inputVal==""){ if(!telInput){ errFun(oErr,empTxt); } return false; }else { switch (oType){ case 'login_mobile': pattern = /^1[3456789]\d{9}$/; if(inputVal.length==11) { $.ajax({ url: '/login/checkmobile', type: "post", dataType: "json", data: { mobile: inputVal, etag: oEtag, page_ur: window.location.href, page_referer: document.referrer }, success: function (data) { } }); } break; case 'login_yzm': pattern = /^\d{6}$/; break; } if(oType=='login_mobile'){ } if(!!validateFun(pattern,inputVal)){ errFun(oErr,'') if(telInput){ $('.getcheckcode').removeClass('dis'); } }else { if(!telInput) { errFun(oErr, errTxt); }else { $('.getcheckcode').addClass('dis'); } return false; } } return true; } function errFun(obj,msg) { obj.html(msg); if(msg==''){ $('.login_submit').removeClass('dis'); }else { $('.login_submit').addClass('dis'); } } function validateFun(pat,val) { return pat.test(val); }