
Sas常用函數(shù)
一、數(shù)學(xué)函數(shù)
ABS(x) 求x的絕對值。
MAX(x1,x2,…,xn) 求所有自變量中的最大一個(gè)。
MIN(x1,x2,…,xn) 求所有自變量中的最小一個(gè)。
MOD(x,y) 求x除以y的余數(shù)。
SQRT(x) 求x的平方根。
ROUND(x,eps) 求x按照eps指定的精度四舍五入后的結(jié)果,比如ROUND(5654.5654,0.01) 結(jié)果為5654.57,ROUND(5654.5654,10)結(jié)果為5650。
CEIL(x) 求大于等于x的最小整數(shù)。當(dāng)x為整數(shù)時(shí)就是x本身,否則為x右邊最近的整數(shù)。
FLOOR(x) 求小于等于x的最大整數(shù)。當(dāng)x為整數(shù)時(shí)就是x本身,否則為x左邊最近的整數(shù)。
INT(x) 求x扔掉小數(shù)部分后的結(jié)果。
FUZZ(x) 當(dāng)x與其四舍五入整數(shù)值相差小于1E-12時(shí)取四舍五入。
LOG(x) 求x的自然對數(shù)。
LOG10(x) 求x的常用對數(shù)。
EXP(x) 指數(shù)函數(shù) 。
SIN(x), COS(x), TAN(x) 求x的正弦、余弦、正切函數(shù)。
ARSIN(y) 計(jì)算函數(shù)y=sin(x)在區(qū)間的反函數(shù),y取[-1,1]間值。
ARCOS(y) 計(jì)算函數(shù)y=cos(x)在的反函數(shù),y取[-1,1]間值。
ATAN(y) 計(jì)算函數(shù)y=tan(x)在 的反函數(shù),y取間值。
SINH(x), COSH(x), TANH(x) 雙曲正弦、余弦、正切
ERF(x) 誤差函數(shù)
GAMMA(x) 完全 函數(shù)
此外還有符號函數(shù)SIGN,函數(shù)一階導(dǎo)數(shù)函數(shù)DIGAMMA,二階導(dǎo)數(shù)函數(shù)TRIGAMMA ,誤差函數(shù)余函數(shù)ERFC,函數(shù)自然對數(shù)LGAMMA,ORDINAL函數(shù),AIRY 函數(shù),DAIRY函數(shù),Bessel函數(shù)JBESSEL,修正的Bessel函數(shù)IBESSEL,等等。
二、數(shù)組函數(shù)
數(shù)組函數(shù)計(jì)算數(shù)組的維數(shù)、上下界,有利于寫出可移植的程序。數(shù)組函數(shù)包括:
DIM(x) 求數(shù)組x第一維的元素的個(gè)數(shù)(注意當(dāng)下界為1時(shí)元素個(gè)數(shù)與上界相同,否則元素個(gè)數(shù)不一定與上界相同)。
DIM k(x) 求數(shù)組x第k維的元素的個(gè)數(shù)。
LBOUND(x) 求數(shù)組x第一維的下界。
HBOUND(x) 求數(shù)組x第一維的上界。
LBOUND k(x) 求數(shù)組x第 k維的下界。
HBOUND k(x) 求數(shù)組x第 k維的上界。
三、字符函數(shù)
較重要的字符函數(shù)有:
TRIM(s) 返回去掉字符串s的尾隨空格的結(jié)果。
UPCASE(s) 把字符串s中所有小寫字母轉(zhuǎn)換為大寫字母后的結(jié)果。
LOWCASE(s) 把字符串s中所有大寫字母轉(zhuǎn)換為小寫字母后的結(jié)果。
INDEX(s,s1) 查找s1在s中出現(xiàn)的位置。找不到時(shí)返回0。
RANK(s) 字符s的ASCII碼值。
BYTE(n) 第n個(gè)ASCII碼值的對應(yīng)字符。
REPEAT(s,n) 字符表達(dá)式s重復(fù)n次。
SUBSTR(s,p,n) 從字符串s中的第p個(gè)字符開始抽取n個(gè)字符長的子串
TRANWRD(s,s1,s2) 從字符串s中把所有字符串s1替換成字符串s2后的結(jié)果。
其它字符函數(shù)還有 COLLATE,COMPRESS,INDEXC,LEFT,LENGTH,REVERSE,RIGHT,SCAN ,TRANSLATE,VERIFY,COMPBL,DEQUOTE,INDEXW,QUOTE,SOUNDEX,TRIMN,INDEXW。
四、日期和時(shí)間函數(shù)
常用日期和時(shí)間函數(shù)有:
MDY(m,d,yr) 生成yr年m月d日的SAS日期值
YEAR(date) 由SAS日期值date得到年
MONTH(date) 由SAS日期值date得到月
DAY(date) 由SAS日期值date得到日
WEEKDAY(date) 由SAS日期值date得到星期幾
QTR(date) 由SAS日期值date得到季度值
HMS(h,m,s) 由小時(shí)h、分鐘m、秒s生成SAS時(shí)間值
DHMS(d,h,m,s) 由SAS日期值d、小時(shí)h、分鐘m、秒s生成SAS日期時(shí)間值
DATEPART(dt) 求SAS日期時(shí)間值dt的日期部分
INTNX(interval,from,n) 計(jì)算從from開始經(jīng)過n個(gè)in間隔后的SAS日期。其中interval 可以取'YEAR'、'QTR'、'MONTH'、'WEEK'、'DAY'等。比如,INTNX('MONTH', '16Dec1997'd, 3)結(jié)果為1998年3月1日。注意它總是返回一個(gè)周期的開始值。
INTCK(interval,from,to) 計(jì)算從日期from到日期to中間經(jīng)過的interval間隔的個(gè)數(shù),其中interval取'MONTH'等。比如,INTCK('YEAR', '31Dec1996'd, '1Jan1998'd)計(jì)算1996年12 月31日到1998年1月1日經(jīng)過的年間隔的個(gè)數(shù),結(jié)果得2,盡管這兩個(gè)日期之間實(shí)際只隔1年。
其它日期和時(shí)間函數(shù)還有DATE、TODAY、 DATETIME、DATEJUL、JULDATE、HOUR、MINUTE、SECOND 、TIME、TIMEPART等。詳見《SAS系統(tǒng)-Base SAS軟件使用手冊》、《SAS系統(tǒng)-SAS/ETS軟件使用手冊》。
五、分布密度函數(shù)、分布函數(shù)
作為一個(gè)統(tǒng)計(jì)計(jì)算語言,SAS提供了多種概率分布的有關(guān)函數(shù)。分布密度、概率、累積分布函數(shù)等可以通過幾種統(tǒng)一的格式調(diào)用,格式為
分布函數(shù)值 = CDF(' 分布', x <, 參數(shù)表>);
密度值 = PDF(' 分布', x <, 參數(shù)表>);
概率值 = PMF(' 分布', x <, 參數(shù)表>);
對數(shù)密度值 = LOGPDF(' 分布', x <, 參數(shù)表>);
對數(shù)概率值 = LOGPMF(' 分布', x <, 參數(shù)表>);
CDF計(jì)算由'分布'指定的分布的分布函數(shù), PDF計(jì)算分布密度函數(shù)值,PMF計(jì)算離散分布的分布概率,LOGPDF為PDF的自然對數(shù),LOGPMF為PMF的自然對數(shù)。函數(shù)在自變量 x處計(jì)算,<, 參數(shù)表>表示可選的參數(shù)表。
分布類型取值可以為: BERNOULLI, BETA, BINOMIAL, CAUCHY, CHISQUARED, EXPONENTIAL, F, GAMMA, GEOMETRIC, HYPERGEOMETRIC, LAPLACE, LOGISTIC, LOGNORMAL, NEGBINOMIAL, NORMAL 或 GAUSSIAN, PARETO, POISSON, T, UNIFORM, WALD 或 IGAUSS, and WEIBULL??梢灾粚懬八膫€(gè)字母。
例如,PDF('NORMAL', 1.96)計(jì)算標(biāo)準(zhǔn)正態(tài)分布在1.96處的密度值(0.05844),CDF('NORMAL', 1.96)計(jì)算標(biāo)準(zhǔn)正態(tài)分布在1.96處的分布函數(shù)值(0.975)。PMF對連續(xù)型分布即PDF。
除了用上述統(tǒng)一的格式調(diào)用外,SAS還單獨(dú)提供了常用的分布的密度、分布函數(shù)。
PROBNORM(x) 標(biāo)準(zhǔn)正態(tài)分布函數(shù)
PROBT(x,df<,nc>) 自由度為df的t分布函數(shù)。可選參數(shù)nc為非中心參數(shù)。
PROBCHI(x,df<,nc>) 自由度為df的卡方分布函數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
PROBF(x,ndf,ddf<,nc>) F(ndf,ddf)分布的分布函數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
PROBBNML(p,n,m) 設(shè)隨機(jī)變量Y服從二項(xiàng)分布B(n,p),此函數(shù)計(jì)算P(Y m)。
POISSON((lambda,n) 參數(shù)為lambda的Poisson分布Y n的概率。
PROBNEGB(p,n,m) 參數(shù)為(n,p)的負(fù)二項(xiàng)分布Y m的概率。
PROBHYPR(N,K,n,x<,r>) 超幾何分布的分布函數(shù)。設(shè)N個(gè)產(chǎn)品中有K個(gè)不合格品,抽取n個(gè)樣品,其中不合格品數(shù)小于等于x的概率為此函數(shù)值??蛇x參數(shù)r是不勻率,缺省為1 ,r代表抽到不合格品的概率是抽到合格品概率的多少倍。
PROBBETA(x,a,b) 參數(shù)為(a,b)的Beta分布的分布函數(shù)。
PROBGAM(x,a) 參數(shù)為a的Gamma分布的分布函數(shù)。
PROBMC 計(jì)算多組均值的多重比較檢驗(yàn)的概率值和臨界值。
PROBBNRM(x,y,r) 標(biāo)準(zhǔn)二元正態(tài)分布的分布函數(shù),r為相關(guān)系數(shù)。
六、分位數(shù)函數(shù)
分位數(shù)函數(shù)是概率分布函數(shù)的反函數(shù)。其自變量在0到1之間取值。分位數(shù)函數(shù)計(jì)算的是分布的左側(cè)分位數(shù)。SAS提供了六種常見連續(xù)型分布的分位數(shù)函數(shù)。
PROBIT(p) 標(biāo)準(zhǔn)正態(tài)分布左側(cè)p分位數(shù)。結(jié)果在-5到5之間。
TINV(p, df <,nc>) 自由度為df的t分布的左側(cè)p分位數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
CINV(p,df<,nc>) 自由度為df的卡方分布的左側(cè)p分位數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
FINV(p,ndf,ddf<,nc>) F(ndf,ddf)分布的左側(cè)p分位數(shù)。可選參數(shù)nc為非中心參數(shù)。
GAMINV(p,a) 參數(shù)為a的伽馬分布的左側(cè)p分位數(shù)。
BETAINV(p,a,b) 參數(shù)為(a,b)的貝塔分布的左側(cè)p分位數(shù)。
七、隨機(jī)數(shù)函數(shù)
SAS可以用來進(jìn)行隨機(jī)模擬。它提供了常見分布的偽隨機(jī)數(shù)生成函數(shù)。
1.均勻分布隨機(jī)數(shù)
有兩個(gè)均勻分布隨機(jī)數(shù)函數(shù):UNIFORM(seed),seed必須是常數(shù),為0,或5位、6位、7位的奇數(shù)。RANUNI(seed),seed為小于2**31-1的任意常數(shù)。在同一個(gè)數(shù)據(jù)步中對同一個(gè)隨機(jī)數(shù)函數(shù)的多次調(diào)用將得到不同的結(jié)果,但不同數(shù)據(jù)步中從同一種子出發(fā)將得到相同的隨機(jī)數(shù)序列。隨機(jī)數(shù)種子如果取0或者負(fù)數(shù)則種子采用系統(tǒng)日期時(shí)間。
2.正態(tài)分布隨機(jī)數(shù)
有兩種,NORMAL(seed),seed為0,或5位、6位、7位的奇數(shù)。RANNOR(seed),seed為任意數(shù)值常數(shù)。
3.指數(shù)分布隨機(jī)數(shù)
RANEXP(seed),seed為任意數(shù)值,產(chǎn)生參數(shù)為1的指數(shù)分布的隨機(jī)數(shù)。參數(shù)為lambda的指數(shù)分布可以用RANEXP(seed)/lambda得到。
另外若Y=alpha-beta*LOG(RANEXP(seed)),則Y為位置參數(shù)為alpha,尺度參數(shù)為beta的極值分布。若Y=FLOOR(-RANEXP(seed)/LOG(p)),那么Y是具有參數(shù)p的幾何分布變量。
4.伽馬分布隨機(jī)數(shù)
RANGAM(seed, alpha),seed為任意數(shù)值常數(shù),alpha>0,得到參數(shù)為alpha的伽馬分布。設(shè)X=RANGAM(seed, alpha),則Y=beta*X是形狀參數(shù)為alpha,尺度參數(shù)為beta的GAMMA分布隨機(jī)數(shù)。如果alpha是整數(shù),則Y=2*X是自由度為 2*alpha的卡方分布隨機(jī)數(shù)。
如果alpha是正整數(shù),則Y=beta*X是Erlang分布隨機(jī)數(shù),為alpha個(gè)獨(dú)立的均值為beta的指數(shù)分布變量的和。
如果Y1=RANGAM(seed,alpha),Y2=RANGAM(seed,beta),在Y=Y1/(Y1+Y2)是參數(shù)為(alpha,beta )的貝塔分布隨機(jī)數(shù)。
5.三角分布隨機(jī)數(shù)
RANTRI(seed,h),seed為任意數(shù)值常數(shù),0<h<1。此分布在0到1取值,密度在0到h 之間為2x/h,在h到1之間為2(1-x)/(1-h)。
6.柯西分布隨機(jī)數(shù)
RANCAU(seed),seed為任意數(shù)值常數(shù)。產(chǎn)生位置參數(shù)為0,尺度參數(shù)為1的標(biāo)準(zhǔn)柯西分布隨機(jī)數(shù)。Y=alpha+beta*RANCAU(seed)為位置參數(shù)為alpha,尺度參數(shù)為beta的一般柯西分布隨機(jī)數(shù)。
7.二項(xiàng)分布隨機(jī)數(shù)
RANBIN(seed,n,p)產(chǎn)生參數(shù)為(n,p)的二項(xiàng)分布隨機(jī)數(shù),seed為任意數(shù)值。
8.泊松分布隨機(jī)數(shù)
RANPOI(seed,lambda)產(chǎn)生參數(shù)為lambda>0的泊松分布隨機(jī)數(shù),seed為任意數(shù)值。
9.一般離散分布隨機(jī)數(shù)
RANTBL(seed, p1, …, pn)生成取1,2,…,n的概率分別為p1,…,pn的離散分布隨機(jī)數(shù)。
八、樣本統(tǒng)計(jì)函數(shù)
樣本統(tǒng)計(jì)函數(shù)把輸入的自變量作為一組樣本,計(jì)算樣本統(tǒng)計(jì)量。其調(diào)用格式為“函數(shù)名(自變量1,自變量2,…,自變量n)”或者“函數(shù)名(OF 變量名列表)”。比如SUM是求和函數(shù),如果要求x1,x2,x3的和,可以用SUM(x1,x2,x3),也可以用SUM(OF x1-x3)。這些樣本統(tǒng)計(jì)函數(shù)只對自變量中的非缺失值進(jìn)行計(jì)算,比如求平均時(shí)把缺失值不計(jì)入內(nèi)。
各樣本統(tǒng)計(jì)函數(shù)為:
MEAN 均值
MAX 最大值
MIN 最小值
N 非缺失數(shù)據(jù)的個(gè)數(shù)
NMISS 缺失數(shù)值的個(gè)數(shù)。
SUM 求和
VAR 方差
STD 標(biāo)準(zhǔn)差
STDERR 均值估計(jì)的標(biāo)準(zhǔn)誤差,用STD/SQRT(N)計(jì)算。
CV 變異系數(shù)
RANGE 極差
CSS 離差平方和
USS 平方和
SKEWNESS 偏度
KURTOSIS 峰度
trim() 去掉字符串尾部空格,如果字符串為空,則返回一個(gè)空格
left() 把字符串開頭的空格移到尾部
strip() 去掉字符串開頭和結(jié)尾的所有空格
cat() 與||作用類似,保留首尾全部空格
catt() 但是連接之前會(huì)去掉各字符串尾部空格,相當(dāng)于連接符結(jié)合trim()使用
cats() 但是連接之前會(huì)去掉首尾全部空格,相當(dāng)于連接符結(jié)合strip()使用
catx() 但是連接之前會(huì)去掉首尾全部空格,并且在字符串之間加上一個(gè)指定的字符串
sas中sql抽取第幾行第幾列
第一種
proc sql noprint;
select name into:vname from dictionary.columns
where libname='WORK' and memname='A' and varnum=1;/*varnum=n n為第幾個(gè)變量,即第幾列*/
run;
create table aa as
select &vname from a(firstobs=2 obs=2);/*括號內(nèi)選項(xiàng)控制選擇第幾個(gè)觀測,即第幾行*/
quit;
第二種
proc sql ;
select * from sashelp.class
;
select name, age, monotonic() as m from sashelp.class
having m=2
;
數(shù)據(jù)分析咨詢請掃描二維碼
若不方便掃碼,搜微信號:CDAshujufenxi
LSTM 模型輸入長度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢變化以及識別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對策略? 長短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場調(diào)研是企業(yè)洞察市場動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03