
【新手必備】SAS常用函數(shù)整理
本文根據(jù)網(wǎng)絡(luò)資源對(duì)SAS的常用函數(shù)進(jìn)行了整理。主要內(nèi)容包括:
1. 數(shù)學(xué)函數(shù)
2. 數(shù)組函數(shù)
3. 字符函數(shù)
4. 日期和時(shí)間函數(shù)
5. 分布密度函數(shù),分布函數(shù)
6. 分位數(shù)函數(shù)
7. 隨機(jī)數(shù)函數(shù)
8. 樣本統(tǒng)計(jì)函數(shù)
一、數(shù)學(xué)函數(shù)
1.1 ABS(x) 求x的絕對(duì)值。
1.2 MAX(x1,x2,…,xn) 求所有自變量中的最大值。
1.3 MIN(x1,x2,…,xn) 求所有自變量中的最小值。
1.4 MOD(x,y) 求x除以y的余數(shù)。
1.5 SQRT(x) 求x的平方根。
1.6 ROUND(x,eps) 求x按照eps指定的精度四舍五入后的結(jié)果
例:ROUND(5654.5654,0.01) =5654.57
ROUND(5654.5654,10)=5650
1.7 CEIL(x) 求大于等于x的最小整數(shù)。
1.8 FLOOR(x) 求小于等于x的最大整數(shù)。
1.9 INT(x) 取整數(shù)部分(x扔掉小數(shù)部分后的結(jié)果)。
1.10 FUZZ(x) 當(dāng)x與其四舍五入整數(shù)值相差小于1E-12時(shí)取四舍五入。
1.11 LOG(x) 求x的自然對(duì)數(shù)。
1.12 LOG10(x) 求x的常用對(duì)數(shù)。
1.13 EXP(x) 指數(shù)函數(shù) 。
1.14SIN(x), COS(x), TAN(x) 求x的正弦、余弦、正切函數(shù)。
1.15 ARSIN(y) 計(jì)算函數(shù)y=sin(x)在區(qū)間的反函數(shù),y取[-1,1]間值。
1.16 ARCOS(y) 計(jì)算函數(shù)y=cos(x)在的反函數(shù),y取[-1,1]間值。
1.17 ATAN(y) 計(jì)算函數(shù)y=tan(x)在 的反函數(shù),y取間值。
1.18 SINH(x), COSH(x), TANH(x) 雙曲正弦、余弦、正切 。
1.19 ERF(x) 誤差函數(shù)。
1.20 GAMMA(x) 伽瑪函數(shù) 。
1.21 SIGN(x)符號(hào)函數(shù)。
二、數(shù)組函數(shù)
2.1 DIM(x) 求數(shù)組x第一維的元素的個(gè)數(shù)。
2.2 DIM k(x) 求數(shù)組x第k維的元素的個(gè)數(shù)。
2.3 LBOUND(x) 求數(shù)組x第一維的下界。
2.4 HBOUND(x) 求數(shù)組x第一維的上界。
2.5 LBOUND k(x) 求數(shù)組x第 k維的下界。
2.6 HBOUND k(x) 求數(shù)組x第 k維的上界。
三、字符函數(shù)
3.1 TRIM(s) 返回去掉字符串s的尾隨空格的結(jié)果。
3.2 UPCASE(s) 把字符串s中所有小寫字母轉(zhuǎn)換為大寫字母后的結(jié)果。
3.3 LOWCASE(s) 把字符串s中所有大寫字母轉(zhuǎn)換為小寫字母后的結(jié)果。
3.4 INDEX(s,s1) 查找s1在s中出現(xiàn)的位置。找不到時(shí)返回0。
3.5 RANK(s) 字符s的ASCII碼值。
3.6 BYTE(n) 第n個(gè)ASCII碼值的對(duì)應(yīng)字符。
3.7 REPEAT(s,n) 字符表達(dá)式s重復(fù)n次。
3.8 SUBSTR(s,p,n) 從字符串s中的第p個(gè)字符開(kāi)始抽取n個(gè)字符長(zhǎng)的子串
3.9 TRANWRD(s,s1,s2) 從字符串s中把所有字符串s1替換成字符串s2后的結(jié)果。
四、日期和時(shí)間函數(shù)
4.1 MDY(m,d,yr) 生成yr年m月d日的SAS日期值
4.2 YEAR(date) 由SAS日期值date得到年
4.3 MONTH(date) 由SAS日期值date得到月
4.4 DAY(date) 由SAS日期值date得到日
4.5 WEEKDAY(date) 由SAS日期值date得到星期幾
4.6 QTR(date) 由SAS日期值date得到季度值
4.7 HMS(h,m,s) 由小時(shí)h、分鐘m、秒s生成SAS時(shí)間值
4.8 DHMS(d,h,m,s) 由SAS日期值d、小時(shí)h、分鐘m、秒s生成SAS日期時(shí)間值
4.9 DATEPART(dt) 求SAS日期時(shí)間值dt的日期部分
4.10 INTNX(interval,from,n) 計(jì)算從from開(kāi)始經(jīng)過(guò)n個(gè)interval間隔后的SAS日期。
其中interval 可以取'YEAR'、'QTR'、'MONTH'、'WEEK'、'DAY'等。
例:INTNX('MONTH', '16Dec1997'd, 3)=1998年3月1日。
4.11 INTCK(interval,from,to) 計(jì)算從日期from到日期to中間經(jīng)過(guò)的interval間隔的個(gè)數(shù),其中interval取'MONTH'等。
例:INTCK('YEAR', '31Dec1996'd, '1Jan1998'd)=2
函數(shù)計(jì)算1996年12 月31日到1998年1月1日經(jīng)過(guò)的年間隔的個(gè)數(shù),結(jié)果得2,盡管這兩個(gè)日期之間實(shí)際只隔1年。
五、分布密度函數(shù)、分布函數(shù)
作為一個(gè)統(tǒng)計(jì)計(jì)算語(yǔ)言,SAS提供了多種概率分布的有關(guān)函數(shù)。分布密度、概率、累積分布函數(shù)等可以通過(guò)幾種統(tǒng)一的格式調(diào)用,格式為 :
分布函數(shù)值 = CDF(' 分布', x <, 參數(shù)表>);
密度值 = PDF(' 分布', x <, 參數(shù)表>);
概率值 = PMF(' 分布', x <, 參數(shù)表>);
對(duì)數(shù)密度值 = LOGPDF(' 分布', x <, 參數(shù)表>);
對(duì)數(shù)概率值 = LOGPMF(' 分布', x <, 參數(shù)表>);
CDF計(jì)算由'分布'指定的分布的分布函數(shù), PDF計(jì)算分布密度函數(shù)值,PMF計(jì)算離散分布的分布概率,LOGPDF為PDF的自然對(duì)數(shù),LOGPMF為PMF的自然對(duì)數(shù)。函數(shù)在自變量 x處計(jì)算,<, 參數(shù)表>表示可選的參數(shù)表。
分布類型取值可以為: BERNOULLI, BETA, BINOMIAL, CAUCHY, CHISQUARED, EXPONENTIAL, F, GAMMA, GEOMETRIC, HYPERGEOMETRIC, LAPLACE, LOGISTIC, LOGNORMAL, NEGBINOMIAL, NORMAL 或 GAUSSIAN, PARETO, POISSON, T, UNIFORM, WALD 或 IGAUSS, and WEIBULL??梢灾粚懬八膫€(gè)字母。
例:PDF('NORMAL', 1.96)計(jì)算標(biāo)準(zhǔn)正態(tài)分布在1.96處的密度值(0.05844),CDF('NORMAL', 1.96)計(jì)算標(biāo)準(zhǔn)正態(tài)分布在1.96處的分布函數(shù)值(0.975)。PMF對(duì)連續(xù)型分布即PDF。
除了用上述統(tǒng)一的格式調(diào)用外,SAS還單獨(dú)提供了常用的分布的密度、分布函數(shù)。
5.1 PROBNORM(x) 標(biāo)準(zhǔn)正態(tài)分布函數(shù)
5.2 PROBT(x,df<,nc>) 自由度為df的t分布函數(shù)。可選參數(shù)nc為非中心參數(shù)。
5.3 PROBCHI(x,df<,nc>) 自由度為df的卡方分布函數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
5.4 PROBF(x,ndf,ddf<,nc>) F(ndf,ddf)分布的分布函數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
5.5 PROBBNML(p,n,m) 設(shè)隨機(jī)變量Y服從二項(xiàng)分布B(n,p),此函數(shù)計(jì)算P(Y m)。
5.6 POISSON((lambda,n) 參數(shù)為lambda的Poisson分布Y n的概率。
5.7 PROBNEGB(p,n,m) 參數(shù)為(n,p)的負(fù)二項(xiàng)分布Y m的概率。
5.8 PROBHYPR(N,K,n,x<,r>) 超幾何分布的分布函數(shù)。
5.9 PROBBETA(x,a,b) 參數(shù)為(a,b)的Beta分布的分布函數(shù)。
5.10 PROBGAM(x,a) 參數(shù)為a的Gamma分布的分布函數(shù)。
5.11 PROBMC 計(jì)算多組均值的多重比較檢驗(yàn)的概率值和臨界值。
5.12 PROBBNRM(x,y,r) 標(biāo)準(zhǔn)二元正態(tài)分布的分布函數(shù),r為相關(guān)系數(shù)。
六、分位數(shù)函數(shù)
分位數(shù)函數(shù)是概率分布函數(shù)的反函數(shù)。其自變量在0到1之間取值。分位數(shù)函數(shù)計(jì)算的是分布的左側(cè)分位數(shù)。SAS提供了六種常見(jiàn)連續(xù)型分布的分位數(shù)函數(shù):
6.1 PROBIT(p) 標(biāo)準(zhǔn)正態(tài)分布左側(cè)p分位數(shù)。結(jié)果在-5到5之間。
6.2 TINV(p, df <,nc>) 自由度為df的t分布的左側(cè)p分位數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
6.3 CINV(p,df<,nc>) 自由度為df的卡方分布的左側(cè)p分位數(shù)。可選參數(shù)nc為非中心參數(shù)。
6.4 FINV(p,ndf,ddf<,nc>) F(ndf,ddf)分布的左側(cè)p分位數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
6.5 GAMINV(p,a) 參數(shù)為a的伽馬分布的左側(cè)p分位數(shù)。
6.6 BETAINV(p,a,b) 參數(shù)為(a,b)的貝塔分布的左側(cè)p分位數(shù)。
七、隨機(jī)數(shù)函數(shù)
7.1 均勻分布隨機(jī)數(shù)
有兩個(gè)均勻分布隨機(jī)數(shù)函數(shù):UNIFORM(seed),seed必須是常數(shù),為0,或5位、6位、7位的奇數(shù)。RANUNI(seed),seed為小于2**31-1的任意常數(shù)。在同一個(gè)數(shù)據(jù)步中對(duì)同一個(gè)隨機(jī)數(shù)函數(shù)的多次調(diào)用將得到不同的結(jié)果,但不同數(shù)據(jù)步中從同一種子出發(fā)將得到相同的隨機(jī)數(shù)序列。隨機(jī)數(shù)種子如果取0或者負(fù)數(shù)則種子采用系統(tǒng)日期時(shí)間。
7.2 正態(tài)分布隨機(jī)數(shù)
有兩種:
(1) NORMAL(seed),seed為0,或5位、6位、7位的奇數(shù)。
(2) RANNOR(seed),seed為任意數(shù)值常數(shù)。
7.3 指數(shù)分布隨機(jī)數(shù)
RANEXP(seed),seed為任意數(shù)值,產(chǎn)生參數(shù)為1的指數(shù)分布的隨機(jī)數(shù)。
參數(shù)為lambda的指數(shù)分布可以用RANEXP(seed)/lambda得到。
7.4 伽馬分布隨機(jī)數(shù)
RANGAM(seed, alpha),seed為任意數(shù)值常數(shù),alpha>0,得到參數(shù)為alpha的伽馬分布。設(shè)X=RANGAM(seed, alpha),則Y=beta*X是形狀參數(shù)為alpha,尺度參數(shù)為beta的GAMMA分布隨機(jī)數(shù)。如果alpha是整數(shù),則Y=2*X是自由度為 2*alpha的卡方分布隨機(jī)數(shù)。
如果alpha是正整數(shù),則Y=beta*X是Erlang分布隨機(jī)數(shù),為alpha個(gè)獨(dú)立的均值為beta的指數(shù)分布變量的和。 如果Y1=RANGAM(seed,alpha),Y2=RANGAM(seed,beta),在Y=Y1/(Y1+Y2)是參數(shù)為(alpha,beta )的貝塔分布隨機(jī)數(shù)。
7.5 三角分布隨機(jī)數(shù)
RANTRI(seed,h),seed為任意數(shù)值常數(shù),0<h<1。此分布在0到1取值,密度在0到h 之間為2x/h,在h到1之間為2(1-x)/(1-h)。
7.6 柯西分布隨機(jī)數(shù)
RANCAU(seed),seed為任意數(shù)值常數(shù)。產(chǎn)生位置參數(shù)為0,尺度參數(shù)為1的標(biāo)準(zhǔn)柯西分布隨機(jī)數(shù)。Y=alpha+beta*RANCAU(seed)為位置參數(shù)為alpha,尺度參數(shù)為beta的一般柯西分布隨機(jī)數(shù)。
7.7 二項(xiàng)分布隨機(jī)數(shù)
RANBIN(seed,n,p)產(chǎn)生參數(shù)為(n,p)的二項(xiàng)分布隨機(jī)數(shù),seed為任意數(shù)值。
7.8 泊松分布隨機(jī)數(shù)
RANPOI(seed,lambda)產(chǎn)生參數(shù)為lambda>0的泊松分布隨機(jī)數(shù),seed為任意數(shù)值。
7.9 一般離散分布隨機(jī)數(shù)
RANTBL(seed, p1, …, pn)生成取1,2,…,n的概率分別為p1,…,pn的離散分布隨機(jī)數(shù)。
八、樣本統(tǒng)計(jì)函數(shù)
樣本統(tǒng)計(jì)函數(shù)把輸入的自變量作為一組樣本,計(jì)算樣本統(tǒng)計(jì)量。其調(diào)用格式為“函數(shù)名(自變量1,自變量2,…,自變量n)”或者“函數(shù)名(OF 變量名列表)”。比如SUM是求和函數(shù),如果要求x1,x2,x3的和,可以用SUM(x1,x2,x3),也可以用SUM(OF x1-x3)。這些樣本統(tǒng)計(jì)函數(shù)只對(duì)自變量中的非缺失值進(jìn)行計(jì)算,比如求平均時(shí)把缺失值不計(jì)入內(nèi)。 數(shù)據(jù)分析師培訓(xùn)
8.1 MEAN 均值
8.2 MAX 最大值
8.3 MIN 最小值
8.4 N 非缺失數(shù)據(jù)的個(gè)數(shù)
8.5 NMISS 缺失數(shù)值的個(gè)數(shù)。
8.6 SUM 求和
8.7 VAR 方差
8.8 STD 標(biāo)準(zhǔn)差
8.9 STDERR 均值估計(jì)的標(biāo)準(zhǔn)誤差,用STD/SQRT(N)計(jì)算。
8.10 CV 變異系數(shù)
8.11 RANGE 極差
8.12 CSS 離差平方和
8.13 USS 平方和
8.14 SKEWNESS 偏度
8.15 KURTOSIS 峰度
數(shù)據(jù)分析咨詢請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
LSTM 模型輸入長(zhǎng)度選擇技巧:提升序列建模效能的關(guān)鍵? 在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)家族中,長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)憑借其解決長(zhǎng)序列 ...
2025-07-11CDA 數(shù)據(jù)分析師報(bào)考條件詳解與準(zhǔn)備指南? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代浪潮下,CDA 數(shù)據(jù)分析師認(rèn)證愈發(fā)受到矚目,成為眾多有志投身數(shù) ...
2025-07-11數(shù)據(jù)透視表中兩列相乘合計(jì)的實(shí)用指南? 在數(shù)據(jù)分析的日常工作中,數(shù)據(jù)透視表憑借其強(qiáng)大的數(shù)據(jù)匯總和分析功能,成為了 Excel 用戶 ...
2025-07-11尊敬的考生: 您好! 我們誠(chéng)摯通知您,CDA Level I和 Level II考試大綱將于 2025年7月25日 實(shí)施重大更新。 此次更新旨在確保認(rèn) ...
2025-07-10BI 大數(shù)據(jù)分析師:連接數(shù)據(jù)與業(yè)務(wù)的價(jià)值轉(zhuǎn)化者? ? 在大數(shù)據(jù)與商業(yè)智能(Business Intelligence,簡(jiǎn)稱 BI)深度融合的時(shí)代,BI ...
2025-07-10SQL 在預(yù)測(cè)分析中的應(yīng)用:從數(shù)據(jù)查詢到趨勢(shì)預(yù)判? ? 在數(shù)據(jù)驅(qū)動(dòng)決策的時(shí)代,預(yù)測(cè)分析作為挖掘數(shù)據(jù)潛在價(jià)值的核心手段,正被廣泛 ...
2025-07-10數(shù)據(jù)查詢結(jié)束后:分析師的收尾工作與價(jià)值深化? ? 在數(shù)據(jù)分析的全流程中,“query end”(查詢結(jié)束)并非工作的終點(diǎn),而是將數(shù) ...
2025-07-10CDA 數(shù)據(jù)分析師考試:從報(bào)考到取證的全攻略? 在數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的今天,數(shù)據(jù)分析師已成為各行業(yè)爭(zhēng)搶的核心人才,而 CDA(Certi ...
2025-07-09【CDA干貨】單樣本趨勢(shì)性檢驗(yàn):捕捉數(shù)據(jù)背后的時(shí)間軌跡? 在數(shù)據(jù)分析的版圖中,單樣本趨勢(shì)性檢驗(yàn)如同一位耐心的偵探,專注于從單 ...
2025-07-09year_month數(shù)據(jù)類型:時(shí)間維度的精準(zhǔn)切片? ? 在數(shù)據(jù)的世界里,時(shí)間是最不可或缺的維度之一,而year_month數(shù)據(jù)類型就像一把精準(zhǔn) ...
2025-07-09CDA 備考干貨:Python 在數(shù)據(jù)分析中的核心應(yīng)用與實(shí)戰(zhàn)技巧? ? 在 CDA 數(shù)據(jù)分析師認(rèn)證考試中,Python 作為數(shù)據(jù)處理與分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 檢驗(yàn):數(shù)據(jù)趨勢(shì)與突變分析的有力工具? ? ? 在數(shù)據(jù)分析的廣袤領(lǐng)域中,準(zhǔn)確捕捉數(shù)據(jù)的趨勢(shì)變化以及識(shí)別 ...
2025-07-08備戰(zhàn) CDA 數(shù)據(jù)分析師考試:需要多久?如何規(guī)劃? CDA(Certified Data Analyst)數(shù)據(jù)分析師認(rèn)證作為國(guó)內(nèi)權(quán)威的數(shù)據(jù)分析能力認(rèn)證 ...
2025-07-08LSTM 輸出不確定的成因、影響與應(yīng)對(duì)策略? 長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)作為循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的一種變體,憑借獨(dú)特的門控機(jī)制,在 ...
2025-07-07統(tǒng)計(jì)學(xué)方法在市場(chǎng)調(diào)研數(shù)據(jù)中的深度應(yīng)用? 市場(chǎng)調(diào)研是企業(yè)洞察市場(chǎng)動(dòng)態(tài)、了解消費(fèi)者需求的重要途徑,而統(tǒng)計(jì)學(xué)方法則是市場(chǎng)調(diào)研數(shù) ...
2025-07-07CDA數(shù)據(jù)分析師證書考試全攻略? 在數(shù)字化浪潮席卷全球的當(dāng)下,數(shù)據(jù)已成為企業(yè)決策、行業(yè)發(fā)展的核心驅(qū)動(dòng)力,數(shù)據(jù)分析師也因此成為 ...
2025-07-07剖析 CDA 數(shù)據(jù)分析師考試題型:解鎖高效備考與答題策略? CDA(Certified Data Analyst)數(shù)據(jù)分析師考試作為衡量數(shù)據(jù)專業(yè)能力的 ...
2025-07-04SQL Server 字符串截取轉(zhuǎn)日期:解鎖數(shù)據(jù)處理的關(guān)鍵技能? 在數(shù)據(jù)處理與分析工作中,數(shù)據(jù)格式的規(guī)范性是保證后續(xù)分析準(zhǔn)確性的基礎(chǔ) ...
2025-07-04CDA 數(shù)據(jù)分析師視角:從數(shù)據(jù)迷霧中探尋商業(yè)真相? 在數(shù)字化浪潮席卷全球的今天,數(shù)據(jù)已成為企業(yè)決策的核心驅(qū)動(dòng)力,CDA(Certifie ...
2025-07-04CDA 數(shù)據(jù)分析師:開(kāi)啟數(shù)據(jù)職業(yè)發(fā)展新征程? ? 在數(shù)據(jù)成為核心生產(chǎn)要素的今天,數(shù)據(jù)分析師的職業(yè)價(jià)值愈發(fā)凸顯。CDA(Certified D ...
2025-07-03