
【新手必備】SAS常用函數(shù)整理
本文根據(jù)網(wǎng)絡(luò)資源對(duì)SAS的常用函數(shù)進(jìn)行了整理。主要內(nèi)容包括:
1. 數(shù)學(xué)函數(shù)
2. 數(shù)組函數(shù)
3. 字符函數(shù)
4. 日期和時(shí)間函數(shù)
5. 分布密度函數(shù),分布函數(shù)
6. 分位數(shù)函數(shù)
7. 隨機(jī)數(shù)函數(shù)
8. 樣本統(tǒng)計(jì)函數(shù)
一、數(shù)學(xué)函數(shù)
1.1 ABS(x) 求x的絕對(duì)值。
1.2 MAX(x1,x2,…,xn) 求所有自變量中的最大值。
1.3 MIN(x1,x2,…,xn) 求所有自變量中的最小值。
1.4 MOD(x,y) 求x除以y的余數(shù)。
1.5 SQRT(x) 求x的平方根。
1.6 ROUND(x,eps) 求x按照eps指定的精度四舍五入后的結(jié)果
例:ROUND(5654.5654,0.01) =5654.57
ROUND(5654.5654,10)=5650
1.7 CEIL(x) 求大于等于x的最小整數(shù)。
1.8 FLOOR(x) 求小于等于x的最大整數(shù)。
1.9 INT(x) 取整數(shù)部分(x扔掉小數(shù)部分后的結(jié)果)。
1.10 FUZZ(x) 當(dāng)x與其四舍五入整數(shù)值相差小于1E-12時(shí)取四舍五入。
1.11 LOG(x) 求x的自然對(duì)數(shù)。
1.12 LOG10(x) 求x的常用對(duì)數(shù)。
1.13 EXP(x) 指數(shù)函數(shù) 。
1.14SIN(x), COS(x), TAN(x) 求x的正弦、余弦、正切函數(shù)。
1.15 ARSIN(y) 計(jì)算函數(shù)y=sin(x)在區(qū)間的反函數(shù),y取[-1,1]間值。
1.16 ARCOS(y) 計(jì)算函數(shù)y=cos(x)在的反函數(shù),y取[-1,1]間值。
1.17 ATAN(y) 計(jì)算函數(shù)y=tan(x)在 的反函數(shù),y取間值。
1.18 SINH(x), COSH(x), TANH(x) 雙曲正弦、余弦、正切 。
1.19 ERF(x) 誤差函數(shù)。
1.20 GAMMA(x) 伽瑪函數(shù) 。
1.21 SIGN(x)符號(hào)函數(shù)。
二、數(shù)組函數(shù)
2.1 DIM(x) 求數(shù)組x第一維的元素的個(gè)數(shù)。
2.2 DIM k(x) 求數(shù)組x第k維的元素的個(gè)數(shù)。
2.3 LBOUND(x) 求數(shù)組x第一維的下界。
2.4 HBOUND(x) 求數(shù)組x第一維的上界。
2.5 LBOUND k(x) 求數(shù)組x第 k維的下界。
2.6 HBOUND k(x) 求數(shù)組x第 k維的上界。
三、字符函數(shù)
3.1 TRIM(s) 返回去掉字符串s的尾隨空格的結(jié)果。
3.2 UPCASE(s) 把字符串s中所有小寫(xiě)字母轉(zhuǎn)換為大寫(xiě)字母后的結(jié)果。
3.3 LOWCASE(s) 把字符串s中所有大寫(xiě)字母轉(zhuǎn)換為小寫(xiě)字母后的結(jié)果。
3.4 INDEX(s,s1) 查找s1在s中出現(xiàn)的位置。找不到時(shí)返回0。
3.5 RANK(s) 字符s的ASCII碼值。
3.6 BYTE(n) 第n個(gè)ASCII碼值的對(duì)應(yīng)字符。
3.7 REPEAT(s,n) 字符表達(dá)式s重復(fù)n次。
3.8 SUBSTR(s,p,n) 從字符串s中的第p個(gè)字符開(kāi)始抽取n個(gè)字符長(zhǎng)的子串
3.9 TRANWRD(s,s1,s2) 從字符串s中把所有字符串s1替換成字符串s2后的結(jié)果。
四、日期和時(shí)間函數(shù)
4.1 MDY(m,d,yr) 生成yr年m月d日的SAS日期值
4.2 YEAR(date) 由SAS日期值date得到年
4.3 MONTH(date) 由SAS日期值date得到月
4.4 DAY(date) 由SAS日期值date得到日
4.5 WEEKDAY(date) 由SAS日期值date得到星期幾
4.6 QTR(date) 由SAS日期值date得到季度值
4.7 HMS(h,m,s) 由小時(shí)h、分鐘m、秒s生成SAS時(shí)間值
4.8 DHMS(d,h,m,s) 由SAS日期值d、小時(shí)h、分鐘m、秒s生成SAS日期時(shí)間值
4.9 DATEPART(dt) 求SAS日期時(shí)間值dt的日期部分
4.10 INTNX(interval,from,n) 計(jì)算從from開(kāi)始經(jīng)過(guò)n個(gè)interval間隔后的SAS日期。
其中interval 可以取'YEAR'、'QTR'、'MONTH'、'WEEK'、'DAY'等。
例:INTNX('MONTH', '16Dec1997'd, 3)=1998年3月1日。
4.11 INTCK(interval,from,to) 計(jì)算從日期from到日期to中間經(jīng)過(guò)的interval間隔的個(gè)數(shù),其中interval取'MONTH'等。
例:INTCK('YEAR', '31Dec1996'd, '1Jan1998'd)=2
函數(shù)計(jì)算1996年12 月31日到1998年1月1日經(jīng)過(guò)的年間隔的個(gè)數(shù),結(jié)果得2,盡管這兩個(gè)日期之間實(shí)際只隔1年。
五、分布密度函數(shù)、分布函數(shù)
作為一個(gè)統(tǒng)計(jì)計(jì)算語(yǔ)言,SAS提供了多種概率分布的有關(guān)函數(shù)。分布密度、概率、累積分布函數(shù)等可以通過(guò)幾種統(tǒng)一的格式調(diào)用,格式為 :
分布函數(shù)值 = CDF(' 分布', x <, 參數(shù)表>);
密度值 = PDF(' 分布', x <, 參數(shù)表>);
概率值 = PMF(' 分布', x <, 參數(shù)表>);
對(duì)數(shù)密度值 = LOGPDF(' 分布', x <, 參數(shù)表>);
對(duì)數(shù)概率值 = LOGPMF(' 分布', x <, 參數(shù)表>);
CDF計(jì)算由'分布'指定的分布的分布函數(shù), PDF計(jì)算分布密度函數(shù)值,PMF計(jì)算離散分布的分布概率,LOGPDF為PDF的自然對(duì)數(shù),LOGPMF為PMF的自然對(duì)數(shù)。函數(shù)在自變量 x處計(jì)算,<, 參數(shù)表>表示可選的參數(shù)表。
分布類(lèi)型取值可以為: BERNOULLI, BETA, BINOMIAL, CAUCHY, CHISQUARED, EXPONENTIAL, F, GAMMA, GEOMETRIC, HYPERGEOMETRIC, LAPLACE, LOGISTIC, LOGNORMAL, NEGBINOMIAL, NORMAL 或 GAUSSIAN, PARETO, POISSON, T, UNIFORM, WALD 或 IGAUSS, and WEIBULL??梢灾粚?xiě)前四個(gè)字母。
例:PDF('NORMAL', 1.96)計(jì)算標(biāo)準(zhǔn)正態(tài)分布在1.96處的密度值(0.05844),CDF('NORMAL', 1.96)計(jì)算標(biāo)準(zhǔn)正態(tài)分布在1.96處的分布函數(shù)值(0.975)。PMF對(duì)連續(xù)型分布即PDF。
除了用上述統(tǒng)一的格式調(diào)用外,SAS還單獨(dú)提供了常用的分布的密度、分布函數(shù)。
5.1 PROBNORM(x) 標(biāo)準(zhǔn)正態(tài)分布函數(shù)
5.2 PROBT(x,df<,nc>) 自由度為df的t分布函數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
5.3 PROBCHI(x,df<,nc>) 自由度為df的卡方分布函數(shù)。可選參數(shù)nc為非中心參數(shù)。
5.4 PROBF(x,ndf,ddf<,nc>) F(ndf,ddf)分布的分布函數(shù)。可選參數(shù)nc為非中心參數(shù)。
5.5 PROBBNML(p,n,m) 設(shè)隨機(jī)變量Y服從二項(xiàng)分布B(n,p),此函數(shù)計(jì)算P(Y m)。
5.6 POISSON((lambda,n) 參數(shù)為lambda的Poisson分布Y n的概率。
5.7 PROBNEGB(p,n,m) 參數(shù)為(n,p)的負(fù)二項(xiàng)分布Y m的概率。
5.8 PROBHYPR(N,K,n,x<,r>) 超幾何分布的分布函數(shù)。
5.9 PROBBETA(x,a,b) 參數(shù)為(a,b)的Beta分布的分布函數(shù)。
5.10 PROBGAM(x,a) 參數(shù)為a的Gamma分布的分布函數(shù)。
5.11 PROBMC 計(jì)算多組均值的多重比較檢驗(yàn)的概率值和臨界值。
5.12 PROBBNRM(x,y,r) 標(biāo)準(zhǔn)二元正態(tài)分布的分布函數(shù),r為相關(guān)系數(shù)。
六、分位數(shù)函數(shù)
分位數(shù)函數(shù)是概率分布函數(shù)的反函數(shù)。其自變量在0到1之間取值。分位數(shù)函數(shù)計(jì)算的是分布的左側(cè)分位數(shù)。SAS提供了六種常見(jiàn)連續(xù)型分布的分位數(shù)函數(shù):
6.1 PROBIT(p) 標(biāo)準(zhǔn)正態(tài)分布左側(cè)p分位數(shù)。結(jié)果在-5到5之間。
6.2 TINV(p, df <,nc>) 自由度為df的t分布的左側(cè)p分位數(shù)。可選參數(shù)nc為非中心參數(shù)。
6.3 CINV(p,df<,nc>) 自由度為df的卡方分布的左側(cè)p分位數(shù)??蛇x參數(shù)nc為非中心參數(shù)。
6.4 FINV(p,ndf,ddf<,nc>) F(ndf,ddf)分布的左側(cè)p分位數(shù)。可選參數(shù)nc為非中心參數(shù)。
6.5 GAMINV(p,a) 參數(shù)為a的伽馬分布的左側(cè)p分位數(shù)。
6.6 BETAINV(p,a,b) 參數(shù)為(a,b)的貝塔分布的左側(cè)p分位數(shù)。
七、隨機(jī)數(shù)函數(shù)
7.1 均勻分布隨機(jī)數(shù)
有兩個(gè)均勻分布隨機(jī)數(shù)函數(shù):UNIFORM(seed),seed必須是常數(shù),為0,或5位、6位、7位的奇數(shù)。RANUNI(seed),seed為小于2**31-1的任意常數(shù)。在同一個(gè)數(shù)據(jù)步中對(duì)同一個(gè)隨機(jī)數(shù)函數(shù)的多次調(diào)用將得到不同的結(jié)果,但不同數(shù)據(jù)步中從同一種子出發(fā)將得到相同的隨機(jī)數(shù)序列。隨機(jī)數(shù)種子如果取0或者負(fù)數(shù)則種子采用系統(tǒng)日期時(shí)間。
7.2 正態(tài)分布隨機(jī)數(shù)
有兩種:
(1) NORMAL(seed),seed為0,或5位、6位、7位的奇數(shù)。
(2) RANNOR(seed),seed為任意數(shù)值常數(shù)。
7.3 指數(shù)分布隨機(jī)數(shù)
RANEXP(seed),seed為任意數(shù)值,產(chǎn)生參數(shù)為1的指數(shù)分布的隨機(jī)數(shù)。
參數(shù)為lambda的指數(shù)分布可以用RANEXP(seed)/lambda得到。
7.4 伽馬分布隨機(jī)數(shù)
RANGAM(seed, alpha),seed為任意數(shù)值常數(shù),alpha>0,得到參數(shù)為alpha的伽馬分布。設(shè)X=RANGAM(seed, alpha),則Y=beta*X是形狀參數(shù)為alpha,尺度參數(shù)為beta的GAMMA分布隨機(jī)數(shù)。如果alpha是整數(shù),則Y=2*X是自由度為 2*alpha的卡方分布隨機(jī)數(shù)。
如果alpha是正整數(shù),則Y=beta*X是Erlang分布隨機(jī)數(shù),為alpha個(gè)獨(dú)立的均值為beta的指數(shù)分布變量的和。 如果Y1=RANGAM(seed,alpha),Y2=RANGAM(seed,beta),在Y=Y1/(Y1+Y2)是參數(shù)為(alpha,beta )的貝塔分布隨機(jī)數(shù)。
7.5 三角分布隨機(jī)數(shù)
RANTRI(seed,h),seed為任意數(shù)值常數(shù),0<h<1。此分布在0到1取值,密度在0到h 之間為2x/h,在h到1之間為2(1-x)/(1-h)。
7.6 柯西分布隨機(jī)數(shù)
RANCAU(seed),seed為任意數(shù)值常數(shù)。產(chǎn)生位置參數(shù)為0,尺度參數(shù)為1的標(biāo)準(zhǔn)柯西分布隨機(jī)數(shù)。Y=alpha+beta*RANCAU(seed)為位置參數(shù)為alpha,尺度參數(shù)為beta的一般柯西分布隨機(jī)數(shù)。
7.7 二項(xiàng)分布隨機(jī)數(shù)
RANBIN(seed,n,p)產(chǎn)生參數(shù)為(n,p)的二項(xiàng)分布隨機(jī)數(shù),seed為任意數(shù)值。
7.8 泊松分布隨機(jī)數(shù)
RANPOI(seed,lambda)產(chǎn)生參數(shù)為lambda>0的泊松分布隨機(jī)數(shù),seed為任意數(shù)值。
7.9 一般離散分布隨機(jī)數(shù)
RANTBL(seed, p1, …, pn)生成取1,2,…,n的概率分別為p1,…,pn的離散分布隨機(jī)數(shù)。
八、樣本統(tǒng)計(jì)函數(shù)
樣本統(tǒng)計(jì)函數(shù)把輸入的自變量作為一組樣本,計(jì)算樣本統(tǒng)計(jì)量。其調(diào)用格式為“函數(shù)名(自變量1,自變量2,…,自變量n)”或者“函數(shù)名(OF 變量名列表)”。比如SUM是求和函數(shù),如果要求x1,x2,x3的和,可以用SUM(x1,x2,x3),也可以用SUM(OF x1-x3)。這些樣本統(tǒng)計(jì)函數(shù)只對(duì)自變量中的非缺失值進(jìn)行計(jì)算,比如求平均時(shí)把缺失值不計(jì)入內(nèi)。 數(shù)據(jù)分析師培訓(xùn)
8.1 MEAN 均值
8.2 MAX 最大值
8.3 MIN 最小值
8.4 N 非缺失數(shù)據(jù)的個(gè)數(shù)
8.5 NMISS 缺失數(shù)值的個(gè)數(shù)。
8.6 SUM 求和
8.7 VAR 方差
8.8 STD 標(biāo)準(zhǔn)差
8.9 STDERR 均值估計(jì)的標(biāo)準(zhǔn)誤差,用STD/SQRT(N)計(jì)算。
8.10 CV 變異系數(shù)
8.11 RANGE 極差
8.12 CSS 離差平方和
8.13 USS 平方和
8.14 SKEWNESS 偏度
8.15 KURTOSIS 峰度
數(shù)據(jù)分析咨詢(xún)請(qǐng)掃描二維碼
若不方便掃碼,搜微信號(hào):CDAshujufenxi
SQL Server 中 CONVERT 函數(shù)的日期轉(zhuǎn)換:從基礎(chǔ)用法到實(shí)戰(zhàn)優(yōu)化 在 SQL Server 的數(shù)據(jù)處理中,日期格式轉(zhuǎn)換是高頻需求 —— 無(wú)論 ...
2025-09-18MySQL 大表拆分與關(guān)聯(lián)查詢(xún)效率:打破 “拆分必慢” 的認(rèn)知誤區(qū) 在 MySQL 數(shù)據(jù)庫(kù)管理中,“大表” 始終是性能優(yōu)化繞不開(kāi)的話(huà)題。 ...
2025-09-18CDA 數(shù)據(jù)分析師:表結(jié)構(gòu)數(shù)據(jù) “獲取 - 加工 - 使用” 全流程的賦能者 表結(jié)構(gòu)數(shù)據(jù)(如數(shù)據(jù)庫(kù)表、Excel 表、CSV 文件)是企業(yè)數(shù)字 ...
2025-09-18DSGE 模型中的 Et:理性預(yù)期算子的內(nèi)涵、作用與應(yīng)用解析 動(dòng)態(tài)隨機(jī)一般均衡(Dynamic Stochastic General Equilibrium, DSGE)模 ...
2025-09-17Python 提取 TIF 中地名的完整指南 一、先明確:TIF 中的地名有哪兩種存在形式? 在開(kāi)始提取前,需先判斷 TIF 文件的類(lèi)型 —— ...
2025-09-17CDA 數(shù)據(jù)分析師:解鎖表結(jié)構(gòu)數(shù)據(jù)特征價(jià)值的專(zhuān)業(yè)核心 表結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 規(guī)范存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如數(shù)據(jù)庫(kù)表、Excel 表、 ...
2025-09-17Excel 導(dǎo)入數(shù)據(jù)含缺失值?詳解 dropna 函數(shù)的功能與實(shí)戰(zhàn)應(yīng)用 在用 Python(如 pandas 庫(kù))處理 Excel 數(shù)據(jù)時(shí),“缺失值” 是高頻 ...
2025-09-16深入解析卡方檢驗(yàn)與 t 檢驗(yàn):差異、適用場(chǎng)景與實(shí)踐應(yīng)用 在數(shù)據(jù)分析與統(tǒng)計(jì)學(xué)領(lǐng)域,假設(shè)檢驗(yàn)是驗(yàn)證研究假設(shè)、判斷數(shù)據(jù)差異是否 “ ...
2025-09-16CDA 數(shù)據(jù)分析師:掌控表格結(jié)構(gòu)數(shù)據(jù)全功能周期的專(zhuān)業(yè)操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(以 “行 - 列” 存儲(chǔ)的結(jié)構(gòu)化數(shù)據(jù),如 Excel 表、數(shù)據(jù) ...
2025-09-16MySQL 執(zhí)行計(jì)劃中 rows 數(shù)量的準(zhǔn)確性解析:原理、影響因素與優(yōu)化 在 MySQL SQL 調(diào)優(yōu)中,EXPLAIN執(zhí)行計(jì)劃是核心工具,而其中的row ...
2025-09-15解析 Python 中 Response 對(duì)象的 text 與 content:區(qū)別、場(chǎng)景與實(shí)踐指南 在 Python 進(jìn)行 HTTP 網(wǎng)絡(luò)請(qǐng)求開(kāi)發(fā)時(shí)(如使用requests ...
2025-09-15CDA 數(shù)據(jù)分析師:激活表格結(jié)構(gòu)數(shù)據(jù)價(jià)值的核心操盤(pán)手 表格結(jié)構(gòu)數(shù)據(jù)(如 Excel 表格、數(shù)據(jù)庫(kù)表)是企業(yè)最基礎(chǔ)、最核心的數(shù)據(jù)形態(tài) ...
2025-09-15Python HTTP 請(qǐng)求工具對(duì)比:urllib.request 與 requests 的核心差異與選擇指南 在 Python 處理 HTTP 請(qǐng)求(如接口調(diào)用、數(shù)據(jù)爬取 ...
2025-09-12解決 pd.read_csv 讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)的科學(xué)計(jì)數(shù)法問(wèn)題 為幫助 Python 數(shù)據(jù)從業(yè)者解決pd.read_csv讀取長(zhǎng)浮點(diǎn)數(shù)據(jù)時(shí)的科學(xué)計(jì)數(shù)法問(wèn)題 ...
2025-09-12CDA 數(shù)據(jù)分析師:業(yè)務(wù)數(shù)據(jù)分析步驟的落地者與價(jià)值優(yōu)化者 業(yè)務(wù)數(shù)據(jù)分析是企業(yè)解決日常運(yùn)營(yíng)問(wèn)題、提升執(zhí)行效率的核心手段,其價(jià)值 ...
2025-09-12用 SQL 驗(yàn)證業(yè)務(wù)邏輯:從規(guī)則拆解到數(shù)據(jù)把關(guān)的實(shí)戰(zhàn)指南 在業(yè)務(wù)系統(tǒng)落地過(guò)程中,“業(yè)務(wù)邏輯” 是連接 “需求設(shè)計(jì)” 與 “用戶(hù)體驗(yàn) ...
2025-09-11塔吉特百貨孕婦營(yíng)銷(xiāo)案例:數(shù)據(jù)驅(qū)動(dòng)下的精準(zhǔn)零售革命與啟示 在零售行業(yè) “流量紅利見(jiàn)頂” 的當(dāng)下,精準(zhǔn)營(yíng)銷(xiāo)成為企業(yè)突圍的核心方 ...
2025-09-11CDA 數(shù)據(jù)分析師與戰(zhàn)略 / 業(yè)務(wù)數(shù)據(jù)分析:概念辨析與協(xié)同價(jià)值 在數(shù)據(jù)驅(qū)動(dòng)決策的體系中,“戰(zhàn)略數(shù)據(jù)分析”“業(yè)務(wù)數(shù)據(jù)分析” 是企業(yè) ...
2025-09-11Excel 數(shù)據(jù)聚類(lèi)分析:從操作實(shí)踐到業(yè)務(wù)價(jià)值挖掘 在數(shù)據(jù)分析場(chǎng)景中,聚類(lèi)分析作為 “無(wú)監(jiān)督分組” 的核心工具,能從雜亂數(shù)據(jù)中挖 ...
2025-09-10統(tǒng)計(jì)模型的核心目的:從數(shù)據(jù)解讀到?jīng)Q策支撐的價(jià)值導(dǎo)向 統(tǒng)計(jì)模型作為數(shù)據(jù)分析的核心工具,并非簡(jiǎn)單的 “公式堆砌”,而是圍繞特定 ...
2025-09-10