SAS的KDE過程實現(xiàn)核密度估計,功能及其說明如下:
可以對單變量和雙變量進(jìn)行核密度估計,所謂的核(kernel)估計是一種非參數(shù)方法,是指從原始數(shù)據(jù)中觀測到的概率密度函數(shù)(PDF)——平均的通過數(shù)據(jù)點,從而創(chuàng)建平滑曲線。
KDE過程使用高斯密度做為核,并假設(shè)其方差決定平滑的結(jié)果。
其工作原理:選擇帶寬(bandwith),進(jìn)而核密度估計,但完成這些工作前提是完成數(shù)據(jù)的分箱(binning)、卷積(convolutions)和傅里葉(fourier)變換。

SAS程序常用選項
ods graphics on;
proc kde data=data_anl.performance;
*univar gcharacteristic(bwm=2) jaim(bwm=0.25)/plots=all ngrid=401;
*bivar gcharacteristic jaim/bivstats levels percentiles ngrid=60;
*bivar gcharacteristic jaim/method=snr bwm=2 plots=all;
*bivar (gcharacteristic jaim) (gcharacteristic(bwm=2) jaim(bwm=0.5));
run;
ods graphics off;
*ngrid表示圖形格子的數(shù)量;
*bwm表示帶寬乘數(shù)的指定,method表示帶寬的計算;
一般而言,單變量分析用于比較不同變量的分布情況,如檢測變量分布特征(尤其是自變量與因變量的分布)、數(shù)據(jù)離散化等應(yīng)用;雙變量分析用于檢測數(shù)據(jù)對應(yīng)分布情況,如聚類分析、異常檢測、回歸分析等應(yīng)用。






