##設(shè)置工作空間
#把“數(shù)據(jù)及程序” 文件夾復(fù)制到F盤下, 再用setwd設(shè)置工作空間
setwd("F: /數(shù)據(jù)及程序/chapter3/示例程序")
#讀入數(shù)據(jù)
saledata=read.csv(file="./data/catering_sale.csv", header=TRUE)
#缺失值檢測(cè)并打印結(jié)果, 由于R把TRUE和FALSE分別當(dāng)作1、 0, 可以用sum() 和mean() 函數(shù)來(lái)分別獲取缺失
sum(complete.cases(saledata) )
sum(! complete.cases(saledata) )
mean(! complete.cases(saledata) )
saledata[! complete.cases(saledata) , ] #異常值檢測(cè)箱形圖
sp=boxplot(saledata$"銷量", boxwex=0.7)
title("銷量異常值檢測(cè)箱形圖")
xi=1.1
sd.s=sd(saledata[complete.cases(saledata) , ] $"銷量")
mn.s=mean(saledata[complete.cases(saledata) , ] $"銷量")
points(xi, mn.s, col="red", pch=18)
arrows(xi, mn.s - sd.s, xi, mn.s + sd.s, code = 3, col = "pink", angle = 75, length = .1
text(rep(c(1.05, 0.95) , length(sp$out) /2) , sp$out, sp$out, col="red")
運(yùn)行上面的程序, 可以看到缺失值個(gè)數(shù)輸出結(jié)果為“1”, 占樣本總量的
0.497%, 缺失值位于第15行, 2015年2月14日銷量缺失。
形圖的程序





