2019-01-12
閱讀量:
816
在分析中排除缺失值
確定了缺失值的位置以后,你需要在進(jìn)一步分析數(shù)據(jù)之前以某種方式刪除這些缺失值。原因
是,含有缺失值的算術(shù)表達(dá)式和函數(shù)的計(jì)算結(jié)果也是缺失值。舉例來說,考慮以下代碼:
x <- c(1, 2, NA, 3)
y <- x[1] + x[2] + x[3] + x[4]
z <- sum(x)
由于x中的第3個(gè)元素是缺失值,所以y和z也都是NA(缺失值)。
好在多數(shù)的數(shù)值函數(shù)都擁有一個(gè)na.rm=TRUE選項(xiàng),可以在計(jì)算之前移除缺失值并使用剩余
值進(jìn)行計(jì)算:
x <- c(1, 2, NA, 3)
y <- sum(x, na.rm=TRUE)
這里, y等于6。
在使用函數(shù)處理不完整的數(shù)據(jù)時(shí),請(qǐng)務(wù)必查閱它們的幫助文檔(例如, help(sum)),檢查
這些函數(shù)是如何處理缺失數(shù)據(jù)的。函數(shù)sum()只是我們將在第5章中討論的眾多函數(shù)之一,使用
這些函數(shù)可以靈活而輕松地轉(zhuǎn)換數(shù)據(jù)。
你可以通過函數(shù)na.omit()移除所有含有缺失值的觀測(cè)。 na.omit()可以刪除所有含有缺
失數(shù)據(jù)的行。






評(píng)論(0)


暫無數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論