2019-03-07
閱讀量:
902
缺失值處理方法-刪除元組的優(yōu)缺點(diǎn)有哪些?
問、缺失值處理方法-刪除元組的優(yōu)缺點(diǎn)有哪些?
答:
這個(gè)方法不難理解,也就是將存在遺漏信息屬性值的對(duì)象(元組,記錄)刪除,從而得到一個(gè)完備的信息表。
優(yōu)點(diǎn):簡單易行,且在對(duì)象有多個(gè)屬性缺失值、被刪除的含缺失值的對(duì)象與初始數(shù)據(jù)集的數(shù)據(jù)量相比非常小的情況下非常有效(其中類標(biāo)號(hào)缺失時(shí)通常使用該方法)。
缺點(diǎn):它是以減少歷史數(shù)據(jù)來換取信息的完備,同時(shí)會(huì)丟棄大量隱藏在這些對(duì)象中的信息。如若在初始數(shù)據(jù)集包含的對(duì)象很少的情況下,刪除少量對(duì)象足以影響結(jié)果的正確性;因此,當(dāng)缺失數(shù)據(jù)所占比例較大,特別當(dāng)遺漏數(shù)據(jù)非隨機(jī)分布時(shí),這種方法可能導(dǎo)致數(shù)據(jù)發(fā)生偏離,從而引出錯(cuò)誤的結(jié)論
說明:刪除元組,或者直接刪除該列特征,有時(shí)候會(huì)導(dǎo)致性能下降嚴(yán)重影響信息的客觀性,需要謹(jǐn)慎使用。






評(píng)論(0)


暫無數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論
0條評(píng)論