2018-11-21
閱讀量:
833
數(shù)據(jù)質(zhì)量分析
數(shù)據(jù)質(zhì)量分析是數(shù)據(jù)挖掘中數(shù)據(jù)準(zhǔn)備過程的重要一環(huán), 是數(shù)據(jù)預(yù)處理的
前提, 也是數(shù)據(jù)挖掘分析結(jié)論有效性和準(zhǔn)確性的基礎(chǔ), 沒有可信的數(shù)據(jù), 數(shù)
據(jù)挖掘構(gòu)建的模型將是空中樓閣。
數(shù)據(jù)質(zhì)量分析的主要任務(wù)是檢查原始數(shù)據(jù)中是否存在臟數(shù)據(jù), 臟數(shù)據(jù)一
般是指不符合要求, 以及不能直接進(jìn)行相應(yīng)分析的數(shù)據(jù)。 在常見的數(shù)據(jù)挖掘
工作中, 臟數(shù)據(jù)包括:
·缺失值;
·異常值;
·不一致的值;
·重復(fù)數(shù)據(jù)及含有特殊符號(如#、 ¥、 *) 的數(shù)據(jù)。






評論(0)


暫無數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評論
0條評論
0條評論