2018-10-24
閱讀量:
930
pandas如何判斷缺失數(shù)據(jù)?
我想知道以后讀取有缺失值的數(shù)據(jù),怎么判斷是哪里缺失了?比如 只是在文本隨便寫的數(shù)據(jù)。
首先pandas讀取任何數(shù)據(jù)都要知道數(shù)據(jù)的格式信息,其他軟件工具也是一樣的,只有知道數(shù)據(jù)的分隔方式才能將數(shù)據(jù)中的元素準(zhǔn)確的定位對(duì)應(yīng)到dataframe中的索引。比如讀csv文件,那一定要給pandas傳達(dá)信息就是數(shù)據(jù)都是以逗號(hào)分隔的,不然pandas讀取數(shù)據(jù)失敗。如果用read_csv()來讀取不是以逗號(hào)分隔的csv,則一定要在函數(shù)參數(shù)中說明分隔參數(shù)是什么。
解決了這個(gè)問題之后pandas就知道哪有數(shù)據(jù)那沒數(shù)據(jù)了,這時(shí)他會(huì)用numpy的NAN來標(biāo)記缺失值。






評(píng)論(0)


暫無數(shù)據(jù)
CDA考試動(dòng)態(tài)
CDA報(bào)考指南
推薦帖子
0條評(píng)論
0條評(píng)論
0條評(píng)論
0條評(píng)論