2018-10-17
閱讀量:
1116
無法將數(shù)據(jù)導(dǎo)入python
首先,我們在拿到一份數(shù)據(jù)時,要先看一下數(shù)據(jù)的文件類型,根據(jù)文件類型選擇相應(yīng)的導(dǎo)入方法,除此之外每個文件導(dǎo)入還需要設(shè)置編碼格式,一般默認(rèn)為UTF-8,常用的編碼格式有:gbk、unicode、ascii等,但是有些文件不一樣,這個時候可以用encoding參數(shù)對編碼格式進(jìn)行更改,如下:該文件用我們一般的編碼無法加載到python,我們可以用Notepad++查看編碼格式,發(fā)現(xiàn)是Shift_JIS,所以可以用以下方式讀取數(shù)據(jù)。

Shift_JIS是一個日本電腦系統(tǒng)常用的編碼表。它能容納全角及半角拉丁字母、平假名、片假名、符號及日語漢字。
它被命名為Shift_JIS的原因,是它在放置全角字符時,要避開原本在0xA1-0xDF放置的半角假名字符。
在微軟及IBM的日語電腦系統(tǒng)中,即使用了這個編碼表。這個編碼表稱為CP932。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論