問:mac電腦在使用pandas導(dǎo)入數(shù)據(jù)的時(shí)候,有時(shí)候會出現(xiàn)中文亂碼問題,如圖,怎么辦?

答:一般在導(dǎo)入數(shù)據(jù)時(shí),把格式調(diào)成python是可以成功導(dǎo)入的。使用參數(shù):engine=‘python’。但是由于編碼不同的原因,mac電腦使用不行。
加入?yún)?shù) encoding=‘utf-8’還是不能成功導(dǎo)入,說明里面存在非‘utf-8‘模式的編碼。這時(shí)可以選擇切換編碼模式為 encoding=‘gbk’。
GBK即漢字內(nèi)碼擴(kuò)展規(guī)范,K為擴(kuò)展的漢語拼音中"擴(kuò)"字的聲母。英文全稱Chinese Internal Code Specification。GBK編碼標(biāo)準(zhǔn)兼容GB2312,共收錄漢字21003個(gè)、
符號883個(gè),并提供1894個(gè)造字碼位,簡、繁體字融于一庫。GBK采用雙字節(jié)表示,總體編碼范圍為8140-FEFE,首字節(jié)在81-FE 之間,尾字節(jié)在40-FE 之間,
剔除 xx7F一條線??傆?jì)23940 個(gè)碼位,共收入21886個(gè)漢字和圖形符號,其中漢字(包括部首和構(gòu)件)21003 個(gè),圖形符號883 個(gè)。P-Windows3.2和
蘋果OS以GB2312為基本漢字編碼, Windows 95/98則以GBK為基本漢字編碼。








暫無數(shù)據(jù)