2018-10-18
閱讀量:
1043
python3 字符集編碼
ASCII 編碼
計算機是美國人發(fā)明的,所以,最早只有 127 個大小寫字母、數(shù)字和一些符號進入了編碼體系,這套編碼就是 ASCII 碼。
ASCII 編碼的局限性是該編碼只解決了將英語轉(zhuǎn)化為計算機能理解的語言的問題,對于中文、日文、韓文、等等其他語言的轉(zhuǎn)換,會出現(xiàn)亂碼,為了解決亂碼的國際問題,有了 Unicode 編碼。
Unicode 編碼
Unicode 編碼把所有語言都統(tǒng)一到一套編碼里面,這樣就不會有亂碼的問題了。python3 內(nèi)部使用的就是 unicode 編碼
但是隨之而來的新問題是,Unicode 編碼比 ASCII 編碼需要多一倍的存儲空間(原理在此不闡述,我也不懂,有興趣可以問問度娘),那么在存儲和傳輸上面就不劃算,為了解決這個問題,又將 Unicode 編碼轉(zhuǎn)化為 UTF-8 編碼。
UTF-8 編碼
因為解決了大部分語言編碼的問題,又被稱為萬國碼。
能將各個國家的各種語言隨意轉(zhuǎn)換。
GBK 編碼
GBK全稱《漢字內(nèi)碼擴展規(guī)范》,屬于國家標(biāo)準(zhǔn)。






評論(0)


暫無數(shù)據(jù)
推薦帖子
0條評論
0條評論
0條評論