【python】編碼問題

0x01 問題描述

# coding:utf-8

a = '發(fā)順豐'
b = a.encode('gb2312')
print b

# 報錯
UnicodeDecodeError: 'ascii' codec can't decode byte 0xe5 
in position 0: ordinal not in range(128)

py報出上面錯誤是因為,文檔存儲的時候是以utf-8的編碼格式存儲的,在內(nèi)存中執(zhí)行代碼的時候會自動解碼成unicode,但是它默認是以ASCII進行解碼的,中文沒法用ASCII解碼,所以報錯

0x02 解決方案

  • 編碼的時候指明從哪種編碼類型解碼
a = '發(fā)順豐'
b = a.decode('utf-8').encode('gb2312')
print b
  • 設(shè)置模塊的整體解碼類型
import sys
reload(sys)
sys.setdefaultencoding('utf-8')

a = '發(fā)順豐'
b = a.encode('gb2312')
print b

歡迎關(guān)注微信公眾號(coder0x00)或掃描下方二維碼關(guān)注,我們將持續(xù)搜尋程序員必備基礎(chǔ)技能包提供給大家。


最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 編碼問題一直困擾著開發(fā)人員,尤其在 Java 中更加明顯,因為 Java 是跨平臺語言,不同平臺之間編碼之間的切換...
    x360閱讀 2,581評論 1 20
  • 字符集和編碼簡介 在編程中常常可以見到各種字符集和編碼,包括ASCII,MBCS,Unicode等字符集。確切的說...
    蘭山小亭閱讀 9,081評論 0 13
  • 什么是編碼 任何一種語言、文字、符號等等,計算都是將其以一種類似字典的形式存起來的,比如最早的計算機系統(tǒng)將英文文字...
    隨風(fēng)化作雨閱讀 1,657評論 1 2
  • 大概每個人在使用軟件時都遇到過亂碼的問題,這是由于字符的編碼和解碼方式不一致導(dǎo)致,我們知道計算機只認識二進制數(shù)據(jù),...
    楚客閱讀 1,539評論 1 9
  • 寸金難買寸金絲 金絲楠木長金枝 群生村野數(shù)百年 價值連城無人知 江西塔前村民癡 守著金山而不知 錯把金絲當水楠 老...
    秋AldrichB果閱讀 620評論 1 8

友情鏈接更多精彩內(nèi)容