爬蟲(chóng)筆記(九) - 編碼問(wèn)題的總結(jié)

當(dāng)你看到這個(gè)標(biāo)題,你首先要搞清楚2件事:

  1. 你是用的是什么操作系統(tǒng):Linux?Windows?
  2. 你是用的是哪個(gè)Python的版本:Python2? Python3?

除了這兩個(gè),你還要看下你使用的IDE Pycharm。好了直接進(jìn)入正題,首選看一下各種查編碼的方法

編碼查詢

Windows

Microsoft Windows [版本 6.1.7601]
版權(quán)所有 (c) 2009 Microsoft Corporation。保留所有權(quán)利。

C:\Users\administrator>CHCP
活動(dòng)代碼頁(yè): 936

在CMD下面直接執(zhí)行CHCP即可,也可以通過(guò)CMD屬性欄查詢,如下圖


image.png

Linux

root@debian symctltest # cat /etc/locale.gen | grep en_US
# en_US ISO-8859-1
# en_US.ISO-8859-15 ISO-8859-15
en_US.UTF-8 UTF-8
# en_US.UTF-8 UTF-8

root@debian symctltest # echo $LANG
en_US.UTF-8

目前我所使用的是一臺(tái)debian 8 的Linux系統(tǒng)。默認(rèn)的語(yǔ)言編碼在/etc/locale.gen,可以通過(guò)echo $LANG來(lái)查詢,如下圖


image.png

IDE Python2

>>> import sys
>>> sys.getdefaultencoding()
'ascii'
image.png

IDE Python3

>>> import sys
>>> sys.getdefaultencoding()
'utf-8'
image.png
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容