數(shù)據(jù)庫導(dǎo)入導(dǎo)出時(shí)的編碼問題

導(dǎo)出時(shí)重定向,(右箭頭“>”符號(hào)),是操作系統(tǒng)來做存儲(chǔ),使用操作系統(tǒng)的編碼,比如windows powershell就會(huì)處理為UTF16,導(dǎo)入時(shí)會(huì)有一些問題

數(shù)據(jù)本身編碼,可能是亂碼,可以用python中的byte/str(或者python2中的unicode格式)轉(zhuǎn)換,使用encode/decode方法即可,比如input.decode('utf8').encode('latin1').decode('gbk').encode('utf8')

還要注意庫、表、字段的字符集設(shè)置,比如CHARSET/CHARACTER SET等,要與剛剛轉(zhuǎn)換好的一致
這里注意,同一服務(wù)的不同庫可能有不同設(shè)置,同一庫中可能不同表有不同設(shè)置,同一表中可能不同字段有不同設(shè)置

不論原始數(shù)據(jù)、過程中的數(shù)據(jù),編碼是怎樣的,只要保證最終轉(zhuǎn)換后的字符編碼、編碼命令配置是一致的,sql文件就準(zhǔn)備好了

導(dǎo)入的過程,如果登錄msyql命令行客戶端后使用source命令執(zhí)行sql文件中的命令,則編碼可能受系統(tǒng)終端、mysql終端等影響。使用navicat、jetbrains系列工具,或者使用python發(fā)送sql命令,可以避免發(fā)送命令時(shí)的編碼問題

最后,顯示數(shù)據(jù),mysql命令行客戶端在終端顯示正常,不能證明編碼正確,因?yàn)閙ysql命令行終端,也受到系統(tǒng)終端shell的影響,比如可能是UTF8 via latin1顯示出來的,就是經(jīng)過latin1編碼的UTF8內(nèi)容
使用sequel pro/navicat/python等工具作為客戶端,可以設(shè)置數(shù)據(jù)在顯示時(shí)的編碼方式,檢查并確認(rèn)編碼正確

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容