導(dǎo)出時(shí)重定向,(右箭頭“>”符號(hào)),是操作系統(tǒng)來做存儲(chǔ),使用操作系統(tǒng)的編碼,比如windows powershell就會(huì)處理為UTF16,導(dǎo)入時(shí)會(huì)有一些問題
數(shù)據(jù)本身編碼,可能是亂碼,可以用python中的byte/str(或者python2中的unicode格式)轉(zhuǎn)換,使用encode/decode方法即可,比如input.decode('utf8').encode('latin1').decode('gbk').encode('utf8')
還要注意庫、表、字段的字符集設(shè)置,比如CHARSET/CHARACTER SET等,要與剛剛轉(zhuǎn)換好的一致
這里注意,同一服務(wù)的不同庫可能有不同設(shè)置,同一庫中可能不同表有不同設(shè)置,同一表中可能不同字段有不同設(shè)置
不論原始數(shù)據(jù)、過程中的數(shù)據(jù),編碼是怎樣的,只要保證最終轉(zhuǎn)換后的字符編碼、編碼命令配置是一致的,sql文件就準(zhǔn)備好了
導(dǎo)入的過程,如果登錄msyql命令行客戶端后使用source命令執(zhí)行sql文件中的命令,則編碼可能受系統(tǒng)終端、mysql終端等影響。使用navicat、jetbrains系列工具,或者使用python發(fā)送sql命令,可以避免發(fā)送命令時(shí)的編碼問題
最后,顯示數(shù)據(jù),mysql命令行客戶端在終端顯示正常,不能證明編碼正確,因?yàn)閙ysql命令行終端,也受到系統(tǒng)終端shell的影響,比如可能是UTF8 via latin1顯示出來的,就是經(jīng)過latin1編碼的UTF8內(nèi)容
使用sequel pro/navicat/python等工具作為客戶端,可以設(shè)置數(shù)據(jù)在顯示時(shí)的編碼方式,檢查并確認(rèn)編碼正確