頁面亂碼
1.問題介紹
頁面亂碼是用戶在瀏覽網(wǎng)頁時(shí)較大可能遇到得問題,這一類問題原因可能有很多。
首先我們可以分析到底有哪些可以指定本文本的具體編碼
1.文本前的BOM頭
2.http頭中得charset字段
3.用戶選擇編碼
4.html得meta標(biāo)簽中可以攜帶charset
5.自動(dòng)檢測(cè)(ICU)
6.父frame編碼
如果前六項(xiàng)都沒有檢查出來將使用默認(rèn)編碼
2.分析問題過程
由于知道檢查編碼順序,我們就可以一一梳理查看是哪里出現(xiàn)問題
通常情況下我們可以優(yōu)先查看這三個(gè)
1.查看cap包中http頭是否有填寫charset。服務(wù)器搭建者可能指定錯(cuò)了charset,也有可能在偶然情況下http服務(wù)器抽風(fēng)發(fā)送錯(cuò)誤charset或者沒有發(fā)charset
2.html頭部是不是丟了meta標(biāo)簽
3.進(jìn)入了自動(dòng)檢查流程,但是對(duì)于中文ICU檢查一般都不正常
前兩步驟都沒什么難度,主要是查看cap log中是否有正常的設(shè)置,以及和正常情況對(duì)比是否有差異。
如果前兩點(diǎn)都沒有問題,那么在
chromium_dev/chromium/src/third_party/WebKit/Source/core/html/parser/TextResourceDecoder.cpp得decode方法中
對(duì)最后得autodetect部分以及最后得result添加log,查看是否為自動(dòng)檢查的問題
3.相關(guān)調(diào)試技巧
本問題相關(guān)調(diào)試技巧主要涉及查看cap log
4.解決方法
如果是外部原因?qū)е拢鏷ttp服務(wù)器本該設(shè)置charset卻沒有設(shè)置等原因?qū)е?,則沒有太好的辦法可以解決。
如果是自動(dòng)檢查出現(xiàn)異常,則可能需要強(qiáng)制給與m_hintEncoding讓自動(dòng)檢查編碼模塊能夠優(yōu)先考慮該編碼。