網(wǎng)頁頁面亂碼問題檢查

頁面亂碼

1.問題介紹

頁面亂碼是用戶在瀏覽網(wǎng)頁時(shí)較大可能遇到得問題,這一類問題原因可能有很多。

首先我們可以分析到底有哪些可以指定本文本的具體編碼
1.文本前的BOM頭
2.http頭中得charset字段
3.用戶選擇編碼
4.html得meta標(biāo)簽中可以攜帶charset
5.自動(dòng)檢測(cè)(ICU)
6.父frame編碼

如果前六項(xiàng)都沒有檢查出來將使用默認(rèn)編碼

2.分析問題過程

由于知道檢查編碼順序,我們就可以一一梳理查看是哪里出現(xiàn)問題
通常情況下我們可以優(yōu)先查看這三個(gè)

1.查看cap包中http頭是否有填寫charset。服務(wù)器搭建者可能指定錯(cuò)了charset,也有可能在偶然情況下http服務(wù)器抽風(fēng)發(fā)送錯(cuò)誤charset或者沒有發(fā)charset
2.html頭部是不是丟了meta標(biāo)簽
3.進(jìn)入了自動(dòng)檢查流程,但是對(duì)于中文ICU檢查一般都不正常

前兩步驟都沒什么難度,主要是查看cap log中是否有正常的設(shè)置,以及和正常情況對(duì)比是否有差異。

如果前兩點(diǎn)都沒有問題,那么在
chromium_dev/chromium/src/third_party/WebKit/Source/core/html/parser/TextResourceDecoder.cpp得decode方法中
對(duì)最后得autodetect部分以及最后得result添加log,查看是否為自動(dòng)檢查的問題

3.相關(guān)調(diào)試技巧

本問題相關(guān)調(diào)試技巧主要涉及查看cap log

4.解決方法

如果是外部原因?qū)е拢鏷ttp服務(wù)器本該設(shè)置charset卻沒有設(shè)置等原因?qū)е?,則沒有太好的辦法可以解決。
如果是自動(dòng)檢查出現(xiàn)異常,則可能需要強(qiáng)制給與m_hintEncoding讓自動(dòng)檢查編碼模塊能夠優(yōu)先考慮該編碼。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容