從瀏覽器地址欄輸入url到顯示頁面的步驟
基礎版本
- 瀏覽器根據(jù)請求的
URL交給DNS域名解析,找到真實IP,向服務器發(fā)起請求; - 服務器交給后臺處理完成后返回數(shù)據(jù),瀏覽器接收文件(
HTML、JS、CSS、圖象等); - 瀏覽器對加載到的資源(
HTML、JS、CSS等)進行語法解析,建立相應的內(nèi)部數(shù)據(jù)結構(如HTML的DOM); - 載入解析到的資源文件,渲染頁面,完成。
詳細版
在瀏覽器地址欄輸入URL
-
瀏覽器查看緩存,如果請求資源在緩存中并且新鮮,跳轉(zhuǎn)到轉(zhuǎn)碼步驟
如果資源未緩存,發(fā)起新請求
如果已緩存,檢驗是否足夠新鮮,足夠新鮮直接提供給客戶端,否則與服務器進行驗證。
-
檢驗新鮮通常有兩個HTTP頭進行控制
Expires和
Cache-Control- HTTP1.0提供Expires,值為一個絕對時間表示緩存新鮮日期
- HTTP1.1增加了Cache-Control: max-age=,值為以秒為單位的最大新鮮時間
瀏覽器解析URL獲取協(xié)議,主機,端口,path
瀏覽器組裝一個HTTP(GET)請求報文
-
瀏覽器
獲取主機ip地址,過程如下:
- 瀏覽器緩存
- 本機緩存
- hosts文件
- 路由器緩存
- ISP DNS緩存
- DNS遞歸查詢(可能存在負載均衡導致每次IP不一樣)
-
打開一個socket與目標IP地址,端口建立TCP鏈接,三次握手如下:
- 客戶端發(fā)送一個TCP的SYN=1,Seq=X的包到服務器端口
- 服務器發(fā)回SYN=1, ACK=X+1, Seq=Y的響應包
- 客戶端發(fā)送ACK=Y+1, Seq=Z
TCP鏈接建立后發(fā)送HTTP請求
服務器接受請求并解析,將請求轉(zhuǎn)發(fā)到服務程序,如虛擬主機使用HTTP Host頭部判斷請求的服務程序
服務器檢查HTTP請求頭是否包含緩存驗證信息如果驗證緩存新鮮,返回304等對應狀態(tài)碼
處理程序讀取完整請求并準備HTTP響應,可能需要查詢數(shù)據(jù)庫等操作
服務器將響應報文通過TCP連接發(fā)送回瀏覽器
-
瀏覽器接收HTTP響應,然后根據(jù)情況選擇關閉TCP連接或者保留重用,關閉TCP連接的四次握手如下:
- 主動方發(fā)送Fin=1, Ack=Z, Seq= X報文
- 被動方發(fā)送ACK=X+1, Seq=Z報文
- 被動方發(fā)送Fin=1, ACK=X, Seq=Y報文
- 主動方發(fā)送ACK=Y, Seq=X報文
瀏覽器檢查響應狀態(tài)嗎:是否為1XX,3XX, 4XX, 5XX,這些情況處理與2XX不同
如果資源可緩存,進行緩存
對響應進行解碼(例如gzip壓縮)
根據(jù)資源類型決定如何處理(假設資源為HTML文檔)
解析HTML文檔,構件DOM樹,下載資源,構造CSSOM樹,執(zhí)行js腳本,這些操作沒有嚴格的先后順序,以下分別解釋
-
構建DOM樹:
- Tokenizing:根據(jù)HTML規(guī)范將字符流解析為標記
- Lexing:詞法分析將標記轉(zhuǎn)換為對象并定義屬性和規(guī)則
- DOM construction:根據(jù)HTML標記關系將對象組成DOM樹
解析過程中遇到圖片、樣式表、js文件,啟動下載
-
構建CSSOM樹:
- Tokenizing:字符流轉(zhuǎn)換為標記流
- Node:根據(jù)標記創(chuàng)建節(jié)點
- CSSOM:節(jié)點創(chuàng)建CSSOM樹
-
根據(jù)DOM樹和CSSOM樹構建渲染樹
- 從DOM樹的根節(jié)點遍歷所有可見節(jié)點,不可見節(jié)點包括:1)
script,meta這樣本身不可見的標簽。2)被css隱藏的節(jié)點,如display: none - 對每一個可見節(jié)點,找到恰當?shù)腃SSOM規(guī)則并應用
- 發(fā)布可視節(jié)點的內(nèi)容和計算樣式
- 從DOM樹的根節(jié)點遍歷所有可見節(jié)點,不可見節(jié)點包括:1)
-
js解析如下:
- 瀏覽器創(chuàng)建Document對象并解析HTML,將解析到的元素和文本節(jié)點添加到文檔中,此時document.readystate為loading
- HTML解析器遇到沒有async和defer的script時,將他們添加到文檔中,然后執(zhí)行行內(nèi)或外部腳本。這些腳本會同步執(zhí)行,并且在腳本下載和執(zhí)行時解析器會暫停。這樣就可以用document.write()把文本插入到輸入流中。同步腳本經(jīng)常簡單定義函數(shù)和注冊事件處理程序,他們可以遍歷和操作script和他們之前的文檔內(nèi)容
- 當解析器遇到設置了async屬性的script時,開始下載腳本并繼續(xù)解析文檔。腳本會在它下載完成后盡快執(zhí)行,但是解析器不會停下來等它下載。異步腳本禁止使用document.write(),它們可以訪問自己script和之前的文檔元素
- 當文檔完成解析,document.readState變成interactive
- 所有defer腳本會按照在文檔出現(xiàn)的順序執(zhí)行,延遲腳本能訪問完整文檔樹,禁止使用document.write()
- 瀏覽器在Document對象上觸發(fā)DOMContentLoaded事件
- 此時文檔完全解析完成,瀏覽器可能還在等待如圖片等內(nèi)容加載,等這些內(nèi)容完成載入并且所有異步腳本完成載入和執(zhí)行,document.readState變?yōu)閏omplete,window觸發(fā)load事件
顯示頁面(HTML解析過程中會逐步顯示頁面)
詳細簡版
- 從瀏覽器接收
url到開啟網(wǎng)絡請求線程(這一部分可以展開瀏覽器的機制以及進程與線程之間的關系) - 開啟網(wǎng)絡線程到發(fā)出一個完整的
HTTP請求(這一部分涉及到dns查詢,TCP/IP請求,五層因特網(wǎng)協(xié)議棧等知識) - 從服務器接收到請求到對應后臺接收到請求(這一部分可能涉及到負載均衡,安全攔截以及后臺內(nèi)部的處理等等)
- 后臺和前臺的
HTTP交互(這一部分包括HTTP頭部、響應碼、報文結構、cookie等知識,可以提下靜態(tài)資源的cookie優(yōu)化,以及編碼解碼,如gzip壓縮等) - 單獨拎出來的緩存問題,
HTTP的緩存(這部分包括http緩存頭部,ETag,catch-control等) - 瀏覽器接收到
HTTP數(shù)據(jù)包后的解析流程(解析html-詞法分析然后解析成dom樹、解析css生成css規(guī)則樹、合并成render樹,然后layout、painting渲染、復合圖層的合成、GPU繪制、外鏈資源的處理、loaded和DOMContentLoaded等) -
CSS的可視化格式模型(元素的渲染規(guī)則,如包含塊,控制框,BFC,IFC等概念) -
JS引擎解析過程(JS的解釋階段,預處理階段,執(zhí)行階段生成執(zhí)行上下文,VO,作用域鏈、回收機制等等) - 其它(可以拓展不同的知識模塊,如跨域,web安全,
hybrid模式等等內(nèi)容)