Nginx工作原理(Master+Worker

Nginx工作原理(Master+Worker)

1. Nginx
  首先要明白,Nginx 采用的是多進程(單線程) & 多路IO復(fù)用模型。使用了 I/O 多路復(fù)用技術(shù)的 Nginx,就成了”并發(fā)事件驅(qū)動“的服務(wù)器。

image

2. 多進程的工作模式

  • 1、Nginx 在啟動后,會有一個 master 進程和多個相互獨立的 worker 進程。
  • 2、接收來自外界的信號,向各worker進程發(fā)送信號,每個進程都有可能來處理這個連接。
  • 3、 master 進程能監(jiān)控 worker 進程的運行狀態(tài),當(dāng) worker 進程退出后(異常情況下),會自動啟動新的 worker 進程。

3.注意:

worker 進程數(shù),一般會設(shè)置成機器 cpu 核數(shù)。因為更多的worker 數(shù),只會導(dǎo)致進程相互競爭 cpu,從而帶來不必要的上下文切換。

使用多進程模式,不僅能提高并發(fā)率,而且進程之間相互獨立,一個 worker 進程掛了不會影響到其他 worker 進程。

4.驚群現(xiàn)象

  • 主進程(master 進程)首先通過 socket() 來創(chuàng)建一個 sock 文件描述符用來監(jiān)聽,然后fork生成子進程(workers 進程),子進程將繼承父進程的 sockfd(socket 文件描述符),之后子進程 accept() 后將創(chuàng)建已連接描述符(connected descriptor)),然后通過已連接描述符來與客戶端通信。
  • 那么,由于所有子進程都繼承了父進程的 sockfd,那么當(dāng)連接進來時,所有子進程都將收到通知并“爭著”與它建立連接,這就叫“驚群現(xiàn)象”。大量的進程被激活又掛起,只有一個進程可以accept() 到這個連接,這當(dāng)然會消耗系統(tǒng)資源。

5.Nginx對驚群現(xiàn)象的處理:
  Nginx 提供了一個 accept_mutex 這個東西,這是一個加在accept上的一把互斥鎖。即每個 worker 進程在執(zhí)行 accept 之前都需要先獲取鎖,獲取不到就放棄執(zhí)行 accept()。有了這把鎖之后,同一時刻,就只會有一個進程去 accpet(),這樣就不會有驚群問題了。accept_mutex 是一個可控選項,我們可以顯示地關(guān)掉,默認(rèn)是打開的。

6.worker進程工作流程
  當(dāng)一個 worker 進程在 accept() 這個連接之后,就開始讀取請求,解析請求,處理請求,產(chǎn)生數(shù)據(jù)后,再返回給客戶端,最后才斷開連接,一個完整的請求。一個請求,完全由 worker 進程來處理,而且只能在一個 worker 進程中處理。

這樣做帶來的好處:

  • 1、節(jié)省鎖帶來的開銷。每個 worker 進程都是獨立的進程,不共享資源,不需要加鎖。同時在編程以及問題查上時,也會方便很多。
  • 2、獨立進程,減少風(fēng)險。采用獨立的進程,可以讓互相之間不會影響,一個進程退出后,其它進程還在工作,服務(wù)不會中斷,master 進程則很快重新啟動新的 worker 進程。當(dāng)然,worker 進程的也能發(fā)生意外退出。

7.多進程模型每個進程/線程只能處理一路IO,那么 Nginx是如何處理多路IO呢?

  1. 如果不使用 IO 多路復(fù)用,那么在一個進程中,同時只能處理一個請求,比如執(zhí)行 accept(),如果沒有連接過來,那么程序會阻塞在這里,直到有一個連接過來,才能繼續(xù)向下執(zhí)行。
  2. 而多路復(fù)用,允許我們只在事件發(fā)生時才將控制返回給程序,而其他時候內(nèi)核都掛起進程,隨時待命。

核心:Nginx采用的 IO多路復(fù)用模型epoll
  epoll通過在Linux內(nèi)核中申請一個簡易的文件系統(tǒng)(文件系統(tǒng)一般用什么數(shù)據(jù)結(jié)構(gòu)實現(xiàn)?B+樹),其工作流程分為三部分:

  • 1、調(diào)用 int epoll_create(int size)建立一個epoll對象,內(nèi)核會創(chuàng)建一個eventpoll結(jié)構(gòu)體,用于存放通過epoll_ctl()向epoll對象中添加進來的事件,這些事件都會掛載在紅黑樹中。
  • 2、調(diào)用 int epoll_ctl(int epfd, int op, int fd, struct epoll_event *event) 在 epoll 對象中為 fd 注冊事件,所有添加到epoll中的事件都會與設(shè)備驅(qū)動程序建立回調(diào)關(guān)系,也就是說,當(dāng)相應(yīng)的事件發(fā)生時會調(diào)用這個sockfd的回調(diào)方法,將sockfd添加到eventpoll 中的雙鏈表。
  • 3、調(diào)用 int epoll_wait(int epfd, struct epoll_event * events, int maxevents, int timeout) 來等待事件的發(fā)生,timeout 為 -1 時,該調(diào)用會阻塞知道有事件發(fā)生

這樣,注冊好事件之后,只要有 fd 上事件發(fā)生,epoll_wait() 就能檢測到并返回給用戶,用戶就能”非阻塞“地進行 I/O 了。

epoll() 中內(nèi)核則維護一個鏈表,epoll_wait 直接檢查鏈表是不是空就知道是否有文件描述符準(zhǔn)備好了。(epoll 與 select 相比最大的優(yōu)點是不會隨著 sockfd 數(shù)目增長而降低效率,使用 select() 時,內(nèi)核采用輪訓(xùn)的方法來查看是否有fd 準(zhǔn)備好,其中的保存 sockfd 的是類似數(shù)組的數(shù)據(jù)結(jié)構(gòu) fd_set,key 為 fd,value 為 0 或者 1。)

能達到這種效果,是因為在內(nèi)核實現(xiàn)中 epoll 是根據(jù)每個 sockfd 上面的與設(shè)備驅(qū)動程序建立起來的回調(diào)函數(shù)實現(xiàn)的。那么,某個 sockfd 上的事件發(fā)生時,與它對應(yīng)的回調(diào)函數(shù)就會被調(diào)用,來把這個 sockfd 加入鏈表,其他處于“空閑的”狀態(tài)的則不會。在這點上,epoll 實現(xiàn)了一個”偽”AIO。但是如果絕大部分的 I/O 都是“活躍的”,每個 socket 使用率很高的話,epoll效率不一定比 select 高(可能是要維護隊列復(fù)雜)。

可以看出,因為一個進程里只有一個線程,所以一個進程同時只能做一件事,但是可以通過不斷地切換來“同時”處理多個請求。

8.例子:

Nginx 會注冊一個事件:“如果來自一個新客戶端的連接請求到來了,再通知我”,此后只有連接請求到來,服務(wù)器才會執(zhí)行 accept() 來接收請求。又比如向上游服務(wù)器(比如 PHP-FPM)轉(zhuǎn)發(fā)請求,并等待請求返回時,這個處理的 worker 不會在這阻塞,它會在發(fā)送完請求后,注冊一個事件:“如果緩沖區(qū)接收到數(shù)據(jù)了,告訴我一聲,我再將它讀進來”,于是進程就空閑下來等待事件發(fā)生。

這樣,基于 多進程+epoll, Nginx 便能實現(xiàn)高并發(fā)。

使用 epoll 處理事件的一個框架,代碼轉(zhuǎn)自:http://www.cnblogs.com/fnlingnzb-learner/p/5835573.html

[
復(fù)制代碼

](javascript:void(0); "復(fù)制代碼")

<pre style="margin: 0px; padding: 0px; white-space: pre-wrap; overflow-wrap: break-word; font-family: "Courier New" !important; font-size: 12px !important;">for( ; ; ) // 無限循環(huán)
{
nfds = epoll_wait(epfd,events,20,500); // 最長阻塞 500s
for(i=0;i<nfds;++i)
{ if(events[i].data.fd==listenfd) //有新的連接
{
connfd = accept(listenfd,(sockaddr )&clientaddr, &clilen); //accept這個連接
ev.data.fd=connfd;
ev.events=EPOLLIN|EPOLLET;
epoll_ctl(epfd,EPOLL_CTL_ADD,connfd,&ev); //將新的fd添加到epoll的監(jiān)聽隊列中
} else if( events[i].events&EPOLLIN ) //接收到數(shù)據(jù),讀socket
{
n = read(sockfd, line, MAXLINE)) < 0 //讀
ev.data.ptr = md; //md為自定義類型,添加數(shù)據(jù)
ev.events=EPOLLOUT|EPOLLET;
epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev);//修改標(biāo)識符,等待下一個循環(huán)時發(fā)送數(shù)據(jù),異步處理的精髓
} else if(events[i].events&EPOLLOUT) //有數(shù)據(jù)待發(fā)送,寫socket
{ struct myepoll_data
md = (myepoll_data)events[i].data.ptr; //取數(shù)據(jù)
sockfd = md->fd;
send( sockfd, md->ptr, strlen((char
)md->ptr), 0 ); //發(fā)送數(shù)據(jù)
ev.data.fd=sockfd;
ev.events=EPOLLIN|EPOLLET;
epoll_ctl(epfd,EPOLL_CTL_MOD,sockfd,&ev); //修改標(biāo)識符,等待下一個循環(huán)時接收數(shù)據(jù)
} else { //其他的處理
}
}
}</pre>

[
復(fù)制代碼

](javascript:void(0); "復(fù)制代碼")

9.Nginx 與 多進程模式 Apache 的比較:
事件驅(qū)動適合于I/O密集型服務(wù),多進程或線程適合于CPU密集型服務(wù):

  • 1、Nginx 更主要是作為反向代理,而非Web服務(wù)器使用。其模式是事件驅(qū)動。
  • 2、事件驅(qū)動服務(wù)器,最適合做的就是這種 I/O 密集型工作,如反向代理,它在客戶端與WEB服務(wù)器之間起一個數(shù)據(jù)中轉(zhuǎn)作用,純粹是 I/O 操作,自身并不涉及到復(fù)雜計算。因為進程在一個地方進行計算時,那么這個進程就不能處理其他事件了。
  • 3、Nginx 只需要少量進程配合事件驅(qū)動,幾個進程跑 libevent,不像 Apache 多進程模型那樣動輒數(shù)百的進程數(shù)。
  • 4、Nginx 處理靜態(tài)文件效果也很好,那是因為讀寫文件和網(wǎng)絡(luò)通信其實都是 I/O操作,處理過程一樣。

原文鏈接:https://blog.csdn.net/kim_weir/article/details/80036462

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容