CGI
早期的Web服務(wù)器,只能響應(yīng)瀏覽器發(fā)來的HTTP靜態(tài)資源的請求,并將存儲在服務(wù)器中的靜態(tài)資源返回給瀏覽器。隨著Web技術(shù)的發(fā)展,逐漸出現(xiàn)了動態(tài)技術(shù),但是Web服務(wù)器并不能夠直接運(yùn)行動態(tài)腳本,為了解決Web服務(wù)器與外部應(yīng)用程序(CGI程序)之間數(shù)據(jù)互通,于是出現(xiàn)了CGI(Common Gateway Interface)通用網(wǎng)關(guān)接口。簡單理解,可以認(rèn)為CGI是Web服務(wù)器和運(yùn)行其上的應(yīng)用程序進(jìn)行“交流”的一種約定。

CGI是Web服務(wù)器和一個(gè)獨(dú)立的進(jìn)程之間的協(xié)議,它會把HTTP請求Request的Header頭設(shè)置成進(jìn)程的環(huán)境變量,HTTP請求的Body正文設(shè)置成進(jìn)程的標(biāo)準(zhǔn)輸入,進(jìn)程的標(biāo)準(zhǔn)輸出設(shè)置為HTTP響應(yīng)Response,包含Header頭和Body正文。

CGI 程序
CGI只是一個(gè)接口規(guī)范或協(xié)議,它的實(shí)現(xiàn)則與具體的編程語言相關(guān)。在2000年以前,CGI通用網(wǎng)關(guān)接口盛行,那個(gè)時(shí)候,Perl是編寫CGI的主流語言,以至于一般的CGI程序都是Perl程序。

通過CGI接口,Web服務(wù)器就能夠獲取客戶端傳遞的數(shù)據(jù),并轉(zhuǎn)交給服務(wù)器端的CGI程序處理,然后返回結(jié)果給客戶端。簡單來說,CGI實(shí)際上是一個(gè)接口標(biāo)準(zhǔn)。而通常所說的CGI指代其實(shí)是CGI程序,也就是實(shí)現(xiàn)了CGI接口標(biāo)準(zhǔn)的程序,只要編程語言具有標(biāo)準(zhǔn)輸入、標(biāo)準(zhǔn)輸出和環(huán)境變量,就可以用來編寫CGI程序。
CGI程序通過標(biāo)準(zhǔn)輸入(STDIN)和標(biāo)準(zhǔn)輸出(STDOUT)進(jìn)行數(shù)據(jù)的輸入輸出,此外CGI程序還通過環(huán)境變量來得到輸入,操作系統(tǒng)提供了許多環(huán)境變量,它們定義了程序的執(zhí)行環(huán)境,應(yīng)用程序可以存取它們。Web服務(wù)器和CGI接口又另外設(shè)置了一些環(huán)境變量,用來向CGI程序傳遞一些重要的參數(shù)。CGI的GET方法還通過環(huán)境變量QUERY_STRING向CGI程序傳遞Form表單中的數(shù)據(jù)。

對于一個(gè)CGI程序,主要的工作是從環(huán)境變量和標(biāo)準(zhǔn)輸入中讀取數(shù)據(jù),然后處理數(shù)據(jù),最后向標(biāo)準(zhǔn)輸出中輸出數(shù)據(jù)。
- 環(huán)境變量
環(huán)境變量中存儲的叫做Request Meta-Variables,也就是諸如QUERY_STRING、PATH_INFO之類的,這些都是由Web服務(wù)器通過環(huán)境變量傳遞給CGI程序的,CGI程序也是從環(huán)境變量中讀取的。 - 標(biāo)準(zhǔn)輸出
中存放的往往是用戶通過PUTS或POST提交的數(shù)據(jù),這些數(shù)據(jù)也是由Web服務(wù)器傳遞過來的。
為了處理動態(tài)請求,Web服務(wù)器會根據(jù)請求的內(nèi)容,F(xiàn)ork創(chuàng)建一個(gè)新進(jìn)程來運(yùn)行外部C程序或Perl腳本等,這個(gè)進(jìn)程會把處理完的數(shù)據(jù)返回給Web服務(wù)器,然后Web服務(wù)器把內(nèi)容發(fā)送給用戶,F(xiàn)ork創(chuàng)建出來的進(jìn)程也會隨之退出。如果下次用戶請求為動態(tài)腳本,那么Web服務(wù)器會再次Fork創(chuàng)建一個(gè)新進(jìn)程,如此周而復(fù)始的運(yùn)行。

以Nginx接收HTTP請求為例,Nginx接收一個(gè)HTTP請求后Fork創(chuàng)建出一個(gè)進(jìn)程,將HTTP請求帶來的參數(shù)作為輸入,執(zhí)行完程序處理后輸出,最終會摧毀這個(gè)Fork出來的進(jìn)程,并將輸出返回給客戶端。這種方式雖然簡單,但是需要不斷地Fork進(jìn)程和銷毀進(jìn)程。

CGI程序的工作原理
Web服務(wù)器一般只用來處理靜態(tài)文件請求,一旦碰到動態(tài)腳本請求,Web服務(wù)器主進(jìn)程就會Fork創(chuàng)建出一個(gè)新的進(jìn)程來啟動CGI程序,也就是將動態(tài)腳本交給CGI程序來處理。啟動CGI程序需要一個(gè)過程,如讀取配置文件、加載擴(kuò)展等。當(dāng)CGI程序啟動后會去解析動態(tài)腳本,然后將結(jié)果返回給Web服務(wù)器,最后由Web服務(wù)器將結(jié)果返回給客戶端,之前Fork出來的進(jìn)程也隨之關(guān)閉。這樣,每次用戶請求動態(tài)腳本,Web服務(wù)器都要重新Fork創(chuàng)建一個(gè)新進(jìn)程去啟動CGI程序,由CGI程序來處理動態(tài)腳本,處理完成后進(jìn)程隨之關(guān)閉,其效率是非常低下的。

PHP-CGI
CGI是一個(gè)協(xié)議,PHP語言對CGI接口規(guī)范的實(shí)現(xiàn)也就是PHP-CGI,也就是PHP的解釋器。隨著技術(shù)的發(fā)展,PHP-CGI的性能問題逐漸暴露,不是那么盡如人意。PHP在運(yùn)行的時(shí)候是依賴配置文件php.ini的,所以每當(dāng)PHP-CGI開始工作的時(shí)候,它完全是一個(gè)新進(jìn)程,需要重新加載PHP配置文件并初始化,這就造成了很大的資源和時(shí)間的浪費(fèi)。

每當(dāng)客戶端請求CGI時(shí),Web服務(wù)器就會請求操作系統(tǒng)生成一個(gè)新的CGI解釋器進(jìn)程php-cgi.exe,CGI的一個(gè)進(jìn)程處理完一個(gè)請求后退出,下一個(gè)請求來時(shí)在先操作系統(tǒng)申請創(chuàng)建新進(jìn)程。在訪問量較少沒有并發(fā)的情況下這樣做是沒有問題的,一旦出現(xiàn)訪問量增大,并發(fā)出現(xiàn)時(shí)這種方式就不再合適了,于是便出現(xiàn)了FastCGI。
Web服務(wù)器內(nèi)置模塊
后來出現(xiàn)了一種比較高效的方式:Web服務(wù)器內(nèi)置模塊。例如,Apache的mod_php模塊,將PHP解釋器做成模塊加載到Apache服務(wù)器中。這樣,Apache服務(wù)器在啟動的時(shí)候,就會同時(shí)啟動PHP模塊。當(dāng)客戶端請求PHP文件時(shí),Apache就不用再Fork創(chuàng)建出一個(gè)新進(jìn)程來啟動PHP解釋器,而是直接將PHP文件交給運(yùn)行中的PHP模塊處理。顯然這種方式下,效率會比較高。由于在Apache服務(wù)器啟動時(shí),才會讀取PHP的配置文件,加載PHP模塊。在Apache運(yùn)行過程中,不會在重新讀取PHP配置文件。所以,每次修改PHP的配置文件php.ini后,必須重啟Apache,新的PHP配置文件才會生效。
FastCGI
FastCGI是Web服務(wù)器與處理程序之間通信的一種協(xié)議,是CGI的改進(jìn)版本。由于CGI程序反復(fù)加載CGI而造成性能低下,如果CGI程序保持在內(nèi)存中并接收FastCGI進(jìn)程管理器調(diào)度,則可以提供良好的性能、伸縮性、Fail-Over特性等。
FastCGI就是常駐型的CGI,可以一直運(yùn)行。在請求到達(dá)時(shí)不會耗費(fèi)時(shí)間去Fork創(chuàng)建一個(gè)進(jìn)程來處理。FastCGI是語言無關(guān)的、可伸縮架構(gòu)的CGI開放擴(kuò)展,它將CGI解釋器進(jìn)程保持在內(nèi)存中,因此獲得較高的性能。
FastCGI的工作流程
1.Web服務(wù)器啟動時(shí)載入FastCGI進(jìn)程管理,如IIS的ISAPI、Apache的Module...
- FastCGI進(jìn)程管理器自身初始化,并啟動多個(gè)CGI解釋器進(jìn)程
php-cgi并等待Web服務(wù)器的連接。 - 當(dāng)客戶端請求到達(dá)Web服務(wù)器時(shí),F(xiàn)astCGI進(jìn)程管理器選擇并連接一個(gè)CGI解釋器,Web服務(wù)器將CGI環(huán)境變量和標(biāo)準(zhǔn)輸入發(fā)送到FastCGI子進(jìn)程PHP-CGI。
- FastCGI子進(jìn)程完成處理后將標(biāo)準(zhǔn)輸出和錯(cuò)誤信息,從同一連接返回給Web服務(wù)器。當(dāng)FastCGI子進(jìn)程關(guān)閉連接時(shí)請求便處理完畢。FastCGI子進(jìn)程接著等待并處理來自FastCGI進(jìn)程管理器(運(yùn)行在Web服務(wù)器中)的下一個(gè)連接。在CGI模式中,PHP-CGI在此便退出了。
PHP-FPM
FastCGI是一個(gè)協(xié)議,PHP-FPM實(shí)現(xiàn)了這個(gè)協(xié)議。FastCGI是CGI的改進(jìn)版,它是一個(gè)常駐內(nèi)存的CGI服務(wù)。常用的PHP-FPM就是在這種模式下運(yùn)行的,PHP-FPM負(fù)責(zé)Fork多個(gè)進(jìn)程,每個(gè)進(jìn)程都運(yùn)行著PHP解釋器。

在Nginx+PHP-FPM的組合中,Nginx負(fù)責(zé)接收HTTP請求并將請求封裝好交給PHP-FPM,PHP-FPM將請求按照一定的規(guī)則交給一個(gè)子進(jìn)程去處理,這個(gè)子進(jìn)程中的PHP解釋器會加載PHP代碼,也是因?yàn)檫@個(gè)原因,傳統(tǒng)的PHP只能作為Web服務(wù)器。我們發(fā)現(xiàn),Nginx+PHP-FPM的組合和Reactor+Worker子進(jìn)程的組合非常類似。
PHP的解釋器PHP-CGI只是一個(gè)CGI程序,它本身只能解析請求并返回結(jié)果,不會對進(jìn)程進(jìn)行管理,所以就出現(xiàn)了一些能夠調(diào)度PHP-CGI進(jìn)程的程序。PHP-FPM是PHP對FastCGI的一種具體實(shí)現(xiàn),是fast-cgi進(jìn)程管理工具。PHP-FPM啟動后會創(chuàng)建多個(gè)CGI子進(jìn)程,然后主進(jìn)程負(fù)責(zé)管理子進(jìn)程,同時(shí)對外提供一個(gè)socket,那么Web服務(wù)器當(dāng)要轉(zhuǎn)發(fā)一個(gè)動態(tài)請求時(shí),只需要按照FastCGI協(xié)議要求的格式將數(shù)據(jù)發(fā)往socket即可。PHP-FPM創(chuàng)建的子進(jìn)程去爭奪socket連接,誰搶到誰處理并將結(jié)果返回給Web服務(wù)器。當(dāng)其中一個(gè)子進(jìn)程異常退出時(shí),PHP-FPM主進(jìn)程會去監(jiān)控,一旦發(fā)現(xiàn)CGI子進(jìn)程就會又啟動一個(gè)。

Swoole
以Swoole作為HTTP服務(wù)器為例,首先Swoole內(nèi)部實(shí)現(xiàn)了HTTP服務(wù)器,也就不需要使用Nginx作為HTTP服務(wù)器,當(dāng)然Swoole并不是為了取代Nginx,實(shí)際上Swoole當(dāng)前實(shí)現(xiàn)的HTTP的功能非常有限,比如說只支持GET和POST,所以往往Swoole前面還要運(yùn)行一個(gè)Nginx作為前端的代理服務(wù)器。
Swoole是常駐內(nèi)存的,這一點(diǎn)和PHP-FPM不同,PHP-FPM中常駐的是PHP解釋器,PHP解釋器會重復(fù)加載PHP代碼并初始化環(huán)境。而Swoole只是在啟動的時(shí)候加載。如此一來性能自然會提高,這一點(diǎn)在開發(fā)中體現(xiàn)的比較明顯,例如在PHP-FPM下修改PHP代碼是會即時(shí)生效的,而在Swoole中式需要重啟Swoole的服務(wù)器才能使代碼生效。