PHP執(zhí)行原理**
php是一門應(yīng)用非常簡單,開發(fā)效率極高的一門語言,其弱類型的變量能省去程序員大量的定義變量、類型轉(zhuǎn)換等的時間和精力。它是一種適用于web開發(fā)的動態(tài)語言。
1. php設(shè)計(jì)的原理和特點(diǎn)
- 多進(jìn)程模型:這樣能做到進(jìn)程間互相不受影響,對于進(jìn)程的資源利用更快速、便捷
- 弱類型語言:和強(qiáng)類型語言C、C++、java等語言不同,php中變量的類型并不是一開始就確定的,他是在運(yùn)行時才確定的,可以隱式或顯式的對其進(jìn)行類型轉(zhuǎn)換,這就使其在開發(fā)中非常的靈活,程序員無需關(guān)注變量類型的問題
- Zend引擎+ 組件(ext)的模式降低內(nèi)部的耦合
- 中間層(sapi)隔絕web server 和php
- 語法簡單靈活,規(guī)范少。這一點(diǎn)就有利有弊了。。。
2. php的四層體系

php從上到下一共四層體系:
- Zend引擎:Zend整體用C實(shí)現(xiàn),是php的內(nèi)核部分,它將php的代碼翻譯成可執(zhí)行的opcode的,處理并實(shí)現(xiàn)相應(yīng)的處理方法(原理:鳥哥的博客)、實(shí)現(xiàn)了基本的數(shù)據(jù)結(jié)構(gòu)、內(nèi)存分配及管理、提供了相應(yīng)api方法供外部使用,是一切的核心。
- Extensions:圍繞著Zend引擎,extensions通過組件的方式提供各種基礎(chǔ)服務(wù),常用的內(nèi)置函數(shù)array、標(biāo)準(zhǔn)庫等都是通過extension來實(shí)現(xiàn)的,用戶也可以根據(jù)需要實(shí)現(xiàn)自己的extension以達(dá)到功能擴(kuò)展等目的如貼吧正在使用的 PHP中間層、富文本解析就是extension的典型應(yīng)用)。
- Sapi:Sapi全稱Server Application Programing Interface, 也就是服務(wù)端應(yīng)用編程接口,Sapi通過一些列鉤子函數(shù),使php可以和外圍交互數(shù)據(jù),這是PHP非常優(yōu)雅和成功的一個設(shè)計(jì),通過 sapi成功的將PHP本身和上層應(yīng)用解耦隔離,PHP可以不再考慮如何針對不同應(yīng)用進(jìn)行兼容,而應(yīng)用本身也可以針對自己的特點(diǎn)實(shí)現(xiàn)不同的處理方式。
- 上層應(yīng)用:這就是程序員編寫的應(yīng)用程序,通過不同的sapi方式得到各種各樣的應(yīng)用模式,如通過webserver實(shí)現(xiàn)web應(yīng)用,在命令行下以腳本的方式運(yùn)行等等
3. Sapi
如前所屬,Sapi通過一些列的接口,使外部應(yīng)用可以和php交換數(shù)據(jù)并可以根據(jù)不同的應(yīng)用特點(diǎn)實(shí)現(xiàn)特定的處理方法,常見的sapi有:
- apache2handler:以apache作為webserver,采用MOD_PHP模式運(yùn)行時候的處理方式,也是現(xiàn)在應(yīng)用最廣泛的一種
- cgi:這是webserver和php的另外一種交互方式,也就是fastcgi協(xié)議
- cli:命令調(diào)試應(yīng)用模式
4. php代碼的執(zhí)行流程

從圖中可以看出,php通過Zend引擎實(shí)現(xiàn)了一個典型的動態(tài)語言的執(zhí)行過程:獲取一段代碼片段,經(jīng)過詞法解析、語法解析等階段,源程序被翻譯成一個個指令(opcodes),然后Zend虛擬機(jī)順序執(zhí)行這些指令。PHP本身是用C語言實(shí)現(xiàn)的,因此最終調(diào)用的也是C語言的函數(shù)。
PHP的執(zhí)行的核心是翻譯出來的一條一條指令,也即opcode
Opcode是PHP程序執(zhí)行的最基本單位。一個opcode由兩個參數(shù)(op1,op2)、返回值和處理函數(shù)組成。PHP程序最終被翻譯為一組opcode處理函數(shù)的順序執(zhí)行。
常用的幾個函數(shù):
- END_ASSIGN_SPEC_CV_CV_HANDLER : 變量分配 ( a=b)
- ZEND_DO_FCALL_BY_NAME_SPEC_HANDLER:函數(shù)調(diào)用
- ZEND_CONCAT_SPEC_CV_CV_HANDLER:字符串拼接 a.b
- ZEND_ADD_SPEC_CV_CONST_HANDLER: 加法運(yùn)算a+2
- ZEND_IS_EQUAL_SPEC_CV_CONST:判斷相等 a==1
- ZEND_IS_IDENTICAL_SPEC_CV_CONST:判斷相等 a===1
5. Zend引擎介紹
Zend引擎作為php的內(nèi)核,主要的設(shè)計(jì)機(jī)制有:
5.1 實(shí)現(xiàn)HashTable數(shù)據(jù)結(jié)構(gòu)
HashTable是Zend的核心數(shù)據(jù)結(jié)構(gòu),在php里面幾乎用來實(shí)現(xiàn)所有功能,php的數(shù)據(jù)array()就是典型的應(yīng)用。此外在Zend內(nèi)部,如函數(shù)符號表、全景變量都是通過HashTable來實(shí)現(xiàn)的。
Zend hash table 實(shí)現(xiàn)了典型的hash表散列結(jié)構(gòu),同時通過附加一個雙向鏈表,提供了正向、反向、遍歷數(shù)組的功能,結(jié)構(gòu)如圖:

可以看到,在hash table中既有key->value形式的散列結(jié)構(gòu),也有雙向鏈表模式,使得它能夠非常方便的支持快速查找和線性遍歷。
** 散列結(jié)構(gòu)**:Zend的散列結(jié)構(gòu)是典型的hash表模型,通過鏈表的方式來解決沖突。需要注意的是zend的hash table是一個自增長的數(shù)據(jù)結(jié)構(gòu),當(dāng)hash表數(shù)目滿了之后,其本身會動態(tài)以2倍的方式擴(kuò)容并重新元素位置。初始大小均為8。另外,在進(jìn)行 key->value快速查找時候,zend本身還做了一些優(yōu)化,通過空間換時間的方式加快速度。比如在每個元素中都會用一個變量 nKeyLength標(biāo)識key的長度以作快速判定。
雙向鏈表:Zend hash table通過一個鏈表結(jié)構(gòu),實(shí)現(xiàn)了元素的線性遍歷。理論上,做遍歷使用單向鏈表就夠了,之所以使用雙向鏈表,主要目的是為了快速刪除,避免遍歷。 Zend hash table是一種復(fù)合型的結(jié)構(gòu),作為數(shù)組使用時,即支持常見的關(guān)聯(lián)數(shù)組也能夠作為順序索引數(shù)字來使用,甚至允許2者的混合。
PHP關(guān)聯(lián)數(shù)組:關(guān)聯(lián)數(shù)組是典型的hash_table應(yīng)用。一次查詢過程經(jīng)過如下幾步(從代碼可以看出,這是一個常見的hash查詢過程并增加一些快速判定加速查找):
01 getKeyHashValue h;
02 index = n & nTableMask;
03 Bucket *p = arBucket[index];
04 while (p) {
05 if ((p->h == h) && (p->nKeyLength == nKeyLength)) {
06 RETURN p->data;
07 }
08 p=p->next;
09 }
10 RETURN FALTURE;
PHP索引數(shù)組:索引數(shù)組就是我們常見的數(shù)組,通過下標(biāo)訪問。例如 arr[0],Zend HashTable內(nèi)部進(jìn)行了歸一化處理,對于index類型key同樣分配了hash值和nKeyLength(為0)。內(nèi)部成員變量 nNextFreeElement就是當(dāng)前分配到的最大id,每次push后自動加一。正是這種歸一化處理,PHP才能夠?qū)崿F(xiàn)關(guān)聯(lián)和非關(guān)聯(lián)的混合。由于 push操作的特殊性,索引key在PHP數(shù)組中先后順序并不是通過下標(biāo)大小來決定,而是由push的先后決定。例如 arr[1] = 2; arr[2] = 3;對于double類型的key,Zend HashTable會將他當(dāng)做索引key處理
5.2 PHP變量的實(shí)現(xiàn)原理
PHP是一門弱類型語言,不嚴(yán)格區(qū)分變量的類型。PHP的變量可以分為簡單類型(int、sting、bool)、集合類型(array, resource, object) 和常量(const),所有的變量在底層都所以同一種結(jié)構(gòu)zval
zval是zend中非常重要的數(shù)據(jù)結(jié)構(gòu),用來標(biāo)示并實(shí)現(xiàn)php的變量,其數(shù)據(jù)結(jié)構(gòu)如下:
struct _zval_struct {
zvalue_value value; /* value */
zend_uint refcount__gc; /* variable ref count */
zend_uchar type; /* active type */
zend_uchar is_ref__gc; /* if it is a ref variable */
};
typedef struct _zval_struct zval;
其中,
- zval_value value是變量的實(shí)際值,具體來說是一個zvalue_value聯(lián)合體:
typedef union _zvalue_value {
long lval; /* long value */
double dval; /* double value */
struct { /* string */
char *val;
int len;
} str;
HashTable *ht; /* hash table value,used for array */
zend_object_value obj; /* object */
} zvalue_value;
- zend_uint refcount__gc是一個計(jì)數(shù)器,用來保存多少變量(或者符號,symbols )指向了該zval。在變量生成時,其refcount=1,典型的賦值操作如$a = $b會令zval的refcount加1,而unset操作會相應(yīng)的減1。在PHP5.3之前,使用引用計(jì)數(shù)的機(jī)制來實(shí)現(xiàn)GC,如果一個zval的refcount較少到0,那么Zend引擎會認(rèn)為沒有任何變量指向該zval,因此會釋放該zval所占的內(nèi)存空間。但,事情有時并不會那么簡單。后面我們會看到,單純的引用計(jì)數(shù)機(jī)制無法GC掉循環(huán)引用的zval,即使指向該zval的變量已經(jīng)被unset,從而導(dǎo)致了內(nèi)存泄露(Memory Leak)。
- zend_uchar type該字段用于表明變量的實(shí)際類型。PHP中的變量包括四種標(biāo)量類型(bool,int,float,string),兩種復(fù)合類型(array, object)和兩種特殊的類型(resource 和NULL)。在zend內(nèi)部,這些類型對應(yīng)于下面的宏(代碼位置 phpsrc/Zend/zend.h)
#define IS_NULL 0
#define IS_LONG 1
#define IS_DOUBLE 2
#define IS_BOOL 3
#define IS_ARRAY 4
#define IS_OBJECT 5
#define IS_STRING 6
#define IS_RESOURCE 7
#define IS_CONSTANT 8
#define IS_CONSTANT_ARRAY 9
#define IS_CALLABLE 10
- is_ref__gc這個字段用于標(biāo)記變量是否是引用變量。對于普通的變量,該值為0,而對于引用型的變量,該值為1。這個變量會影響zval的共享、分離等
5.2.1 整數(shù)、浮點(diǎn)數(shù)變量
整數(shù)、浮點(diǎn)數(shù)是PHP中的基礎(chǔ)類型之一,也是一個簡單型變量。對于整數(shù)和浮點(diǎn)數(shù),在zvalue中直接存儲對應(yīng)的值。其類型分別是long和double。
從zvalue結(jié)構(gòu)中可以看出,對于整數(shù)類型,和c等強(qiáng)類型語言不同,PHP是不區(qū)分int、unsigned int、long、long long等類型的,對它來說,整數(shù)只有一種類型也就是long。由此,可以看出,在PHP里面,整數(shù)的取值范圍是由編譯器位數(shù)來決定而不是固定不變的。在php中如果整數(shù)越界了會發(fā)生什么?php會自動給整數(shù)轉(zhuǎn)換成浮點(diǎn)數(shù)類型
對于浮點(diǎn)數(shù),類似整數(shù),它也不區(qū)分float和double而是統(tǒng)一只有double一種類型
5.2.2 字符變量
和整數(shù)一樣,字符變量也是PHP中的基礎(chǔ)類型和簡單型變量。通過zvalue結(jié)構(gòu)可以看出,在PHP中,字符串是由由指向?qū)嶋H數(shù)據(jù)的指針和長度結(jié) 構(gòu)體組成,這點(diǎn)和c++中的string比較類似。由于通過一個實(shí)際變量表示長度,和c不同,它的字符串可以是2進(jìn)制數(shù)據(jù)(包含\0),同時在PHP中, 求字符串長度strlen是O(1)操作
常見的字符串拼接方式及速度比較:
假設(shè)有如下4個變量:strA=‘123’; strB = ‘456’; intA=123; intB=456;
現(xiàn)在對如下的幾種字符串拼接方式做一個比較和說明:
1 res = strA.strB和res = “strAstrB”
這種情況下,zend會重新malloc一塊內(nèi)存并進(jìn)行相應(yīng)處理,其速度一般。
2 strA = strA.strB
這種是速度最快的,zend會在當(dāng)前strA基礎(chǔ)上直接relloc,避免重復(fù)拷貝
3 res = intA.intB
這種速度較慢,因?yàn)樾枰鲭[式的格式轉(zhuǎn)換,實(shí)際編寫程序中也應(yīng)該注意盡量避免
4 strA = sprintf (“%s%s”,strA,strB);
這會是最慢的一種方式,因?yàn)閟printf在PHP中并不是一個語言結(jié)構(gòu),本身對于格式識別和處理就需要耗費(fèi)比較多時間,另外本身機(jī)制也是malloc。不過sprintf的方式最具可讀性,實(shí)際中可以根據(jù)具體情況靈活選擇。
5.2.3 數(shù)組變量
PHP的數(shù)組是通過Zend Hash Table來天然實(shí)現(xiàn)。
foreach操作如何實(shí)現(xiàn)?對一個數(shù)組的foreach就是通過遍歷hashtable中的雙向鏈表完成。對于索引數(shù)組,通過foreach遍 歷效率比for高很多,省去了key->value的查找。count操作直接調(diào)用 HashTable->NumOfElements,O(1)操作。對于’123’這樣的字符串,zend會轉(zhuǎn)換為其整數(shù)形 式。arr[‘123’]和arr[123]
5.3 PHP變量管理-引用計(jì)數(shù)和寫時拷貝
引用計(jì)數(shù)在內(nèi)存回收、字符串操作等地方使用非常廣泛。Zval的引用計(jì)數(shù)通過成員變量is_ref和ref_count實(shí)現(xiàn),通過引用計(jì)數(shù),多個變量可以共享同一份數(shù)據(jù)。避免頻繁拷貝帶來的大量消耗。在進(jìn)行賦值操作時,zend將變量指向相同的zval同時ref_count++,在unset操作時,對應(yīng)的ref_count-1。只有ref_count減為0時才會真正執(zhí)行銷毀操作。如果是引用賦值,則zend會修改is_ref為1。
PHP變量通過引用計(jì)數(shù)實(shí)現(xiàn)變量共享數(shù)據(jù),那如果改變其中一個變量值呢?當(dāng)試圖寫入一個變量時,Zend若發(fā)現(xiàn)該變量指向的zval被多個變量共享,則為其復(fù)制一份ref_count為1的zval,并遞減原zval的refcount,這個過程稱為“zval分離”??梢姡挥性谟袑懖僮靼l(fā)生時 zend才進(jìn)行拷貝操作,因此也叫copy-on-write(寫時拷貝)
對于引用型變量,其要求和非引用型相反,引用賦值的變量間必須是捆綁的,修改一個變量就修改了所有捆綁變量。
5.4 PHP局部變量和全局變量的實(shí)現(xiàn):
PHP中的局部變量和全局變量是如何實(shí)現(xiàn)的?對于一個請求,任意時刻PHP都可以看到兩個符號表(symbol_table和 active_symbol_table),其中前者用來維護(hù)全局變量。后者是一個指針,指向當(dāng)前活動的變量符號表,當(dāng)程序進(jìn)入到某個函數(shù)中時,zend 就會為它分配一個符號表x同時將active_symbol_table指向a。通過這樣的方式實(shí)現(xiàn)全局、局部變量的區(qū)分。
獲取變量值:PHP的符號表是通過hash_table實(shí)現(xiàn)的,對于每個變量都分配唯一標(biāo)識,獲取的時候根據(jù)標(biāo)識從表中找到相應(yīng)zval返回。
函數(shù)中使用全局變量:在函數(shù)中,我們可以通過顯式申明global來使用全局變量。在active_symbol_table中創(chuàng)建symbol_table中同名變量的引用(引用變量的值要更新大家會一起更新),如果symbol_table中沒有同名變量則會先創(chuàng)建。
參考: