算法的時間復(fù)雜度和空間復(fù)雜度

通常,對于一個給定的算法,我們要做 兩項分析。第一是從數(shù)學(xué)上證明算法的正確性,這一步主要用到形式化證明的方法及相關(guān)推理模式,如循環(huán)不變式、數(shù)學(xué)歸納法等。而在證明算法是正確的基礎(chǔ)上,第二部就是分析算法的時間復(fù)雜度。算法的時間復(fù)雜度反映了程序執(zhí)行時間隨輸入規(guī)模增長而增長的量級,在很大程度上能很好反映出算法的優(yōu)劣與否。因此,作為程序員,掌握基本的算法時間復(fù)雜度分析方法是很有必要的。 算法執(zhí)行時間需通過依據(jù)該算法編制的程序在計算機上運行時所消耗的時間來度量。而度量一個程序的執(zhí)行時間通常有兩種方法。

一、事后統(tǒng)計的方法
** **這種方法可行,但不是一個好的方法。該方法有兩個缺陷:一是要想對設(shè)計的算法的運行性能進行評測,必須先依據(jù)算法編制相應(yīng)的程序并實際運行;二是所得時間的統(tǒng)計量依賴于計算機的硬件、軟件等環(huán)境因素,有時容易掩蓋算法本身的優(yōu)勢。

二、事前分析估算的方法
因事后統(tǒng)計方法更多的依賴于計算機的硬件、軟件等環(huán)境因素,有時容易掩蓋算法本身的優(yōu)劣。因此人們常常采用事前分析估算的方法。
在編寫程序前,依據(jù)統(tǒng)計方法對算法進行估算。一個用高級語言編寫的程序在計算機上運行時所消耗的時間取決于下列因素:
(1). 算法采用的策略、方法;
(2). 編譯產(chǎn)生的代碼質(zhì)量;
(3). 問題的輸入規(guī)模;
(4). 機器執(zhí)行指令的速度。

一個算法是由控制結(jié)構(gòu)(順序、分支和循環(huán)3種)和原操作(指固有數(shù)據(jù)類型的操作)構(gòu)成的,則算法時間取決于兩者的綜合效果。為了便于比較同一個問題的不同算法,通常的做法是,從算法中選取一種對于所研究的問題(或算法類型)來說是基本操作的原操作,以該基本操作的重復(fù)執(zhí)行的次數(shù)作為算法的時間量度。

1、時間復(fù)雜度 (1)時間頻度 一個算法執(zhí)行所耗費的時間,從理論上是不能算出來的,必須上機運行測試才能知道。但我們不可能也沒有必要對每個算法都上機測試,只需知道哪個算法花費的時間多,哪個算法花費的時間少就可以了。并且一個算法花費的時間與算法中語句的執(zhí)行次數(shù)成正比例,哪個算法中語句執(zhí)行次數(shù)多,它花費時間就多。一個算法中的語句執(zhí)行次數(shù)稱為語句頻度或時間頻度。記為T(n)。(2)時間復(fù)雜度 在剛才提到的時間頻度中,n稱為問題的規(guī)模,當n不斷變化時,時間頻度T(n)也會不斷變化。但有時我們想知道它變化時呈現(xiàn)什么規(guī)律。為此,我們引入時間復(fù)雜度概念。 一般情況下,算法中基本操作重復(fù)執(zhí)行的次數(shù)是問題規(guī)模n的某個函數(shù),用T(n)表示,若有某個輔助函數(shù)f(n),使得當n趨近于無窮大時,T(n)/f(n)的極限值為不等于零的常數(shù),則稱f(n)是T(n)的同數(shù)量級函數(shù)。記作T(n)=O(f(n)),O(f(n)) 為算法的漸進時間復(fù)雜度,簡稱時間復(fù)雜度。

另外,上面公式中用到的 Landau符號其實是由德國數(shù)論學(xué)家保羅·巴赫曼(Paul Bachmann)在其1892年的著作《解析數(shù)論》首先引入,由另一位德國數(shù)論學(xué)家艾德蒙·朗道(Edmund Landau)推廣。Landau符號的作用在于用簡單的函數(shù)來描述復(fù)雜函數(shù)行為,給出一個上或下(確)界。在計算算法復(fù)雜度時一般只用到大O符號,Landau符號體系中的小o符號、Θ符號等等比較不常用。這里的O,最初是用大寫希臘字母,但現(xiàn)在都用大寫英語字母O;小o符號也是用小寫英語字母oΘ符號則維持大寫希臘字母Θ。** T (n) = Ο(f (n))** 表示存在一個常數(shù)C,使得在當n趨于正無窮時總有 T (n) ≤ C * f(n)。簡單來說,就是T(n)在n趨于正無窮時最大也就跟f(n)差不多大。也就是說當n趨于正無窮時T (n)的上界是C * f(n)。其雖然對f(n)沒有規(guī)定,但是一般都是取盡可能簡單的函數(shù)。例如,O(2n2+n +1) = O (3n2+n+3) = O (7n2 + n) = O ( n2 ) ,一般都只用O(n2)**表示就可以了。注意到大O符號里隱藏著一個常數(shù)C,所以f(n)里一般不加系數(shù)。如果把T(n)當做一棵樹,那么O(f(n))所表達的就是樹干,只關(guān)心其中的主干,其他的細枝末節(jié)全都拋棄不管。

在各種不同算法中,若算法中語句執(zhí)行次數(shù)為一個常數(shù),則時間復(fù)雜度為O(1),另外,在時間頻度不相同時,時間復(fù)雜度有可能相同,如T(n)=n2+3n+4與T(n)=4n2+2n+1它們的頻度不同,但時間復(fù)雜度相同,都為O(n2)。 按數(shù)量級遞增排列,常見的時間復(fù)雜度有:常數(shù)階O(1),對數(shù)階O(log2n),線性O(n),** 線性對數(shù)階O(nlog2n),平方階O(n2),立方階O(n3),..., k次方階O(nk),指數(shù)階O(2n)。隨著問題規(guī)模n的不斷增大,上述時間復(fù)雜度不斷增大,算法的執(zhí)行效率越低。


** 從圖中可見,我們應(yīng)該盡可能選用多項式階O(
n
k)的算法,而不希望用指數(shù)階的算法。**
常見的算法時間復(fù)雜度由小到大依次為:

Ο(1)<Ο(log2n)<Ο(n)<Ο(nlog2n)<Ο(n2)<Ο(n3)<…<Ο(2n)<Ο(n!)**

一般情況下,對一個問題(或一類算法)只需選擇一種基本操作來討論算法的時間復(fù)雜度即可,有時也需要同時考慮幾種基本操作,甚至可以對不同的操作賦予不同的權(quán)值,以反映執(zhí)行不同操作所需的相對時間,這種做法便于綜合比較解決同一問題的兩種完全不同的算法。

(3)求解算法的時間復(fù)雜度的具體步驟是:
 ?、?找出算法中的基本語句;
  算法中執(zhí)行次數(shù)最多的那條語句就是基本語句,通常是最內(nèi)層循環(huán)的循環(huán)體。
 ?、?計算基本語句的執(zhí)行次數(shù)的數(shù)量級;
  只需計算基本語句執(zhí)行次數(shù)的數(shù)量級,這就意味著只要保證基本語句執(zhí)行次數(shù)的函數(shù)中的最高次冪正確即可,可以忽略所有低次冪和最高次冪的系數(shù)。這樣能夠簡化算法分析,并且使注意力集中在最重要的一點上:增長率。
 ?、?用大Ο記號表示算法的時間性能。
  將基本語句執(zhí)行次數(shù)的數(shù)量級放入大Ο記號中。
  如果算法中包含嵌套的循環(huán),則基本語句通常是最內(nèi)層的循環(huán)體,如果算法中包含并列的循環(huán),則將并列循環(huán)的時間復(fù)雜度相加。例如:
[java] view plain copy

for (i=1; i<=n; i++)  
     x++;  
for (i=1; i<=n; i++)  
     for (j=1; j<=n; j++)  
          x++;  

第一個for循環(huán)的時間復(fù)雜度為Ο(n),第二個for循環(huán)的時間復(fù)雜度為Ο(n2),則整個算法的時間復(fù)雜度為Ο(n+n2)=Ο(n2)。
  Ο(1)表示基本語句的執(zhí)行次數(shù)是一個常數(shù),一般來說,只要算法中不存在循環(huán)語句,其時間復(fù)雜度就是Ο(1)。其中Ο(log2n)、Ο(n)、 Ο(nlog2n)、Ο(n2)和Ο(n3)稱為多項式時間,而Ο(2n
)和Ο(n!)稱為指數(shù)時間。計算機科學(xué)家普遍認為前者(即多項式時間復(fù)雜度的算法)是有效算法,把這類問題稱為P(Polynomial,多項式)類問題,而把后者(即指數(shù)時間復(fù)雜度的算法)稱為NP(Non-Deterministic Polynomial, 非確定多項式)問題**。
一般來說多項式級的復(fù)雜度是可以接受的,很多問題都有多項式級的解——也就是說,這樣的問題,對于一個規(guī)模是n的輸入,在n^k的時間內(nèi)得到結(jié)果,稱為P問題。有些問題要復(fù)雜些,沒有多項式時間的解,但是可以在多項式時間里驗證某個猜測是不是正確。比如問4294967297是不是質(zhì)數(shù)?如果要直接入手的話,那么要把小于4294967297的平方根的所有素數(shù)都拿出來,看看能不能整除。還好歐拉告訴我們,這個數(shù)等于641和6700417的乘積,不是素數(shù),很好驗證的,順便麻煩轉(zhuǎn)告費馬他的猜想不成立。大數(shù)分解、Hamilton回路之類的問題,都是可以多項式時間內(nèi)驗證一個“解”是否正確,這類問題叫做NP問題。

****(4)在計算算法時間復(fù)雜度時有以下幾個簡單的程序分析法則:

(1).對于一些簡單的輸入輸出語句或賦值語句,近似認為需要O(1)時間

(2).對于順序結(jié)構(gòu),需要依次執(zhí)行一系列語句所用的時間可采用大O下"求和法則"
求和法則:是指若算法的2個部分時間復(fù)雜度分別為 T1(n)=O(f(n))和 T2(n)=O(g(n)),則 T1(n)+T2(n)=O(max(f(n), g(n)))
特別地,若T1(m)=O(f(m)), T2(n)=O(g(n)),則 T1(m)+T2(n)=O(f(m) + g(n))

(3).對于選擇結(jié)構(gòu),如if語句,它的主要時間耗費是在執(zhí)行then字句或else字句所用的時間,需注意的是檢驗條件也需要O(1)時間

(4).對于循環(huán)結(jié)構(gòu),循環(huán)語句的運行時間主要體現(xiàn)在多次迭代中執(zhí)行循環(huán)體以及檢驗循環(huán)條件的時間耗費,一般可用大O下"乘法法則"
乘法法則: 是指若算法的2個部分時間復(fù)雜度分別為 T1(n)=O(f(n))和 T2(n)=O(g(n)),則 T1T2=O(f(n)g(n))

(5).對于復(fù)雜的算法,可以將它分成幾個容易估算的部分,然后利用求和法則和乘法法則技術(shù)整個算法的時間復(fù)雜度
另外還有以下2個運算法則:(1) 若g(n)=O(f(n)),則O(f(n))+ O(g(n))= O(f(n));(2) O(Cf(n)) = O(f(n)),其中C是一個正常數(shù)

(5)下面分別對幾個常見的時間復(fù)雜度進行示例說明:

(1)、O(1)

    Temp=i; i=j; j=temp;                    

以上三條單個語句的頻度均為1,該程序段的執(zhí)行時間是一個與問題規(guī)模n無關(guān)的常數(shù)。算法的時間復(fù)雜度為常數(shù)階,記作T(n)=O(1)。注意:如果算法的執(zhí)行時間不隨著問題規(guī)模n的增加而增長,即使算法中有上千條語句,其執(zhí)行時間也不過是一個較大的常數(shù)。此類算法的時間復(fù)雜度是O(1)。

(2)、O(n2)**
2.1. 交換i和j的內(nèi)容

sum=0;                 (一次)  
for(i=1;i<=n;i++)     (n+1次)  
 for(j=1;j<=n;j++) (n2次)  
    sum++;            (n2次)  

解:因為Θ(2n2
+n+1)=n2
(Θ即:去低階項,去掉常數(shù)項,去掉高階項的常參得到),所以T(n)= =O(n2);**

2.2.

for (i=1;i<n;i++)  
 {   
 y=y+1;         ①     
 for (j=0;j<=(2*n);j++)      
    x++;         ②        
 }            

解: 語句1的頻度是n-1 語句2的頻度是(n-1)(2n+1)=2n2
-n-1 f(n)=2
n2
-n-1+(n-1)=2
n2
-2;
Θ(2
n2-2)=n2
** 該程序的時間復(fù)雜度T(n)=O(
*n2
**).
  一般情況下,對步進循環(huán)語句只需考慮循環(huán)體中語句的執(zhí)行次數(shù),忽略該語句中步長加1、終值判別、控制轉(zhuǎn)移等成分,當有若干個循環(huán)語句時,算法的時間復(fù)雜度是由嵌套層數(shù)最多的循環(huán)語句中最內(nèi)層語句的頻度f(n)決定的。
(3)、O(n)

a=0;  
b=1;                      ①  
for (i=1;i<=n;i++) ②  
{    
 s=a+b;    ③  
 b=a;    ?、?   
 a=s;    ?、? 
}    

解: 語句1的頻度:2, 語句2的頻度: n, 語句3的頻度: n-1, 語句4的頻度:n-1, 語句5的頻度:n-1, T(n)=2+n+3(n-1)=4n-1=O(n).

(4)、O(log2n)**

i=1;     ①  
hile (i<=n)  
i=i*2; ②  

解: 語句1的頻度是1, 設(shè)語句2的頻度是f(n), 則:2^f(n)<=n;f(n)<=log2n** 取最大值f(n)=log2n,
T(n)=O(
log2n** )

(5)、O(n3)**

for(i=0;i<n;i++)  
 {    
  for(j=0;j<i;j++)    
  {  
     for(k=0;k<j;k++)  
        x=x+2;    
  }  
 }   

解:當i=m, j=k的時候,內(nèi)層循環(huán)的次數(shù)為k當i=m時, j 可以取 0,1,...,m-1 , 所以這里最內(nèi)循環(huán)共進行了0+1+...+m-1=(m-1)m/2次所以,i從0取到n, 則循環(huán)共進行了: 0+(1-1)1/2+...+(n-1)n/2=n(n+1)(n-1)/6所以時間復(fù)雜度為O(n3*).

(5)常用的算法的時間復(fù)雜度和空間復(fù)雜度

一個經(jīng)驗規(guī)則:其中c是一個常量,如果一個算法的復(fù)雜度為c 、 log2n** 、n 、 nlog2n* ,那么這個算法時間效率比較高 ,如果是2n
** ,
3n
** ,n!,那么稍微大一些的n就會令這個算法不能動了,居于中間的幾個則差強人意。
算法時間復(fù)雜度分析是一個很重要的問題,任何一個程序員都應(yīng)該熟練掌握其概念和基本方法,而且要善于從數(shù)學(xué)層面上探尋其本質(zhì),才能準確理解其內(nèi)涵。
2、算法的空間復(fù)雜度
類似于時間復(fù)雜度的討論,一個算法的空間復(fù)雜度(Space Complexity)S(n)定義為該算法所耗費的存儲空間,它也是問題規(guī)模n的函數(shù)。漸近空間復(fù)雜度也常常簡稱為空間復(fù)雜度??臻g復(fù)雜度(Space Complexity)是對一個算法在運行過程中臨時占用存儲空間大小的量度。一個算法在計算機存儲器上所占用的存儲空間,包括存儲算法本身所占用的存儲空間,算法的輸入輸出數(shù)據(jù)所占用的存儲空間和算法在運行過程中臨時占用的存儲空間這三個方面。算法的輸入輸出數(shù)據(jù)所占用的存儲空間是由要解決的問題決定的,是通過參數(shù)表由調(diào)用函數(shù)傳遞而來的,它不隨本算法的不同而改變。存儲算法本身所占用的存儲空間與算法書寫的長短成正比,要壓縮這方面的存儲空間,就必須編寫出較短的算法。算法在運行過程中臨時占用的存儲空間隨算法的不同而異,有的算法只需要占用少量的臨時工作單元,而且不隨問題規(guī)模的大小而改變,我們稱這種算法是“就地"進行的,是節(jié)省存儲的算法,如這一節(jié)介紹過的幾個算法都是如此;有的算法需要占用的臨時工作單元數(shù)與解決問題的規(guī)模n有關(guān),它隨著n的增大而增大,當n較大時,將占用較多的存儲單元,例如將在第九章介紹的快速排序和歸并排序算法就屬于這種情況。
如當一個算法的空間復(fù)雜度為一個常量,即不隨被處理數(shù)據(jù)量n的大小而改變時,可表示為O(1);當一個算法的空間復(fù)雜度與以2為底的n的對數(shù)成正比時,可表示為0(10g2n);當一個算法的空I司復(fù)雜度與n成線性比例關(guān)系時,可表示為0(n).若形參為數(shù)組,則只需要為它分配一個存儲由實參傳送來的一個地址指針的空間,即一個機器字長空間;若形參為引用方式,則也只需要為其分配存儲一個地址的空間,用它來存儲對應(yīng)實參變量的地址,以便由系統(tǒng)自動引用實參變量。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容