分布式和集群的區(qū)別

在IDF05(Intel Developer Forum 2005)上,Intel首席執(zhí)行官Craig Barrett就取消4GHz芯片計劃一事,半開玩笑當(dāng)眾單膝下跪致歉,給廣大軟件開發(fā)者一個明顯的信號,單純依靠垂直提升硬件性能來提高系統(tǒng)性能的時代已結(jié)束,分布式開發(fā)的時代實際上早已悄悄地成為了時代的主流,吵得很熱的云計算實際上只是包裝在分布式之外的商業(yè)概念,很多開發(fā)者(包括我)都想加入研究云計算這個潮流,在google上通過“云計算”這個關(guān)鍵詞來查詢資料,查到的都是些概念性或商業(yè)性的宣傳資料,其實真正需要深入的還是那個早以被人熟知的概念------分布式。

分布式可繁也可以簡,最簡單的分布式就是大家最常用的,在負載均衡服務(wù)器后加一堆web服務(wù)器,然后在上面搞一個緩存服務(wù)器來保存臨時狀態(tài),后面共享一個數(shù)據(jù)庫,其實很多號稱分布式專家的人也就停留于此,大致結(jié)構(gòu)如下圖所示:

image.png

這種環(huán)境下真正進行分布式的只是web server而已,并且web server之間沒有任何聯(lián)系,所以結(jié)構(gòu)和實現(xiàn)都非常簡單。

有些情況下,對分布式的需求就沒這么簡單,在每個環(huán)節(jié)上都有分布式的需求,比如Load Balance、DB、Cache和文件等等,并且當(dāng)分布式節(jié)點之間有關(guān)聯(lián)時,還得考慮之間的通訊,另外,節(jié)點非常多的時候,得有監(jiān)控和管理來支撐。這樣看起來,分布式是一個非常龐大的體系,只不過你可以根據(jù)具體需求進行適當(dāng)?shù)夭眉簟0凑兆钔陚涞姆植际襟w系來看,可以由以下模塊組成:

image.png

分布式任務(wù)處理服務(wù):負責(zé)具體的業(yè)務(wù)邏輯處理

分布式節(jié)點注冊和查詢:負責(zé)管理所有分布式節(jié)點的命名和物理信息的注冊與查詢,是節(jié)點之間聯(lián)系的橋梁

分布式DB:分布式結(jié)構(gòu)化數(shù)據(jù)存取

分布式Cache:分布式緩存數(shù)據(jù)(非持久化)存取

分布式文件:分布式文件存取

網(wǎng)絡(luò)通信:節(jié)點之間的網(wǎng)絡(luò)數(shù)據(jù)通信

監(jiān)控管理:搜集、監(jiān)控和診斷所有節(jié)點運行狀態(tài)

分布式編程語言:用于分布式環(huán)境下的專有編程語言,比如Elang、Scala

分布式算法:為解決分布式環(huán)境下一些特有問題的算法,比如解決一致性問題的Paxos算法

因此,若要深入研究云計算和分布式,就得深入研究以上領(lǐng)域,而這些領(lǐng)域每一塊的水都很深,都需要很底層的知識和技術(shù)來支撐,所以說,對于想提升技術(shù)的開發(fā)者來說,以分布式來作為切入點是非常好的,可以以此為線索,探索計算機世界的各個角落。

集群是個物理形態(tài),分布式是個工作方式。

只要是一堆機器,就可以叫集群,他們是不是一起協(xié)作著干活,這個誰也不知道;一個程序或系統(tǒng),只要運行在不同的機器上,就可以叫分布式,嗯,C/S架構(gòu)也可以叫分布式。

集群一般是物理集中、統(tǒng)一管理的,而分布式系統(tǒng)則不強調(diào)這一點。

所以,集群可能運行著一個或多個分布式系統(tǒng),也可能根本沒有運行分布式系統(tǒng);分布式系統(tǒng)可能運行在一個集群上,也可能運行在不屬于一個集群的多臺(2臺也算多臺)機器上。

布式是相對中心化而來,強調(diào)的是任務(wù)在多個物理隔離的節(jié)點上進行。中心化帶來的主要問題是可靠性,若中心節(jié)點宕機則整個系統(tǒng)不可用,分布式除了解決部分中心化問題,也傾向于分散負載,但分布式會帶來很多的其他問題,最主要的就是一致性。
集群就是邏輯上處理同一任務(wù)的機器集合,可以屬于同一機房,也可分屬不同的機房。分布式這個概念可以運行在某個集群里面,某個集群也可作為分布式概念的一個節(jié)點。
一句話,就是:“分頭做事”與“一堆人”的區(qū)別

分布式是指將不同的業(yè)務(wù)分布在不同的地方。 而集群指的是將幾臺服務(wù)器集中在一起,實現(xiàn)同一業(yè)務(wù)。

分布式中的每一個節(jié)點,都可以做集群。 而集群并不一定就是分布式的。

舉例:就比如新浪網(wǎng),訪問的人多了,他可以做一個群集,前面放一個響應(yīng)服務(wù)器,后面幾臺服務(wù)器完成同一業(yè)務(wù),如果有業(yè)務(wù)訪問的時候,響應(yīng)服務(wù)器看哪臺服務(wù)器的負載不是很重,就將給哪一臺去完成。

而分布式,從窄意上理解,也跟集群差不多, 但是它的組織比較松散,不像集群,有一個組織性,一臺服務(wù)器垮了,其它的服務(wù)器可以頂上來。

分布式的每一個節(jié)點,都完成不同的業(yè)務(wù),一個節(jié)點垮了,哪這個業(yè)務(wù)就不可訪問了。

2:簡單說,分布式是以縮短單個任務(wù)的執(zhí)行時間來提升效率的,而集群則是通過提高單位時間內(nèi)執(zhí)行的任務(wù)數(shù)來提升效率。

例如:

如果一個任務(wù)由10個子任務(wù)組成,每個子任務(wù)單獨執(zhí)行需1小時,則在一臺服務(wù)器上執(zhí)行該任務(wù)需10小時。

采用分布式方案,提供10臺服務(wù)器,每臺服務(wù)器只負責(zé)處理一個子任務(wù),不考慮子任務(wù)間的依賴關(guān)系,執(zhí)行完這個任務(wù)只需一個小時。(這種工作模式的一個典型代表就是Hadoop的Map/Reduce分布式計算模型)

而采用集群方案,同樣提供10臺服務(wù)器,每臺服務(wù)器都能獨立處理這個任務(wù)。假設(shè)有10個任務(wù)同時到達,10個服務(wù)器將同時工作,1小時后,10個任務(wù)同時完成,這樣,整身來看,還是1小時內(nèi)完成一個任務(wù)!

集群一般被分為三種類型,高可用集群如RHCS、LifeKeeper等,負載均衡集群如LVS等、高性能運算集群;分布式應(yīng)該是高性能運算集群范疇內(nèi)。

分布式:不同的業(yè)務(wù)模塊部署在不同的服務(wù)器上或者同一個業(yè)務(wù)模塊分拆多個子業(yè)務(wù),部署在不同的服務(wù)器上,解決高并發(fā)的問題
集群:同一個業(yè)務(wù)部署在多臺機器上,提高系統(tǒng)可用性

小飯店原來只有一個廚師,切菜洗菜備料炒菜全干。后來客人多了,廚房一個廚師忙不過來,又請了個廚師,兩個廚師都能炒一樣的菜,這兩個廚師的關(guān)系是集群。為了讓廚師專心炒菜,把菜做到極致,又請了個配菜師負責(zé)切菜,備菜,備料,廚師和配菜師的關(guān)系是分布式,一個配菜師也忙不過來了,又請了個配菜師,兩個配菜師關(guān)系是集群

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容