優(yōu)化網(wǎng)站性能必備的6種架構(gòu)方案,你知道嗎?

前言

? ? ? ? 一個(gè)成熟的大型網(wǎng)站(如淘寶、天貓、騰訊等)的系統(tǒng)架構(gòu)并不是一開始設(shè)計(jì)時(shí)就具備完整的高性能、高可用、高伸縮等特性的,它是隨著用戶量的增加,業(yè)務(wù)功能的擴(kuò)展逐漸演變完善的,在這個(gè)過程中,開發(fā)模式、技術(shù)架構(gòu)、設(shè)計(jì)思想也發(fā)生了很大的變化,就連技術(shù)人員也從幾個(gè)人發(fā)展到一個(gè)部門甚至一條產(chǎn)品線。所以成熟的系統(tǒng)架構(gòu)是隨著業(yè)務(wù)的擴(kuò)展而逐步完善的,并不是一蹴而就;不同業(yè)務(wù)特征的系統(tǒng),會(huì)有各自的側(cè)重點(diǎn),例如:淘寶,要解決海量的商品信息的搜索、下單、支付,例如騰訊,要解決數(shù)億用戶的實(shí)時(shí)消息傳輸,百度它要處理海量的搜索請求,他們都有各自的業(yè)務(wù)特性,系統(tǒng)架構(gòu)也有所不同。盡管如此我們也可以從這些不同的網(wǎng)站背景下,找出其中共用優(yōu)化的技術(shù),這些優(yōu)化技術(shù)和手段廣泛運(yùn)用在大型網(wǎng)站系統(tǒng)的架構(gòu)中,下面讓我們來認(rèn)識(shí)這些優(yōu)化性能的技術(shù)和手段。

改善網(wǎng)站性能的幾大手段

最開始的網(wǎng)站架構(gòu)

? ? ? ? 最初業(yè)務(wù)量不大,訪問量小,此時(shí)的架構(gòu),應(yīng)用程序、數(shù)據(jù)庫、文件都部署在一臺(tái)服務(wù)器上,有些甚至僅僅是租用主機(jī)空間

1. 應(yīng)用、數(shù)據(jù)、文件分離

? ? ? ? 將應(yīng)用程序、數(shù)據(jù)庫、文件各自部署在獨(dú)立的服務(wù)器上,并且根據(jù)服務(wù)器的用途配置不同的硬件,達(dá)到最佳的性能效果。

2. 利用緩存改善網(wǎng)站性能

? ? ? ? 大部分網(wǎng)站訪問都遵循28原則,即80%的訪問請求,最終落在20%的數(shù)據(jù)上,所以我們可以對熱點(diǎn)數(shù)據(jù)進(jìn)行緩存,減少熱點(diǎn)數(shù)據(jù)的訪問路徑,提高用戶體驗(yàn)。緩存實(shí)現(xiàn)常見的方式是本地緩存、分布式緩存。當(dāng)然還有CDN、反向代理。

2.1 本地緩存
? ? ? ? 本地緩存,顧名思義是將數(shù)據(jù)緩存在應(yīng)用服務(wù)器本地,可以存在內(nèi)存中,也可以存在文件,組件。本地緩存的特點(diǎn)是速度快,但因?yàn)楸镜乜臻g有限所以緩存數(shù)據(jù)量也有限。OSCache就是常用的本地緩存。

2.2 分布式緩存
? ? ? ? 分布式緩存的特點(diǎn)是,可以緩存海量的數(shù)據(jù),并且擴(kuò)展非常容易,在門戶類網(wǎng)站中常常被使用,速度按理沒有本地緩存快,常用的分布式緩存是Memcached、Redis。

2.3 反向代理
? ? ? ? 部署在網(wǎng)站的機(jī)房,當(dāng)用戶請求達(dá)到時(shí)首先訪問反向代理服務(wù)器,反向代理服務(wù)器將緩存的數(shù)據(jù)返回給用戶,如果沒有緩存數(shù)據(jù)才會(huì)繼續(xù)訪問應(yīng)用服務(wù)器獲取,這樣做減少了獲取數(shù)據(jù)的成本。反向代理有Squid,Nginx。

2.4 CDN
? ? ? ? 假設(shè)我們的服務(wù)器都部署在杭州的機(jī)房,對于浙江的用戶來說訪問是較快的,而對于北京的用戶訪問是較慢的,這是由于浙江和北京分別屬于電信和聯(lián)通的不同發(fā)達(dá)地區(qū),北京用戶訪問需要通過互聯(lián)路由器經(jīng)過較長的路徑才能訪問到杭州的服務(wù)器,返回路徑也一樣,所以數(shù)據(jù)傳輸時(shí)間比較長。對于這種情況,常常使用CDN解決,CDN將數(shù)據(jù)內(nèi)容緩存到運(yùn)營商的機(jī)房,用戶訪問時(shí)先從最近的運(yùn)營商獲取數(shù)據(jù),這樣大大減少了網(wǎng)絡(luò)訪問的路徑。比較專業(yè)的CDN運(yùn)營商有藍(lán)汛、網(wǎng)宿。

3. 使用集群+負(fù)載均衡改善應(yīng)用服務(wù)器性能

? ? ? ? 應(yīng)用服務(wù)器作為網(wǎng)站的入口,會(huì)承擔(dān)大量的請求,我們往往通過應(yīng)用服務(wù)器集群來分擔(dān)請求數(shù)。
? ? ? ? 應(yīng)用服務(wù)器前面部署負(fù)載均衡服務(wù)器調(diào)度用戶請求,根據(jù)分發(fā)策略將請求分發(fā)到多個(gè)應(yīng)用服務(wù)器節(jié)點(diǎn)。

? ? ? ? 常用的負(fù)載均衡技術(shù)硬件的有F5,價(jià)格比較貴一般都在15W以上。
? ? ? ? 軟件的有LVS、Nginx、HAProxy。LVS是四層(傳輸層)負(fù)載均衡,根據(jù)目標(biāo)地址和端口選擇內(nèi)部服務(wù)器,Nginx和HAProxy是七層(應(yīng)用層)負(fù)載均衡,可以根據(jù)報(bào)文內(nèi)容選擇內(nèi)部服務(wù)器,因此LVS分發(fā)路徑優(yōu)于Nginx 和HAProxy,性能要高些,而Nginx和HAProxy則更具配置性,如可以用來做動(dòng)靜分離(根據(jù)請求報(bào)文特征,選擇靜態(tài)資源服務(wù)器還是應(yīng)用服務(wù)器)。

4. 數(shù)據(jù)庫優(yōu)化

4.1 讀寫分離和分庫分表
? ? ? ? 隨著用戶量的增加,數(shù)據(jù)庫成為最大的瓶頸,改善數(shù)據(jù)庫性能常用的手段是進(jìn)行讀寫分離以及分庫分表,讀寫分離顧名思義就是將數(shù)據(jù)庫分為讀庫和寫庫,通過主備功能實(shí)現(xiàn)數(shù)據(jù)同步。分庫分表則分為水平切分和垂直切分,水平切分則是對一個(gè)數(shù)據(jù)庫特大的表進(jìn)行拆分,例如用戶表。垂直切分則是根據(jù)業(yè)務(wù)的不同來切分,如用戶業(yè)務(wù)、商品業(yè)務(wù)相關(guān)的表放在不同的數(shù)據(jù)庫中。

4.2 使用NoSql數(shù)據(jù)庫和搜索引擎
? ? ? ? 對于海量數(shù)據(jù)的查詢和分析,我們使用nosql數(shù)據(jù)庫加上搜索引擎可以達(dá)到更好的性能。并不是所有的數(shù)據(jù)都要放在關(guān)系型數(shù)據(jù)中。常用的NOSQL有mongodb、hbase、redis,搜索引擎有l(wèi)ucene、solr、elasticsearch。

5. 將應(yīng)用服務(wù)器進(jìn)行業(yè)務(wù)拆分

? ? ? ? 隨著業(yè)務(wù)的擴(kuò)展,應(yīng)用程序變得非常臃腫,這時(shí)我們需要將應(yīng)用程序進(jìn)行業(yè)務(wù)拆分,如百度分為新聞、網(wǎng)頁、圖片等業(yè)務(wù)。每個(gè)業(yè)務(wù)應(yīng)用負(fù)責(zé)相對獨(dú)立的業(yè)務(wù)運(yùn)作。業(yè)務(wù)之間通過消息進(jìn)行通信或者共享數(shù)據(jù)庫來實(shí)現(xiàn)。

6.使用分布式系統(tǒng)

6.1 分布式文件系統(tǒng)
? ? ? ? 用戶一天天增加,業(yè)務(wù)量越來越大,產(chǎn)生的文件越來越多,單臺(tái)的文件服務(wù)器已經(jīng)不能滿足需求,這時(shí)就需要分布式文件系統(tǒng)的支撐。常用的分布式文件系統(tǒng)有GFS、HDFS、TFS。

GFS(Google File System)可以給大量的用戶提供總體性能較高的服務(wù)
? 適合部署在廉價(jià)的普通硬件上
? 提供容錯(cuò)功能

HDFS(Hadoop Distributed File System)能提供高吞吐量的數(shù)據(jù)訪問,非常適合大規(guī)模數(shù)據(jù)集上的應(yīng)用
? 運(yùn)行在通用硬件(commodityhardware)
? 高度容錯(cuò)
? 適合部署在廉價(jià)的機(jī)器上

TFS(Taobao Flies System)主要針對海量的非結(jié)構(gòu)化數(shù)據(jù),提供高可靠和高并發(fā)的存儲(chǔ)訪問
? 高可擴(kuò)展、高可用、高性能
? 面向互聯(lián)網(wǎng)服務(wù)
? 適合海量小文件存儲(chǔ)

6.2 分布式服務(wù)
? ? ? ? 各個(gè)業(yè)務(wù)應(yīng)用都會(huì)使用到一些基本的業(yè)務(wù)服務(wù),例如用戶服務(wù)、訂單服務(wù)、支付服務(wù)、安全服務(wù),這些服務(wù)是支撐各業(yè)務(wù)應(yīng)用的基本要素。我們將這些服務(wù)抽取出來利用分部式服務(wù)框架搭建分布式服務(wù)。阿里的Dubbo是一個(gè)不錯(cuò)的選擇。

小結(jié)

? ? ? ? 完整的系統(tǒng)架構(gòu)圖如下:

? ? ? ? ?大型網(wǎng)站的架構(gòu)是根據(jù)業(yè)務(wù)需求不斷完善的,根據(jù)不同的業(yè)務(wù)特征會(huì)做特定的設(shè)計(jì)和考慮,本文只是講述一個(gè)常規(guī)大型網(wǎng)站會(huì)涉及的一些優(yōu)化技術(shù)和手段。

本文參考《大型網(wǎng)站系統(tǒng)架構(gòu)的演化》略做整理 ? 原文作者:李平?http://www.cnblogs.com/leefreeman/p/3993449.html

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容