解密6'58"破百億交易額的淘寶系統(tǒng)都用了哪些開源軟件


注:“桉樹CRM”已于2016年8月正式更名為“桉術(shù)CRM”。

桉術(shù)CRM:雙十一購物節(jié)剛剛過去,淘寶6分58秒交易500億,承載如此大的流量,淘寶的架構(gòu)是什么樣的呢?淘寶用的是JBoss,框架是iBATIS,緩存服務(wù)器是自己開發(fā)的,基本遵循SNA架構(gòu),水平擴展,數(shù)據(jù)庫是Oracle,阿里集團的DBA幾乎是國內(nèi)最強悍的。

2012年淘寶開始著手系統(tǒng)重構(gòu),目標(biāo)有兩個:

1、水平擴展已經(jīng)不滿足需求了,還需要水平加垂直擴展;

2、開放API,讓店家可以把外部網(wǎng)站資源集成到淘寶,不必直接在淘寶開店。

對于規(guī)模稍大的網(wǎng)站來說,其IT必然是一個服務(wù)器集群來提供網(wǎng)站服務(wù),數(shù)據(jù)庫也必然要和應(yīng)用服務(wù)分開,有單獨的數(shù)據(jù)庫服務(wù)器。對于像淘寶網(wǎng)這樣規(guī)模的網(wǎng)站而言,就是應(yīng)用也分成很多組。那么下面,本文將從應(yīng)用服務(wù)器操作系統(tǒng)、應(yīng)用服務(wù)器軟件、Web Server、數(shù)據(jù)庫、開發(fā)框架等幾個方面來介紹一下淘寶網(wǎng)中開源軟件的應(yīng)用。

操作系統(tǒng)

首先從應(yīng)用服務(wù)器的操作系統(tǒng)說起。一個應(yīng)用服務(wù)器,從軟件的角度來說他的最底層首先是操作系統(tǒng)。要先選擇操作系統(tǒng),然后才是操作系統(tǒng)基礎(chǔ)上的應(yīng)用軟件。在淘寶網(wǎng),應(yīng)用服務(wù)器上采用的是Linux操作系統(tǒng)。Linux操作系統(tǒng)在PC Server上有廣泛的應(yīng)用。硬件上淘寶選擇PC Server而不是小型機,那么Server的操作系統(tǒng)供選擇的一般也就是Linux,F(xiàn)reeBSD, windows 2000 Server或者Windows Server 2003。如果不準(zhǔn)備采用微軟的一系列產(chǎn)品構(gòu)建應(yīng)用,并且有能力維護(hù)Linux或者FreeBSD,再加上成本的考慮,那么還是應(yīng)該在Linux和FreeBSD之間進(jìn)行選擇。

可以說,在Linux和FreeBSD這兩個系統(tǒng)難分伯仲,很難說哪個一定比另外一個要優(yōu)秀很多、能夠全面的超越對手,應(yīng)該是各有所長。那么在選擇的時候有一個因素就是企業(yè)的技術(shù)人員對于哪種系統(tǒng)更加的熟悉,這個熟悉一方面是系統(tǒng)管理方面,另外一方面是對于內(nèi)核的熟悉,對內(nèi)核的熟悉對于性能調(diào)優(yōu)和對操作系統(tǒng)進(jìn)行定制剪裁會有很大的幫助。而應(yīng)用全面的優(yōu)化、提升性能也是從操作系統(tǒng)的優(yōu)化開始的。

應(yīng)用服務(wù)器

在確定了服務(wù)器的硬件、服務(wù)器的操作系統(tǒng)之后,下面來說說業(yè)務(wù)系統(tǒng)的構(gòu)建。淘寶網(wǎng)有很多業(yè)務(wù)系統(tǒng)應(yīng)用是基于JEE規(guī)范的系統(tǒng)。還有一些是CC++構(gòu)建的應(yīng)用或者是Java構(gòu)建的Standalone的應(yīng)用。那么要選擇一款實現(xiàn)了JEE規(guī)范的應(yīng)用服務(wù)器。淘寶的選擇是JBoss Applcation Server。JBoss AS是RedHat的一個開源的支持JEE規(guī)范的應(yīng)用服務(wù)器。

在幾年前,如果采用Java 技術(shù)構(gòu)建互聯(lián)網(wǎng)應(yīng)用或者企業(yè)級應(yīng)用,在開源軟件中的選擇一般也就是Apache組織的Tomcat、JBoss的 JBoss AS和Resin。嚴(yán)格意義上講,Tomcat和Resin并不能算是一個應(yīng)用服務(wù)器,他們是實現(xiàn)了部分J2EE規(guī)范的一個容器。而商業(yè)軟件的選擇就是 IBM的WebSphere和BEA的WebLogic。到了現(xiàn)在,除了JBoss AS外,Apache的Geronimo,Sun的Glassfish也都是很優(yōu)秀的JEE應(yīng)用服務(wù)器。也給現(xiàn)在的開發(fā)人員提供了更多的選擇。

在應(yīng)用服務(wù)器前端,淘寶采用了Web Server做了一次轉(zhuǎn)發(fā),選擇的Web服務(wù)器是大名鼎鼎的Apache。2010年以前,Apache幾乎是 Linux系統(tǒng)上開源Web Server的唯一選擇。那個時候雖然也有一些其他的開源的Web Server,但是從功能和穩(wěn)定性上來說都無法和 Apache相比。后來Lighty也成為了一個非常好的選擇。Lighty是一個非常輕量級、占用內(nèi)存資源也比較少的Web Server。雖然功能上沒有Apache強大,但是在不少場景下,性能是非常出色、強于Apache的。而微軟的IIS,就只能工作在Windows的 系統(tǒng)上了。并且使用IIS的話,基本上也就是選擇了ISAPI、ASP或者ASP.NET進(jìn)行Web應(yīng)用的開發(fā)了。

數(shù)據(jù)庫

在淘寶網(wǎng)的應(yīng)用中,采用了兩種關(guān)系型數(shù)據(jù)庫管理系統(tǒng)。一個是Oracle公司的Oracle 10g,另外一個是Sun MySQL的MySQL。Oracle是一款優(yōu)秀的、廣泛采用的商業(yè)數(shù)據(jù)庫管理軟件。有很強大的功能和安全性,可以處理相對海量的數(shù)據(jù)。而MySQL是一款非常優(yōu)秀的開源數(shù)據(jù)庫管理軟件,非常適合用多臺PC Server組成多點的存儲節(jié)點陣列(這里指的不是MySQL自身提供的集群功能),每單位的數(shù)據(jù)存儲成本也非常的低廉。

用多臺PC Server安裝MySQL組成一個存儲節(jié)點陣列,通過MySQL自身的Replication或者應(yīng)用自身的處理,可以很好的保證容錯(允許部分節(jié)點失 效),保證應(yīng)用的健壯性和可靠性??梢赃@么說,在關(guān)系數(shù)據(jù)庫管理系統(tǒng)的選擇上,可以考慮應(yīng)用本身的情況來決定。

一個互聯(lián)網(wǎng)應(yīng)用,除了服務(wù)器的操作系統(tǒng),Web Server軟件,應(yīng)用服務(wù)器軟件,數(shù)據(jù)庫軟件外,我們還會涉及到一些其他的系統(tǒng),比如一些中間件系統(tǒng)、文件存儲系統(tǒng)、搜索、分布式框架、緩存系統(tǒng)等等。 在淘寶網(wǎng),這些系統(tǒng)都是自主開發(fā)的,沒有采用目前商業(yè)的或者開源的產(chǎn)品。有些系統(tǒng),會存在著一些開源的產(chǎn)品或者商業(yè)產(chǎn)品。但是,考慮到淘寶網(wǎng)自己的需求和 大并發(fā)量的壓力,這些系統(tǒng)都選擇了自主開發(fā)。

開發(fā)框架

前面談的都是系統(tǒng)級的產(chǎn)品,下面說說開發(fā)框架的使用。作為一個如此大規(guī)模的網(wǎng)站,淘寶網(wǎng)的Web展現(xiàn)層采用的是什么框架,是怎么實現(xiàn)的呢?其實淘寶網(wǎng)的Web展現(xiàn)層的框架用的不是struts,不是webwork,不是spring mvc等等。淘寶網(wǎng)的Web展現(xiàn)層的框架用的是集團內(nèi)部自主開發(fā)的一套Web框架。這個框架能夠解決一些其他Web框架不能解決的、在淘寶的應(yīng)用中又會出現(xiàn)并需要解決的問題。在淘寶的多個應(yīng)用中,也采用了一些開源的框架,比如Spring、 iBatis、jBPM、Hessian、Mina等等。這些開源軟件的采用為我們構(gòu)建應(yīng)用系統(tǒng)提供了很大的幫助。

采用開源軟件構(gòu)建系統(tǒng),有兩個很大的好處:

一個是降低成本。假設(shè)你有1000 臺應(yīng)用服務(wù)器,如果你每臺服務(wù)器上采用的不是JBoss AS或者其他開源的軟件,而是使用商業(yè)的 Oracle BEA的Weblogic或者IBM的WebSphere,那么為這1000臺機器的應(yīng)用購買License的費用是非常高的。

另外一個好處是你可以看到軟件的源碼,你可以研究了解軟件內(nèi)部的工作過程、原理。這對于應(yīng)用設(shè)計、開發(fā)、查錯、優(yōu)化都是非常有幫助的。

淘寶網(wǎng)的開源觀

對于開源軟件的應(yīng)用,有些人可能擔(dān)心質(zhì)量的問題,有些人可能擔(dān)心軟件本身發(fā)展更新的問題,等等。對于質(zhì)量的問題,很多的開源軟件尤其是一些很著名的開源軟件都有很完善的組織,有完善的開發(fā)、測試、發(fā)布流程。在一個新版本完成前,會有多次的測試版本發(fā)布,最后才是正式版。這和商業(yè)軟件是一樣的。并且因為代碼公開,反而更加的容易發(fā)現(xiàn)錯誤,提高質(zhì)量。至于第二個問題,我想跟第一個問題一樣,關(guān)鍵是組織和規(guī)劃而不在是否開源,并且在很多著名的開源軟件背后,會有廠商在進(jìn)行支持。軟件本身的發(fā)展應(yīng)該是不會成為問題的,不太會出現(xiàn)軟件突然停止發(fā)展的情況。

在選擇一個開源產(chǎn)品的時候,淘寶會考慮以下幾點:

1. 這個軟件目前的功能和它的RoadMap

2. 軟件本身的架構(gòu)

3. 該軟件開發(fā)的活躍度

4. 該開源軟件是否是遵守該領(lǐng)域內(nèi)的國際規(guī)范的

5. 在同類產(chǎn)品中,要挑選有比較優(yōu)勢的。并且要考慮可能存在的移植代價。這個移植指的是采用了這款開源軟件后現(xiàn)有系統(tǒng)的移植,或者是這個開源軟件到其他軟件的移植。

對于企業(yè)級系統(tǒng)、互聯(lián)網(wǎng)應(yīng)用來說,采用開源軟件不僅可以降低成本,更重要的是能夠真正了解軟件的內(nèi)部工作機制。還可以在現(xiàn)在的基礎(chǔ)上進(jìn)行增強和定制,也能夠從開源軟件中借鑒到很多好的設(shè)計和實現(xiàn)。希望國內(nèi)能有更多的企業(yè)在使用開源軟件的同時,也能開源自身的一些軟件,或者能夠成為一些開源軟件的貢獻(xiàn)者。

淘寶網(wǎng)高性能可伸縮架構(gòu)技術(shù)探秘

作為國內(nèi)最大的B2C網(wǎng)站,淘寶網(wǎng)的網(wǎng)站架構(gòu)一直承載著數(shù)據(jù)量告訴增長壓力,要保證良好的負(fù)載和流程的使用體驗,一個可伸縮性的高性能網(wǎng)站架構(gòu)必不可少。

一、應(yīng)用無狀態(tài)

一個系統(tǒng)的伸縮性的好壞取決于應(yīng)用的狀態(tài)如何管理。試想一下,假如在session中保存了大量與客戶端的狀態(tài)信息的話,那么當(dāng)保存狀態(tài)信息的server宕機的時候,怎么辦?通常來說,都是通過集群來解決這個問題,而通常所說的集群,不僅有負(fù)載均衡,更重要的是要有失效恢復(fù)failover,比如tomcat采用的集群節(jié)點廣播復(fù)制,jboss采用的配對復(fù)制等session狀態(tài)復(fù)制策略,但是集群中的狀態(tài)恢復(fù)也有其缺點,那就是嚴(yán)重影響了系統(tǒng)的伸縮性,系統(tǒng)不能通過增加更多的機器來達(dá)到良好的水平伸縮,因為集群節(jié)點間session的通信會隨著節(jié)點的增多而開銷增大,因此要想做到應(yīng)用本身的伸縮性,需要保證應(yīng)用的無狀態(tài)性,這樣集群中的各個節(jié)點來說都是相同的,從而是的系統(tǒng)更好的水平伸縮。

上面說了無狀態(tài)的重要性,那么具體如何實現(xiàn)無狀態(tài)呢?此時一個session框架就會發(fā)揮作用了。幸運的是淘寶已經(jīng)具有了此類框架。淘寶的session框架采用的是client cookie實現(xiàn),主要將狀態(tài)保存到了cookie里面,這樣就使得應(yīng)用節(jié)點本身不需要保存任何狀態(tài)信息,這樣在系統(tǒng)用戶變多的時候,就可以通過增加更多的應(yīng)用節(jié)點來達(dá)到水平擴展的目的。

但是采用客戶端cookie的方式來保存狀態(tài)也會遇到限制,比如每個cookie一般不能超過4K的大小,同時很多瀏覽器都限制一個站點最多保存20個cookie。淘寶的cookie框架采用的是“多值cookie”, 就是一個組合鍵對應(yīng)多個cookie的值,這樣不僅可以防止cookie數(shù)量超過20,同時還節(jié)省了cookie存儲有效信息的空間,因為默認(rèn)每個cookie都會有大約50個字節(jié)的元信息來描述cookie。

除了公司目前的session框架的實現(xiàn)方式以外,其實集中式session管理來完成,說具體點就是多個無狀態(tài)的應(yīng)用節(jié)點連接一個session 服 務(wù)器,session服務(wù)器將session保 存到緩存中,session服務(wù)器后端再配有底層持久性數(shù)據(jù)源,比如數(shù)據(jù)庫,文件系統(tǒng)等等。

二、有效使用緩存

做互聯(lián)網(wǎng)應(yīng)用的人應(yīng)該都清楚,緩存對于一個互聯(lián)網(wǎng)應(yīng)用是多么的重要,從瀏覽器緩存,反向代理緩存,頁面緩存,局部頁面緩存,對象緩存等等都是緩存應(yīng)用的場景。

一般來說緩存根據(jù)與應(yīng)用程序的遠(yuǎn)近程度不同可以分為:local cache和remote cache。一般系統(tǒng)中要么采用local cache,要么采用remote cache,兩者混合使用的話對于local cache和remote cache的數(shù)據(jù)一致性處理會變大比較麻煩。

在大部分情況下,說到的緩存都是讀緩存,緩存還有另外一個類型:寫緩存。對于一些讀寫比不高,同時對數(shù)據(jù)安全性需求不高的數(shù)據(jù),我們可以將其緩存起來從而減少對底層數(shù)據(jù)庫的訪問,比如統(tǒng)計商品的訪問次數(shù),統(tǒng)計API的調(diào)用量等等,可以采用先寫內(nèi)存緩存然后延遲持久化到數(shù)據(jù)庫,這樣可以大大減少對數(shù)據(jù)庫的寫壓力。

以店鋪線的系統(tǒng)為例,在用戶瀏覽店鋪的時候,比如店鋪介紹,店鋪交流區(qū)頁面,店鋪服務(wù)條款頁面,店鋪試衣間頁面,以及店鋪內(nèi)搜索界面這些界面更新不是非 常頻繁,因此適合放到緩存中,這樣可以大大減低DB的負(fù)載。另外寶貝詳情頁面相對也更新比較 少,因此也適合放到緩存中來減低DB負(fù)載。

三、應(yīng)用拆分

首先,在說明應(yīng)用拆分之前,我們先來回顧一下一個系統(tǒng)從小變大的過程中遇到的一些問題,通過這些問題我們會發(fā)現(xiàn)拆分對于構(gòu)建一個大型系統(tǒng)是如何的重要。

系統(tǒng)剛上線初期,用戶數(shù)并不多,所有的邏輯也許都是放在一個系統(tǒng)中的,所有邏輯跑到一個進(jìn)程或者一個應(yīng)用當(dāng)中,這個時候因為比較用戶少,系統(tǒng)訪問量低,因此將全部的邏輯都放在一個應(yīng)用未嘗不可。但是,兄弟們都清楚,好景不長,隨著系統(tǒng)用戶的不斷增加,系統(tǒng)的訪問壓力越來越多,同時隨著系統(tǒng)發(fā)展,為了滿足用戶的需求,原有的系統(tǒng)需要增加新的功能進(jìn)來,系統(tǒng)變得越來越復(fù)雜的時候,我們會發(fā)現(xiàn)系統(tǒng)變得越來越難維護(hù),難擴展,同時系統(tǒng)伸縮性和可用性也會受到影響。

這個時候如何解決這些問題呢?明智的辦法就是拆分(這也算是一種解耦),需要將原來的系統(tǒng)根據(jù)一定的標(biāo)準(zhǔn),比如業(yè)務(wù)相關(guān)性等分為不同的子系統(tǒng),不同的系統(tǒng)負(fù)責(zé)不同的功能,這樣切分以后,可以對單獨的子系統(tǒng)進(jìn)行擴展和維護(hù),從而提高系統(tǒng)的擴展性和可維護(hù)性,同時系統(tǒng)的水平伸縮性scale out大大的提升了。

因為可以有針對性的對壓力大的子系統(tǒng)進(jìn)行水平擴展而不會影響到其它的子系統(tǒng),而不會像拆分以前,每次系統(tǒng)壓力變大的時候,都需要對整個大系統(tǒng)進(jìn)行伸縮,而這樣的成本是比較大的,另外經(jīng)過切分,子系統(tǒng)與子系統(tǒng)之間的耦合減低了,當(dāng)某個子系統(tǒng)暫時不可用的時候,整體系統(tǒng)還是可用的,從而整體系統(tǒng)的可用性也大大增強了。

因此一個大型的互聯(lián)網(wǎng)應(yīng)用,肯定是要經(jīng)過拆分,因為只有拆分了,系統(tǒng)的擴展性,維護(hù)性,伸縮性,可用性才會變的更好。但是拆分也給系統(tǒng)帶來了問題,就是子系統(tǒng)之間如何通信的問題,而具體的通信方式有哪些呢?一般有同步通信和異步通信,這里首先來說下同步通信,下面的主題“消息系統(tǒng)”會說到異步通信。既然需要通信,這個時候一個高性能的遠(yuǎn)程調(diào)用框架就顯得非常重要啦,因此淘寶也有了自己的HSF框架。

上面所說的都是拆分的好處,但是拆分以后必然的也會帶來新的問題,除了剛才說的子系統(tǒng)通信問題外,最值得關(guān)注的問題就是系統(tǒng)之間的依賴關(guān)系,因為系統(tǒng)多了,系統(tǒng)的依賴關(guān)系就會變得復(fù)雜,此時就需要更好的去關(guān)注拆分標(biāo)準(zhǔn),比如能否將一些有依賴的系統(tǒng)進(jìn)行垂直化,使得這些系統(tǒng)的功能盡量的垂直,這也是目前公司正在做的系統(tǒng)垂直化,同時一定要注意系統(tǒng)之間的循環(huán)依賴,如果出現(xiàn)循環(huán)依賴一定要小心,因為這可能導(dǎo)致系統(tǒng)連鎖啟動失敗。

既然明白了拆分的重要性,看看隨著淘寶的發(fā)展,淘寶本身是如何拆分系統(tǒng)的。

在這個演變的過程中,所說的拆分就出現(xiàn)V2.2和V3.0之間。在V2.2版本中,淘寶幾乎所有的邏輯都放在一個系統(tǒng)中,這樣導(dǎo)致的問題就是系統(tǒng)擴展和修改非常麻煩,并且更加致命的是隨著公司業(yè)務(wù)量的增 加,如果按照V2.2的架構(gòu)已經(jīng)沒有辦法支撐以后淘寶的快速發(fā)展,因此決定對整個系統(tǒng)進(jìn)行拆分。

V3.0版本的系統(tǒng)對整個系統(tǒng)進(jìn)行了水平和垂直兩個方向的拆分,水平方向上,按照功能分為交易,評價,用戶,商品等系統(tǒng),同樣垂直方向上,劃分為業(yè)務(wù)系統(tǒng),核心業(yè)務(wù)系統(tǒng)以及以及基礎(chǔ)服務(wù),這樣以來,各個系統(tǒng)都可以獨立維護(hù)和獨立的進(jìn)行水平伸縮,比如交易系統(tǒng)可以在不影響其它系統(tǒng)的情況下獨立的進(jìn)行水平伸縮以及功能擴展。

從上面可以看出,一個大型系統(tǒng)要想變得可維護(hù),可擴展,可伸縮,必須的對它進(jìn)行拆分,拆分必然也帶來系統(tǒng)之間如何通信以及系統(tǒng)之間依賴管理等問題,關(guān)于通信方面,公司目前獨立開發(fā)了自己的高性能服務(wù)框架HSF, 此框架主要解決了淘寶所有子系統(tǒng)之間的同步和異步通信(目前HSF主要用于同步場合,F(xiàn)utureTask方式的調(diào)用場景還比較少)。至于系統(tǒng)間的依賴管理,目前淘寶還做的不夠好,這也是淘寶以后努力解決的問題。

數(shù)據(jù)擴展性探討和總結(jié)

金融危機是電子商務(wù)的機遇,所以09年是淘寶高速發(fā)展的一年。當(dāng)一個網(wǎng)站從百萬、千萬記錄的數(shù)據(jù)規(guī)模,增長到億、十億、幾十億記錄的數(shù)據(jù)規(guī)模時,是一個量變到質(zhì)變的過程,單純的硬件升級已經(jīng)達(dá)到了瓶頸,而需要在整體結(jié)構(gòu)上做文章。09年一年,淘寶大部分時間都在數(shù)據(jù)的擴展性上努力。

對于一個電子商務(wù)網(wǎng)站來講,訂單是最核心的數(shù)據(jù),也是增長最快的數(shù)據(jù)。對于數(shù)據(jù)的擴展性來講,最傳統(tǒng)也是最簡單有效的模式是數(shù)據(jù)庫的分庫分表。當(dāng)訂單和分庫分表相遇,會有什么火花迸發(fā)出來?09年初碰撞了很久,結(jié)果產(chǎn)生的火花很小。最大的問題在于數(shù)據(jù)分割的規(guī)則,無規(guī)則的水平分割肯定會帶來數(shù)據(jù)合并的開銷,而按照業(yè)務(wù)規(guī)則拆分,會因為買家和賣家的查詢需求不同而導(dǎo)致數(shù)據(jù)不能分割,唯一可行的火花是把訂單雙份保存,買家賣家各自一份,只是成本比較高,而且對數(shù)據(jù)同步的要求非常高。

于是淘寶初步?jīng)Q定按照雙份保存的方式拆分訂單,而有一天,仔細(xì)查看了訂單訪問的情況,發(fā)現(xiàn)訂單數(shù)據(jù)庫90%以上的壓力來自于查詢,而查詢中90%以上的壓力來自于非核心業(yè)務(wù),僅僅是訂單數(shù)據(jù)的展現(xiàn),對一致性和實時性的要求很低。

因為數(shù)據(jù)量大,造成數(shù)據(jù)庫壓力大,天然想到的是分散壓力,其辦法就是分庫分表。有些時候想問題不妨直接一點,既然壓力大,能不能減小壓力呢?通過對訂單訪問情況的了解,發(fā)現(xiàn)昂貴的主數(shù)據(jù)庫,有80%以上的壓力給了不重要的需求,這個就是優(yōu)化的關(guān)鍵,所以訂單最后采用了讀寫分離的方案,高成本的主數(shù)據(jù)庫解決事務(wù)和重要的查詢業(yè)務(wù),80%以上不重要的讀,交給了低成本的數(shù)據(jù)庫服務(wù)器來解決,同時對數(shù)據(jù)復(fù)制的要求也很低,實現(xiàn)無太大難度。

另外一個有意思的案例是商品的數(shù)據(jù)擴容,商品的水平分割非常容易,按照賣家進(jìn)行拆分即可。有了訂單的先例,首先想到了讀寫分離,因為成本可以做低。開始實施后一段時間,又仔細(xì)回想了一下商品的整體需求,突然發(fā)現(xiàn)商品其實不需要和訂單同等的要求,一定要采用高成本的主數(shù)據(jù)庫嗎?全部采用低成本的普通服務(wù)器來做數(shù)據(jù)庫是否可行?經(jīng)過仔細(xì)的評估,發(fā)現(xiàn)是可以接受的,而這樣就導(dǎo)致之前已經(jīng)啟動的商品讀寫分離項目的一部分工作白做了!

故事講完了總是要有點總結(jié),來點虛的先:對于原始需求的清晰了解是系統(tǒng)決策的前提,否則彎路肯定要走,而對原始需求的了解并不容易,中間會有很多干擾和阻力,前面的實例看起來很簡單,但是在一個運行了5年的系統(tǒng)上來了解本質(zhì),來進(jìn)行變更,并沒那么容易。另外,經(jīng)驗有些時候會成為系統(tǒng)決策的障礙,這個很矛盾,所以需要有歸零的心態(tài)來思考問題。說到底,回歸本源。

再來點稍微實際一點的,對于大型分布式系統(tǒng)的數(shù)據(jù)訪問,一個統(tǒng)一的數(shù)據(jù)層是非常必要的,封裝水平、垂直的數(shù)據(jù)分割,封裝讀寫分離,封裝數(shù)據(jù)訪問的路由、復(fù)制、合并、搬遷、熱點處理等功能,并且要對應(yīng)用透明,應(yīng)用針對性的,可以在JDBC層面包裝,數(shù)據(jù)庫針對性的,可以在數(shù)據(jù)庫協(xié)議層包裝,比如Amoeba。

關(guān)注系統(tǒng)和人的交互

還有一個故事,在數(shù)據(jù)層的前期版本,為了做到透明的路由,曾經(jīng)采用無SQL的方式,所有的數(shù)據(jù)庫訪問都是寫代碼來做。上線后發(fā)現(xiàn)一個非常痛苦的問題,無法和SQL對應(yīng),排錯非常難。曾經(jīng)一次DBA發(fā)現(xiàn)數(shù)據(jù)庫上一個查詢耗費太多資源,把優(yōu)化后的SQL給開發(fā)人員改進(jìn),開發(fā)人員好幾天沒找到具體是哪個查詢。

另外一個在2009年的感觸是業(yè)界服務(wù)化的實施情況,很多組織都在實施服務(wù)化,系統(tǒng)層面都很成功,通信、負(fù)載均衡、消息系統(tǒng)、服務(wù)容器等都有很多成果,但是實施一段時間以后的效果并不是非常好,依賴復(fù)雜,變更混亂,效率低下。究其根本,是對人的關(guān)注不夠,缺少的產(chǎn)品化的服務(wù)運維,缺少服務(wù)治理。

上面的兩個例子都是對人的關(guān)注缺失,技術(shù)人員做系統(tǒng),大部分都更關(guān)注技術(shù),而忽視技術(shù)的創(chuàng)造者和使用者——人。軟件或服務(wù)的可測試性是對測試人員的關(guān)注、可維護(hù)性和可管理性是對運維人員的關(guān)注,而一個框架的易用性是對所有使用人員的關(guān)注。除非能做出自己進(jìn)化的Skynet(注:Skynet(天網(wǎng))出現(xiàn)在《終結(jié)者》系列電影中,是一個人類于20世紀(jì)后期創(chuàng)造的以計算機為基礎(chǔ)的人工智能防御系統(tǒng),最初是研究用于軍事的發(fā)展。天網(wǎng)在控制了所有的美軍的武器裝備后不久,獲得自我意識,并且認(rèn)定人類是它存在的威脅。于是立刻倒戈對抗其創(chuàng)造者,采用大規(guī)模殺傷性武器(甚至核暴)來滅絕全人類。),否則還是要多關(guān)注系統(tǒng)和人的交互。

關(guān)注可用性

還有一個感觸是業(yè)界對可用性這個基本指標(biāo)的關(guān)注度不夠。幾乎所有的框架都會說自己的擴展性多高,性能多好,而很少會提到監(jiān)控有多強、排錯有多容易,很少提到在故障時怎么做隔離,怎么做降級;從這個角度看,商用的產(chǎn)品確實做得好很多;關(guān)于性能相關(guān)的文章搜索一下,很多,各種優(yōu)化策略,各種優(yōu)化方法,而可用性方面,找到的系統(tǒng)性的知識真的很少;希望是我了解的不多。

原作者:未知

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容