專訪UnitedStack創(chuàng)始人程輝:互聯(lián)網(wǎng)精神+開源戰(zhàn)略=成功的托管云

編者按

“總編訪談”是InfoQ推出的一個高端訪談欄目,由總編輯崔康主持,致力于深入采訪國外內(nèi)頂尖技術(shù)力量,報道最前沿、最有深度的內(nèi)容,分享干貨和經(jīng)驗(yàn)。

本次受訪嘉賓是UnitedStack創(chuàng)始人程輝,就云計算市場的現(xiàn)狀、發(fā)展趨勢,以及UnitedStack在業(yè)務(wù)方面的戰(zhàn)略調(diào)整給出了自己的解讀。

InfoQ:為什么UOS1.0是做發(fā)行版,而從2.0開始做公有云和托管云了?

程輝:公司2013年成立,在當(dāng)年10月份的時候發(fā)布UOS1.0,當(dāng)時的想法很簡單,很多廠商都推出高度產(chǎn)品化、定制化或者優(yōu)化過的OpenStack發(fā)行版,然后通過外圍的一些服務(wù)掙錢。我們也想解決OpenStack的一些痛點(diǎn),比如自動化部署、運(yùn)維等,并針對國內(nèi)用戶的使用習(xí)慣進(jìn)行了改進(jìn),最終發(fā)布了UOS1.0。產(chǎn)品本身是比較酷的,把U盤做成了一個產(chǎn)品,交付給任何一家IT公司或者個人用戶,在服務(wù)器上插上U盤,過一會就搭建出一個云環(huán)境。

但我一直在反思。用戶拿到了UOS1.0之后,整個安裝過程非??旖?,但是用戶拿UOS 1.0來提供7x24小時持續(xù)的云服務(wù)還是很遙遠(yuǎn)。我們只是解決了從無到有的問題,而這只是萬里長征第一步,接下來還需要提供對外服務(wù),保證產(chǎn)品不宕機(jī)可擴(kuò)展,而當(dāng)時我們并沒有解決這個問題。

所以,公司做了重大的業(yè)務(wù)轉(zhuǎn)型。把UOS 1.0中的的核心技術(shù)包括分布式存儲、高性能網(wǎng)絡(luò)、優(yōu)化的主機(jī)調(diào)度等,應(yīng)用到自己的公有云上,開放給公眾使用。當(dāng)時還沒有考慮商業(yè)模式的事情,只是覺得我們應(yīng)當(dāng)把這些有價值的技術(shù)和產(chǎn)品開放出去,讓別人受益,公司就自然就有價值了。說做就做,我們拿出了公司剩余的大部分錢在北京租了機(jī)房,買了一批設(shè)備,從核心技術(shù)到計費(fèi)平臺、說明文檔、注冊系統(tǒng)、自動化運(yùn)維等,花了近半年的時候做公有云。

InfoQ:公有云發(fā)布之后遇到了哪些挑戰(zhàn)?

程輝:主要有三個挑戰(zhàn):

第一,如何在堅持OpenStack開放標(biāo)準(zhǔn)的同時滿足國內(nèi)客戶定制化的需求。UnitedStack云服務(wù)完全基于OpenStack開放API構(gòu)建,但是OpenStack開放API并不能完全滿足客戶需求,因此這里需要與社區(qū)做足夠的溝通工作,將這些差異化的需求提交給社區(qū),同時我們還在保證100%兼容的目標(biāo)的情況下對OpenStack API進(jìn)行擴(kuò)展。這對于團(tuán)隊對于OpenStack開發(fā)能力有足夠的自信才能做到。

第二,平衡OpenStack社區(qū)開發(fā)與生產(chǎn)運(yùn)營的差異。社區(qū)開發(fā)時,我們只需要完成功能開發(fā)和測試,但當(dāng)我們要生產(chǎn)運(yùn)營一個OpenStack云平臺時,這時需要考慮平臺運(yùn)營過程中可能出現(xiàn)的各種事件,比如物理服務(wù)器宕機(jī),存儲擴(kuò)容、縮容,磁盤故障,網(wǎng)絡(luò)抖動和攻擊等,需要為每一種異?;蛘呤?zhǔn)備預(yù)案,及自動化運(yùn)維措施,并及時響應(yīng)。

第三,獲得客戶信任。作為一個新興公有云平臺,獲得客戶信任是一個漫長的過程,任何一次異?;蛘吖收隙紩?dǎo)致客戶信心的丟失,客戶幾乎不能容忍一次故障,這是最大的挑戰(zhàn)。平臺每天都會有更新和升級,也不能中斷客戶業(yè)務(wù)。

InfoQ:UnitedStack為什么提供托管云業(yè)務(wù),出于什么考慮?

程輝:有句話說“出來混總是要還的”,剛開始創(chuàng)業(yè)的時候,我們沒想商業(yè)模式,從發(fā)行版到公有云,都沒想好怎么賺錢。我們知道現(xiàn)在很多公有云都是巨頭在做,幾十億的資本投進(jìn)去才可以做好。作為一個小的創(chuàng)業(yè)公司做公有云,你確實(shí)有機(jī)會,但是相比資本的力量,這是上百倍的差距,你在市場上可能有競爭力,但是很難做的比他們更好。

我開始思考如何進(jìn)一步商品化整個公司的品牌和技術(shù),在國內(nèi),有一批大客戶,對云的需求量更大,而且沒有哪一家公有云可以服務(wù)好他們。大到什么程度呢?大到用公有云已經(jīng)很不劃算了。比如對彈性計算要求極高的新興的移動互聯(lián)網(wǎng)公司、游戲公司,還有對云擴(kuò)展性和安全性要求高的銀行和互聯(lián)網(wǎng)金融公司等,他們的業(yè)務(wù)量規(guī)模大且比較需求量比較固定,而且對于安全性、數(shù)據(jù)主權(quán)等要求極高,因此這些客戶不太放心將這些業(yè)務(wù)放到公有云上。

所以,我們推出了托管私有云(Managed Private Cloud),可以理解成獨(dú)享的公有云。我們的核心價值在哪里?我經(jīng)常把云建設(shè)的投入分為三個部分,一是IDC資源,包括電力、帶寬、機(jī)位等,這是一個高度市場化的領(lǐng)域,比較成熟,這塊交給客戶去解決,因?yàn)閮r格已經(jīng)市場化了;二是服務(wù)器設(shè)備,更加市場化的領(lǐng)域,發(fā)展了幾十年,我們沒有必要做;三是獨(dú)立的技術(shù)平臺和運(yùn)維,這才是我們應(yīng)該做的事情,幫客戶做好管理、維護(hù)以及后續(xù)的升級,甚至新功能的研發(fā)、監(jiān)控等。

事實(shí)上,如果把托管云三部分的投入成本和同樣資源的公有云費(fèi)用做比較,就會發(fā)現(xiàn),托管云的整體成本只有公有云的1/3-1/5,看起來不可思議,但事實(shí)如此。目前,已經(jīng)有10個托管云的大客戶上線,機(jī)房12個,分布在北京、廣東、上海和東北地區(qū)。

我可以隨口算一下,做一個云計算環(huán)境,需要的人包括虛擬化工程師、存儲工程師、網(wǎng)絡(luò)工程師、監(jiān)控工程師、UI設(shè)計師、運(yùn)維工程師等等,每一個崗位都需要花很大價錢。托管云可以讓客戶節(jié)省大量的錢,關(guān)注自己的業(yè)務(wù)。在UnitedStack平臺,托管云的系統(tǒng)平臺和公有云是一樣的,有什么更新,都會同步升級。

InfoQ:既然托管云商業(yè)模式比較好,為什么還要做公有云,據(jù)我所知國內(nèi)的其他公有云市場盈利艱難。

程輝:這是個好問題,很多人都不理解。在沒有公有云之前,我們?nèi)ハ蚩蛻敉其N技術(shù)平臺時,客戶經(jīng)常會覺得你說的這個好東西沒有經(jīng)過驗(yàn)證,沒有看到實(shí)際的生產(chǎn)案例,沒有看到實(shí)際的用戶,后來,我們上線了公有云,讓大家看到我們的高性能、用戶體驗(yàn)、運(yùn)維、持續(xù)更新等能力,通過這些方式,客戶才開始接受我們的托管云。另外,不同企業(yè),在不同的階段,對云的需求是不一樣的,比如,互聯(lián)網(wǎng)創(chuàng)業(yè)公司,肯定初期傾向于公有云,待業(yè)務(wù)規(guī)模足夠大而且穩(wěn)定的時候,這時采用第三方服務(wù)的私有云可能是一個更好的解決方案,他們需要不同的云服務(wù)模式去支撐他們當(dāng)前的業(yè)務(wù)。因此,總結(jié)一下,公有云一方面滿足部分客戶的需求,另一方面,方便客戶構(gòu)建其混合云體系。因此,這里公有云也是我們商業(yè)模式的一部分。

InfoQ:關(guān)于托管云服務(wù),用戶自己找機(jī)房和數(shù)據(jù)中心,那么在搭建和維護(hù)云服務(wù)過程中,是不是偶爾需要你們派工程師去現(xiàn)場?

程輝:我們現(xiàn)在落地了10個大規(guī)模的托管云,幾乎沒有上門服務(wù)過!前期,我們會和客戶商量好,需要采購哪些設(shè)備,如果配置,發(fā)給他們一個表單,購買之后,我們的工程師會告訴他們?nèi)绾侮P(guān)聯(lián)這些設(shè)備,還是一個清單搞定。最后是打通VPN隧道,一旦完成,我們就可以通過遠(yuǎn)程方式部署第一臺種子機(jī)器,剩下的其他機(jī)器就會逐漸配置完畢。我們最快的客戶案例是從確定合同到托管云正式上線用了不到一個月的時間。我認(rèn)為,以云計算為中心的上下產(chǎn)業(yè)鏈配合的很好,IDC提供電力、機(jī)柜和帶寬服務(wù),硬件廠商提供基礎(chǔ)設(shè)施,我們提供云平臺技術(shù),上面的PaaS或者SaaS廠商提供相應(yīng)服務(wù),云生態(tài)和諧共存。

InfoQ:如果部署在客戶那里的托管云平臺系統(tǒng)需要升級,對客戶的服務(wù)是透明的嗎?

程輝:保證部署在客戶數(shù)據(jù)中心的托管私有云無中斷地平滑升級是我們的核心能力之一。面向大規(guī)模業(yè)務(wù)的互聯(lián)網(wǎng)分布式IT基礎(chǔ)架構(gòu)一個最重要的特點(diǎn)是不允許中斷。以微信為例,用戶基數(shù)很大,幾乎每分每秒都有人用,微信從上線到現(xiàn)在,幾乎每天都有很多變更,但不能中斷服務(wù)。云計算也是這個道理,客戶把服務(wù)交給我來管理,我需要既保持穩(wěn)定又要不斷的改進(jìn)、變更和升級。為了保障無中斷升級,我們推出了很多舉措,比如,我們在升級的時候,會給客戶的業(yè)務(wù)做熱遷移,保障業(yè)務(wù)連續(xù)性,用戶幾乎感覺不到服務(wù)中斷。通過這些手段,每次OpenStack推出新版本時,我們都能及時跟進(jìn),現(xiàn)在我們公有云和所有的托管云客戶都是運(yùn)行在最新的OpenStack Juno版本上的,我們?yōu)榭蛻籼峁┩泄艿腛penStack有一年多了,都是從早期的G版本一路升級過來的。既然我們做托管云,也需要按照最嚴(yán)格的公有云標(biāo)準(zhǔn)來要求自己。

InfoQ:分享下你在開源方面的心得吧。

程輝:這需要從我在新浪工作時說起,當(dāng)時我沒有做開源,接手的任務(wù)是把公司的云平臺盡快上線。我招了一批在校實(shí)習(xí)生,讓他們兩個月之內(nèi)不參與任何公司的內(nèi)部工作,只在社區(qū)中做,找bug,然后嘗試修補(bǔ)。如果提交的補(bǔ)丁不規(guī)范,就會被社區(qū)退回來,有人曾經(jīng)被打回20多次,通過這個過程,社區(qū)幫我很好的培養(yǎng)了這些人。在新人成熟之后,云平臺只用了一個月時間就上線了。 后來,我們被邀請去國外分享經(jīng)驗(yàn),我也有了創(chuàng)業(yè)的原始動力。后來就成立了UnitedStack,即使在資本很緊缺的情況下,我也會安排工程師全職在社區(qū)當(dāng)中做。正因?yàn)槿绱?,我們的系統(tǒng)穩(wěn)定性才會很高。

另外,社區(qū)的架構(gòu)設(shè)計和文檔對我們很有借鑒意義。比如,某一個開源的賬號體系,開始我們覺得特別復(fù)雜,設(shè)計了幾十個新的概念,不可思議。但是,后來我們在設(shè)計云平臺的賬號系統(tǒng)時,才發(fā)現(xiàn)人家的設(shè)計是多么好。如果沒有社區(qū)經(jīng)驗(yàn),是很難設(shè)計出來的。 通過社區(qū)讓我們知道了這些東西,讓云服務(wù)產(chǎn)品更加有競爭力。

InfoQ:你認(rèn)為UnitedStack的核心競爭力是什么?

程輝:剛才我已經(jīng)說了一些。第一個是開源,目前在中國市場主流的云當(dāng)中,我們算是唯一一個完全基于開源來構(gòu)建的商業(yè)的生產(chǎn)的云,我們目前云系統(tǒng)采用的兩大開源平臺,OpenStack和Ceph,不僅開源平臺為我們提供了源源不斷的動力,我們還有一批非常懂開源的工程師,保證我們團(tuán)隊在開源業(yè)界的領(lǐng)先水平。第二個是互聯(lián)網(wǎng)精神,既要變又要穩(wěn)。公司核心團(tuán)隊基本上來自于互聯(lián)網(wǎng)公司,因此我們有能力將互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施和運(yùn)維管理經(jīng)驗(yàn)帶到客戶的數(shù)據(jù)中心。第三個優(yōu)勢,商業(yè)模式的創(chuàng)新,我們是國內(nèi)第一家旗幟鮮明地提出托管云理念。如果對明年或者后年的云市場做一個預(yù)測的話,托管云會成為一個不可小覷的云計算細(xì)分市場。

InfoQ:你對目前云計算的發(fā)展現(xiàn)狀有什么樣的看法?

程輝:中國云計算市場現(xiàn)在還沒有清晰的市場區(qū)分,總體發(fā)展還處于初創(chuàng)和混沌期。具體表現(xiàn)在,目前主流的云服務(wù)產(chǎn)商均采用的是自研的私有技術(shù)、私有API,云平臺之間沒有統(tǒng)一的互通接口,缺少統(tǒng)一標(biāo)準(zhǔn),無法通過標(biāo)準(zhǔn)參數(shù)來衡量一個云服務(wù)的優(yōu)劣。

基礎(chǔ)設(shè)施云計算技術(shù),不論是IaaS還是PaaS,大約未來3~5年左右時間會成為高度商品化的技術(shù),商品化意味著花錢就可以買來,有市場有技術(shù),而且市場和技術(shù)可以交易和轉(zhuǎn)換,到那個時間,云計算市場競爭將從技術(shù)競爭真正轉(zhuǎn)變?yōu)橘Y源和服務(wù)的競爭。

比如,我們提出的托管云服務(wù)其實(shí)對應(yīng)國外的是Managed Private Cloud,這在國外是一種主流的私有云交付方式,不論廠商、企業(yè)用戶還是媒體都非常清楚。

InfoQ:云計算市場有哪些細(xì)分領(lǐng)域和玩家?他們分別有何特點(diǎn)?

程輝:我就按大家最常見的理解分為公有云和私有云兩大體系。公有云市場按平臺技術(shù)類型來看有兩大類:

第一大類是基于自研的私有技術(shù)的公有云,比如阿里、騰訊等互聯(lián)網(wǎng)巨頭提供的云平臺、外資的云(如AWS,Azure)、Ucloud,青云為代表的創(chuàng)業(yè)公司的云 ;

第二大類:基于開源技術(shù)構(gòu)建的公有云:如京東云、金山云,UnitedStack、還有電信、聯(lián)通等運(yùn)營商的云平臺,都是基于開源的OpenStack平臺構(gòu)建;

云計算和其他行業(yè)一樣,順應(yīng)從閉源技術(shù)到開源技術(shù)的發(fā)展趨勢,我們看到,2014年之后新成立的云平臺,基本上都屬于大二大類,基于開源構(gòu)建。

云計算是可以O(shè)EM的,透露一下,到目前為止,國內(nèi)已經(jīng)有接近10家IDC、互聯(lián)網(wǎng)公司公有云廠商的底層是Powered By UnitedStack的,即我們團(tuán)隊為其提供完整的公有云平臺、技術(shù)還有運(yùn)維服務(wù),初步實(shí)現(xiàn)了IaaS云平臺的商品化。

私有云有目前非常明顯兩大體系:

一類是商業(yè)VMware生態(tài),目前私有云市場占有率非常高,尤其是在傳統(tǒng)行業(yè),但是目前大量只解決了虛擬化的問題,分布式存儲、SDN網(wǎng)絡(luò)等云計算核心技術(shù)還很難應(yīng)用起來。

第二類還是OpenStack開源私有云生態(tài),目前OpenStack開源私有云模式已經(jīng)被廣泛接受,在VMware最穩(wěn)定的、市場占用率最高的金融和政企行業(yè)也可以看到越來越多的應(yīng)用案例。UnitedStack的OpenStack私有云方案已經(jīng)幫若干家金融和銀行公司替換掉了VMware解決方案。

InfoQ:按照以前的IT規(guī)模,可能是市場成熟之后,有兩三個比較大的賣家。你覺得云計算這個市場,會遇到這個問題嗎?

程輝:不會例外,也會是這樣的,大者恒大,因此,我們在未來兩年必須變得強(qiáng)大起來,否則就會被淘汰出局。

InfoQ:UnitedStack在未來幾年的路線圖是什么?

程輝:技術(shù)路線上,我們會堅持開源,投入更多資源將開源項(xiàng)目產(chǎn)品化。在基礎(chǔ)設(shè)施服務(wù)層面,高性能SDN網(wǎng)絡(luò)和高性能統(tǒng)一存儲將持續(xù)是我們的重點(diǎn)。SDN網(wǎng)絡(luò)在開源界也是最近兩三年才開始逐漸被關(guān)注和被應(yīng)用起來,目前已經(jīng)初步實(shí)現(xiàn)了SDN網(wǎng)絡(luò)的構(gòu)想,但其性能和穩(wěn)定性還有進(jìn)一步提升空間,在我們的計劃中,未來1年,SDN網(wǎng)絡(luò)的性能還有3到5倍的提升,并且會新增更多企業(yè)級安全特性,進(jìn)一步滿足嚴(yán)肅的企業(yè)級應(yīng)用。

高性能統(tǒng)一存儲的目標(biāo)很簡單,不僅要完美的替代傳統(tǒng)的SAN企業(yè)級塊存儲,還能夠?yàn)?a target="_blank" rel="nofollow">大數(shù)據(jù)、對象存儲等業(yè)務(wù)提供底層支撐。性能優(yōu)化方面,目前我們的分布式存儲讀寫IO延遲已經(jīng)突破了1毫秒,幾乎接近分布式塊存儲的極限。在提供極高性能的同時,我們還在數(shù)據(jù)安全性方面下了很大努力。今年會繼續(xù)在存儲多樣化上下努力,比如,剛剛上線的NAS存儲服務(wù)和虛擬SAN功能,在行業(yè)內(nèi)也是獨(dú)一無二的。

基于扎實(shí)的基礎(chǔ)設(shè)施架構(gòu),我們還將在PaaS層構(gòu)建更多服務(wù)。

首先是容器技術(shù)的大規(guī)模商用。UnitedStack是國內(nèi)第一家提供容器服務(wù)的云服務(wù)廠商,今年將在Docker存儲和網(wǎng)絡(luò)方面做一些功能優(yōu)化,解決目前阻礙Docker容器服務(wù)商用的問題;

其次,將大數(shù)據(jù)與統(tǒng)一存儲做整合,將OpenStack云平臺和Hadoop大數(shù)據(jù)平臺兩大開源體系全二為一,真正實(shí)現(xiàn)我們內(nèi)部早年提出的“一個底層,多個平臺”的構(gòu)想;

第三,將持續(xù)引入更多的開源的和商用的PaaS層服務(wù),比如MySQL,MongoDB,Oracle數(shù)據(jù)庫服務(wù),Redis, Memcache等緩存服務(wù),讓開發(fā)和運(yùn)維變得更簡單。

本文轉(zhuǎn)載自infoQ

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容