客戶背景

北京優(yōu)絡(luò)時代科技有限公司——也就是 YOLO,是一個專注于移動互聯(lián)網(wǎng)的創(chuàng)業(yè)團隊,成立之初就獲得百萬級美金的種子輪投資。
旗下產(chǎn)品 YOLO 是一款私密視頻直播互動工具,在 YOLO 里通過簡單地操作便可選定好友,發(fā)起直播,共享屬于特定小圈子的生活樂趣。私密的房間入口可以保護隱私,讓直播只屬于被邀請的人,同時 YOLO 獨創(chuàng)了進行多人語音互動功能,采取了「閱后即焚」的直播方式,讓直播沒有備份,沒有重來,這也貼合 You Only Live Once 的理念。
YOLO 團隊組建于2015年5月,位于北京市三里屯 SOHO。三位創(chuàng)始人曾為某過億用戶量產(chǎn)品運營總監(jiān)、游戲界傳奇副總裁以及視頻直播界的技術(shù)男神,還有來自新浪、騰訊、金山的資深互聯(lián)網(wǎng)人。
YOLO 選擇以私密視頻直播互動工具為切入點,還原了現(xiàn)實世界人與人之間的長連接及強互動,是一種新穎的方式。而作為一個初創(chuàng)團隊,在技術(shù)方面也不能因人員和資源較少而含糊,這個時候,YOLO 選擇了 Cloud Insight 作為性能監(jiān)控解決方案。
面臨問題
客戶搭建了數(shù)臺阿里云主機,采用 nignx+php+Redis 架構(gòu)。由于客戶是初創(chuàng)團隊,在人員和資源方面都比較不足。因此需要一款優(yōu)秀的性能監(jiān)控工具,對云主機和 Redis 進行監(jiān)控,幫助其提高在運維方面的效率同時降低運維成本。
Cloud Insight 采用 StatsD 的采集技術(shù),對接 MySQL、Redis、MongoDB,以及 CentOS、RedHat 操作系統(tǒng),利用 Hbase 存儲和 OpenTSDB 的數(shù)據(jù)聚合、切片等功能,最終流向 Cloud Insight 進行展現(xiàn)。從而幫助優(yōu)絡(luò)時代實現(xiàn)低成本、高效的自動化運維。

解決方案
客戶使用 Cloud Insight 和阿里云進行基礎(chǔ)組件的監(jiān)控,利用 Application Insight 和 Cloud Insight 結(jié)合解決了 Redis 連接數(shù)和其他性能問題。
基礎(chǔ)組件監(jiān)控


通過 Cloud Insight 的拓撲功能,我們可以同時看到優(yōu)絡(luò)時代幾臺云主機的實時性能狀況,迅速了解哪一臺云主機出現(xiàn)了資源緊張或其他問題,定位到該機器。再通過 system 指標總覽圖,對性能有進一步了解,包括系統(tǒng)負載、CPU 使用率、磁盤容量、IO 讀寫速率和次數(shù)等。
Regis 連接數(shù)

Cloud Insight 提供包括的 Redis 在內(nèi)的 20 多種平臺監(jiān)控服務,從 Redis 總覽部分可以看到 Redis 的實時性能。再輕松地切換到 Application Insight 產(chǎn)品,可以看到 Redis 每次請求的的響應時間、執(zhí)行次數(shù),點進數(shù)據(jù)庫可以了解到 Redis 的詳細性能情況,包括響應時間、吞吐量、調(diào)用時間占比等等。


客戶反饋
不足之處
客戶希望能夠?qū)⑦M程的監(jiān)控集成到現(xiàn)在 Cloud Insight 的基礎(chǔ)組件監(jiān)控之中。同時對我們與阿里云的區(qū)別有一些疑問。
傳統(tǒng)的使用阿里云或者 Zabbix 進行運維會明顯感受到一個痛點:沒有辦法對數(shù)據(jù)做聚合,只能挨個查看主機的性能指標,更不用說有管理的功能。而 Cloud Insight 在支持多種操作系統(tǒng)、云主機、數(shù)據(jù)庫和中間件的監(jiān)控的基礎(chǔ)上,還能夠?qū)?shù)據(jù)進行聚合與分組,對集群的監(jiān)控來說更為方便。關(guān)于這一點,我們在早期的一篇文章 數(shù)據(jù)聚合 & 分組:新一代系統(tǒng)監(jiān)控的核心功能 中進行過講解。
除此之外,更擁有邏輯清晰、簡潔的事件流展示,在提供報警之外還能夠方便用戶在 Cloud Insight 平臺中進行跨部門協(xié)作。
優(yōu)絡(luò)時代也曾經(jīng)自行搭建對進程的監(jiān)控,但由于算法的問題存在一些數(shù)據(jù)不準的問題,產(chǎn)品經(jīng)理說:「所以暫時先把這個功能下線了,后期我們會優(yōu)化后再上線的?!苟?Cloud Insight 也會進一步改善我們的產(chǎn)品,更深層的發(fā)掘自身的核心價值,為客戶提供更好的用戶體驗。
客戶對 Cloud Insight 價值的認可
- Cloud Insight整體是比較贊,能夠真正的幫其解決實際問題,降低運維成本。
- 頁面展示和實際的用戶體驗比較好,尤其是在頁面展示上優(yōu)于阿里云自帶的監(jiān)控軟件。
- SDK 功能很強大,以后會有相應的基于 Cloud Insight 自主開發(fā)的需求。
Cloud Insight 集監(jiān)控、管理、計算、協(xié)作、可視化于一身,幫助所有 IT 公司,減少在系統(tǒng)監(jiān)控上的人力和時間成本投入,讓運維工作更加高效、簡單。本文由 OneAPM 工程師翻譯整理,想閱讀更多技術(shù)文章,請訪問 OneAPM 官方技術(shù)博客。
本文轉(zhuǎn)自 OneAPM 官方博客