(文章始發(fā)個人公眾號:川術(shù);歡迎關(guān)注)
你有沒有遇到過這樣的情況:不同的數(shù)據(jù)報告或產(chǎn)品中,相同的指標名稱,卻對應(yīng)著不同的數(shù)字和不同的計算口徑?相信大部分人會點頭。我所在的環(huán)境中,這個問題已然成為頑疾,我們正在努力!解決該問題的關(guān)鍵點之一,便是:指標命名。
在簡單的業(yè)務(wù)場景中,抓住以下幾點,指標的命名一般不成問題:
- 指標名稱“名副其實”和“簡潔易懂”
- 遵照一定的行業(yè)慣例或者規(guī)范(如財務(wù)指標、電商經(jīng)營指標)
當(dāng)業(yè)務(wù)規(guī)模大,相似的職能線多,相似的部門多了后,數(shù)據(jù)對齊的難度陡增(這一定程度上也會是組織架構(gòu)的不合理的體現(xiàn),但本文不對此展開討論)。如何讓指標命名規(guī)范,變成為了一個大問題。我們分兩步來解決這個問題。
一、解析一個指標的天然構(gòu)造

如上圖,每個數(shù)據(jù)指標,其實都可以分解為“業(yè)務(wù)主題+限制條件+計算維度+指標名稱”的結(jié)構(gòu)。
業(yè)務(wù)主題,可理解為指標應(yīng)用的業(yè)務(wù)范圍。這里可以是具體某個業(yè)務(wù)部門,比如市場部;某個項目,比如客戶留存提升;某種職能,比如質(zhì)控、KPI、數(shù)據(jù)研發(fā)等;甚至是某個分析師名字,比如404。業(yè)務(wù)主題,理應(yīng)能幫助指標閱讀者迅速理解這個指標的來源。
限制條件,即是指標計算時需要處理的某些必要條件(不做處理指標會脫離業(yè)務(wù)意義)。對于分析師來說,更直觀的理解是SQL里面的WHERE條件。比如,app活躍用戶計算時只計算登陸時間在1分鐘以上的用戶數(shù);網(wǎng)站注冊轉(zhuǎn)化率計算時剔除爬蟲訪問;電商客單價計算時剔除大促訂單;外賣單量計算時限制即時單等。
計算維度,即指標做某種維度切分后進行的匯總。比如城市、時段、區(qū)域等。這點是可選項。限制條件實質(zhì)上也是某種維度,但我建議分開理解。限制條件是每個指標計算時必須要考慮的,而維度并不是。
最后是指標名稱,要求名副其實且簡潔易懂。
二、由構(gòu)造形成命名
認識到指標名稱的構(gòu)造,命名也就不難了。將各個結(jié)構(gòu)進行羅列并用某種字符連接后,就是一個清晰的指標名稱。我個人就比較習(xí)慣用“-”,如“數(shù)據(jù)研發(fā)-去爬蟲-上海-獨立訪客數(shù)”。
另外,每部分結(jié)構(gòu)中,有時會同時出現(xiàn)多個條件,若是交集,建議用“-”符號連接,若是并集,用“&”符號連接。
但是問題來了,每個指標名稱,都要覆蓋4個結(jié)構(gòu),名稱就會很長,應(yīng)用起來不方便。所以,我的建議是,除了業(yè)務(wù)主題外,其他結(jié)構(gòu)都是可以設(shè)置默認值,進而在名稱中隱去,使得指標名稱形成“主題-名稱”的簡寫形式。當(dāng)然,默認值的說明一定要清晰。
當(dāng)某些場景下(數(shù)據(jù)產(chǎn)品開發(fā)、可視化呈現(xiàn)等),業(yè)務(wù)主題加名稱的形式已然過長,可只保留名稱,而將業(yè)務(wù)主題變成注釋形式另外展示。
總結(jié)一下,指標名稱,本質(zhì)上有全稱和簡稱兩種形式,普遍應(yīng)用簡稱,而使用者心里需明白全稱。
補充一點:“限制條件”、“計算維度”的默認值,應(yīng)當(dāng)取最普遍的情況,讓數(shù)據(jù)使用者的理解成本降到最低。比如,活躍訪客數(shù)的計算,大家普遍認知是剔除了爬蟲訪問,那么限制條件隱去的默認值便設(shè)置為此。當(dāng)然,一定的宣導(dǎo)不能忽略。
給一個我們現(xiàn)實業(yè)務(wù)的樣例:
全稱,質(zhì)控-全國-直營-平臺單-即時單&預(yù)訂單-組織運力&眾包運力-全標品-全維度-有效完成率;
簡稱,質(zhì)控-有效完成率。
本文所提出的命名方式,正在試驗階段,大規(guī)模應(yīng)用能否實現(xiàn),還需要驗證。希望這樣的思路能給你帶來一些啟發(fā),也許就能設(shè)計出一套更合理的方案。