倉(cāng)儲(chǔ)實(shí)務(wù)討論(改善):20. 現(xiàn)場(chǎng)數(shù)據(jù)分析

原文地址:http://blog.kantli.com/theme/5

這一系列的文章,是小團(tuán)隊(duì)內(nèi)的實(shí)務(wù)討論稿,放出來(lái)以便有更多的交流與討論。其中多是作為一個(gè)非專業(yè)人員的實(shí)際工作體會(huì),必然存在許多錯(cuò)誤或不當(dāng)之處,請(qǐng)多指教!


一、問題


管理學(xué)上有句名言:如果你不能解決問題,說(shuō)明你就是問題。

這兩年數(shù)據(jù)分析的概念很流行,主要的原因,是前幾年信息技術(shù)的快速發(fā)展,各種手機(jī)電腦之類的電子終端的普及使用,積累了不少數(shù)據(jù),或者說(shuō),讓數(shù)據(jù)采集的工作變得很簡(jiǎn)單了。

然而并沒有什么用,目前來(lái)說(shuō),真正在數(shù)據(jù)分析方面應(yīng)用得當(dāng),獲得實(shí)質(zhì)好處的,可能也就是一些大公司,而讓數(shù)據(jù)分析深入普及,進(jìn)入我們生活工作的方方面面細(xì)節(jié)之中,并且發(fā)揮作用,解決問題,才是我們的目標(biāo)。

倉(cāng)庫(kù)現(xiàn)場(chǎng)的信息化程度正在快速發(fā)展,事實(shí)上可能已經(jīng)有一個(gè)比較好的基礎(chǔ)了,那么就有很多人說(shuō)要多做數(shù)據(jù)分析,好像把一堆數(shù)據(jù)做成花花綠綠的圖表,貼到PPT上,整個(gè)現(xiàn)場(chǎng)就變得高大上了。

我們天天待現(xiàn)場(chǎng)的人,對(duì)這種為數(shù)據(jù)而分析的思維,是難以認(rèn)同的,最基本的原則就是,如果數(shù)據(jù)分析不能幫助現(xiàn)場(chǎng)解決問題,那么這個(gè)動(dòng)作本身就是問題。

為數(shù)據(jù)而分析,本質(zhì)上是為上級(jí)要求而分析,弄出花花綠綠的圖表來(lái),主要是為了應(yīng)付領(lǐng)導(dǎo)交代的任務(wù)。

事實(shí)上數(shù)據(jù)分析對(duì)于解決現(xiàn)場(chǎng)的問題是有用的,有用的前提就是數(shù)據(jù)分析要根據(jù)現(xiàn)場(chǎng)的實(shí)際情況來(lái),要跟著具體的操作流程走,要驗(yàn)證或者修正現(xiàn)場(chǎng)人員的直覺經(jīng)驗(yàn)。


二、邏輯


之前我們說(shuō),數(shù)據(jù)是對(duì)事實(shí)的抽象,今天我們討論數(shù)據(jù)分析,第一個(gè)要提醒的還是這個(gè)。

我們看到的每一個(gè)數(shù)據(jù),都應(yīng)該能表達(dá)成對(duì)事實(shí)的描述、推測(cè)或判斷。

給出一個(gè)數(shù)據(jù),就需要明白這個(gè)數(shù)據(jù)所代表的是什么意思。當(dāng)我們開始追問每一個(gè)數(shù)據(jù)代表的具體意思的時(shí)候,就能輕易地看到很多數(shù)據(jù)指標(biāo)的荒謬,也能快速地找到自己所需要的數(shù)據(jù)指標(biāo)和分析邏輯,而這是進(jìn)行現(xiàn)場(chǎng)數(shù)據(jù)分析的基礎(chǔ)。

以我們討論過(guò)的例子來(lái)說(shuō):代表庫(kù)存壓力的是什么數(shù)據(jù)?一般來(lái)說(shuō)是庫(kù)存數(shù)據(jù)。那么:

  • 是期初庫(kù)存、期末庫(kù)存、最小庫(kù)存、最大庫(kù)存、還是平均庫(kù)存?是一個(gè)月內(nèi)的平均庫(kù)存還是連續(xù)三天的平均庫(kù)存?
  • 統(tǒng)計(jì)庫(kù)存的口徑,是按SKU數(shù)、件數(shù)、重量還是體積?

如果我們不去思考每一個(gè)數(shù)據(jù)、每一種統(tǒng)計(jì)口徑背后所代表的具體意思,和現(xiàn)場(chǎng)操作的基本關(guān)系,是回答不了這個(gè)問題的。

沒有回答這個(gè)問題,最后統(tǒng)計(jì)出來(lái)一個(gè)所謂的結(jié)果,就不會(huì)有什么意義,很多時(shí)候和現(xiàn)場(chǎng)的直覺經(jīng)驗(yàn)也完全不符,這樣的數(shù)據(jù)分析,本身就是一個(gè)問題。

所以我們的主張是,現(xiàn)場(chǎng)數(shù)據(jù)分析應(yīng)該由現(xiàn)場(chǎng)的人來(lái)做,沒有豐富現(xiàn)場(chǎng)經(jīng)驗(yàn)的人,甚至根本沒去過(guò)現(xiàn)場(chǎng)的人,是不太容易做好的,可能辛辛苦苦做出來(lái)一個(gè)高度復(fù)雜的數(shù)據(jù)模型,得出一個(gè)振奮人心的結(jié)論,結(jié)果被現(xiàn)場(chǎng)的人一句簡(jiǎn)簡(jiǎn)單單的提醒擊碎夢(mèng)想。

那么反過(guò)來(lái)說(shuō),也就是現(xiàn)場(chǎng)操作人員有必要掌握基本的數(shù)據(jù)分析邏輯。

現(xiàn)場(chǎng)問題從開始到結(jié)束的的過(guò)程,大概可以分為四個(gè)步驟:發(fā)現(xiàn)問題、追溯問題、提出方案、檢查結(jié)果。發(fā)現(xiàn)問題的前提是對(duì)現(xiàn)狀的準(zhǔn)確描述,追溯問題的過(guò)程也就是對(duì)某個(gè)現(xiàn)象的逆推分析,提出方案的基礎(chǔ)是對(duì)未來(lái)的情況做出推斷,檢查結(jié)果也就是描述某種特定情況的變化。

數(shù)據(jù)分析的基本思路,也就是從這里出發(fā)的:

  1. 其一是數(shù)據(jù)描述,也就是查看現(xiàn)場(chǎng)流程,或者某個(gè)特定對(duì)象的具體情況,從而發(fā)現(xiàn)異常或者追蹤結(jié)果;
  2. 其二是數(shù)據(jù)追溯,也就是發(fā)現(xiàn)一個(gè)值得關(guān)注的情況之后,去追查背后的線索關(guān)聯(lián),分析原因由來(lái);
  3. 其三是數(shù)據(jù)推斷,也就是預(yù)計(jì)某種情況的未來(lái)走向,推測(cè)某種方案實(shí)施后的影響;

三、數(shù)據(jù)描述——層層分解


數(shù)據(jù)描述有兩個(gè)基本問題,首先是描述什么,其次是如何描述。相對(duì)來(lái)說(shuō),如何描述主要是一個(gè)技術(shù)問題,而描述什么則是問題的核心。

就數(shù)據(jù)的描述性分析而言,肯定不是從一堆繁雜的數(shù)據(jù)開始的——在真正開始采集數(shù)據(jù)或接觸數(shù)據(jù)之前,我們要做的,是安安靜靜地坐下來(lái),仔細(xì)地分析現(xiàn)場(chǎng)的流程結(jié)構(gòu),從而梳理出自己所需要描述的對(duì)象到底是什么。

這個(gè)分析梳理的過(guò)程,一般稱為現(xiàn)象或問題的分解。分解的主要目的,是把大的流程分成一個(gè)個(gè)小節(jié)點(diǎn),把大的問題分成一個(gè)個(gè)小枝節(jié),一方面可以避免我們忽略事物內(nèi)部的細(xì)節(jié)邏輯,另一方面也方便我們找到更為準(zhǔn)確,更貼合實(shí)際的數(shù)據(jù)指標(biāo)。

以對(duì)倉(cāng)庫(kù)的流程分析為例,我們的基本目標(biāo),是判斷一定期間內(nèi),現(xiàn)場(chǎng)的操作流程是否運(yùn)行順暢,有沒有什么值得關(guān)注的情況變化。

這個(gè)目標(biāo)是比較籠統(tǒng)的,該用什么數(shù)據(jù)進(jìn)行描述,怎樣描述才能符合現(xiàn)場(chǎng)的實(shí)際情況呢?不好說(shuō)。

有人認(rèn)為可以用出入庫(kù)操作量來(lái)表達(dá),但操作量本身和是否順暢關(guān)系不大;有人認(rèn)為可以用操作團(tuán)隊(duì)的加班時(shí)間來(lái)看,也是一樣的問題;或者有人說(shuō)可以從操作異常情況來(lái)看,那么操作異常是什么?它是不是完整反映了整個(gè)流程的執(zhí)行?異常的由來(lái)都是哪些地方?

因此,我們有必要把操作流程進(jìn)行分解,可能得到入庫(kù)流程、存儲(chǔ)流程、加工流程、出庫(kù)流程幾個(gè)部分,為了了解這些流程部分,又有必要進(jìn)行二次分解:

  • 入庫(kù)流程來(lái)說(shuō),需要關(guān)注入庫(kù)單證操作、卸貨操作、暫存操作、入庫(kù)操作分別運(yùn)行得怎么樣。就每一種操作而言,我們又關(guān)心它們的數(shù)量變化情況如何?結(jié)構(gòu)上是不是有什么變動(dòng)?整件的貨物多了還是散裝的貨物多了?是哪種類別的貨物增加了或減少了?有沒有操作失誤?這些操作失誤主要是哪些原因造成的?

  • 存儲(chǔ)流程來(lái)說(shuō),也可能分解為幾個(gè)小的部分。比如說(shuō)整件貨物或散件貨物的分別存儲(chǔ)情況,或者托盤庫(kù)區(qū)、重型貨架庫(kù)區(qū)、輕型貨架庫(kù)區(qū)的存儲(chǔ)情況。針對(duì)每個(gè)小的部分,我們又提出更小的關(guān)注點(diǎn),比如說(shuō)庫(kù)區(qū)環(huán)境的維護(hù)情況、庫(kù)存空間的利用情況等等。

  • 加工流程來(lái)說(shuō),可能按照不同貨品或不同加工動(dòng)作進(jìn)行分解,分別關(guān)注這些加工流程的操作效率情況、加工過(guò)程的產(chǎn)出率、耗材使用情況等。

  • 出庫(kù)流程來(lái)說(shuō),大概要分成訂單處理、揀貨操作、打包操作、出庫(kù)暫存、裝車交接、配送過(guò)程、簽收交接、單證管理等部分。而對(duì)每一個(gè)部分,我們可能再進(jìn)行進(jìn)一步的分解,或者分別提出有針對(duì)性的細(xì)節(jié)問題。

層層分解下來(lái),我們的問題已經(jīng)從一個(gè)變成了幾十個(gè),但對(duì)原始問題的內(nèi)部結(jié)構(gòu)和邏輯關(guān)系有了更具體的理解,并且這幾十個(gè)問題,每一個(gè)都比最開始的那個(gè)更為簡(jiǎn)單,更為直接,更容易找到可用的數(shù)據(jù)進(jìn)行回答。

有時(shí)甚至可以說(shuō),不經(jīng)過(guò)這樣一個(gè)層層分解的過(guò)程,是很難說(shuō)我們已經(jīng)清楚自己所需要描述的對(duì)象的。

比如我們說(shuō),我們想通過(guò)數(shù)據(jù)分析來(lái)了解倉(cāng)庫(kù),那么倉(cāng)庫(kù)是什么?是一座房子?是庫(kù)區(qū)的貨架和操作工具?是里面存儲(chǔ)的各種貨物?是每天忙忙碌碌的操作團(tuán)隊(duì)?還是一套標(biāo)準(zhǔn)操作流程?

只有對(duì)我們要描述的對(duì)象進(jìn)行分解之后,我們才能明確地回答,或者說(shuō)有意地限定這個(gè)對(duì)象的范圍和含義。至于如何分解,分解到哪一步,則完全取決于現(xiàn)場(chǎng)的流程設(shè)計(jì),分析者的主要目標(biāo)和數(shù)據(jù)采集的便利性。


四、基本描述統(tǒng)計(jì)概念


當(dāng)我們對(duì)數(shù)據(jù)描述的對(duì)象有了一個(gè)層次分明、邏輯清楚的結(jié)構(gòu)化理解之后,就可以逐步開始接觸數(shù)據(jù)了。大多數(shù)情況下,我們對(duì)現(xiàn)場(chǎng)數(shù)據(jù)的描述性分析,只需要用到描述性統(tǒng)計(jì)里面的基礎(chǔ)概念,事實(shí)上多半都是小學(xué)或初中數(shù)學(xué)課本上的知識(shí)。

一方面是因?yàn)槲覀儗?duì)現(xiàn)場(chǎng)的具體情況有比較切實(shí)的認(rèn)知,太過(guò)深入的數(shù)據(jù)抽象不一定容易結(jié)合現(xiàn)場(chǎng)情況進(jìn)行理解,另一方面是倉(cāng)庫(kù)現(xiàn)場(chǎng)的總體流程模式比較簡(jiǎn)單,一些基礎(chǔ)的概念就可以滿足大多數(shù)的描述需求。


這些基本的描述統(tǒng)計(jì)概念主要包括幾類:

  1. 一類是描述數(shù)據(jù)峰值的,也就是最大值和最小值。

對(duì)于現(xiàn)場(chǎng)操作,有些數(shù)據(jù)是需要參考峰值的。

一個(gè)例子是庫(kù)存壓力,比如說(shuō)一些季節(jié)性貨物倉(cāng)庫(kù),庫(kù)存量在一年內(nèi)的起伏很大,真正有庫(kù)存壓力的時(shí)候是貨物大規(guī)模存儲(chǔ)的時(shí)候。我們分析這樣的倉(cāng)庫(kù),按平均值的指標(biāo)或者某個(gè)特定時(shí)候的指標(biāo)都沒有什么意義,按平均庫(kù)存量準(zhǔn)備庫(kù)存空間的結(jié)果,就是在庫(kù)存量逐步接近最大值的過(guò)程中一步步崩潰。

對(duì)于非季節(jié)性倉(cāng)庫(kù)來(lái)說(shuō),庫(kù)存壓力的大小也需要參考庫(kù)存最大值。當(dāng)然,在實(shí)際操作中,如果只是大規(guī)模庫(kù)存的短期存放,比如說(shuō)只需要存儲(chǔ)一天甚至一個(gè)晚上,一般不會(huì)對(duì)庫(kù)存空間造成非常大的壓力,因?yàn)榭梢耘R時(shí)占用現(xiàn)場(chǎng)的暫存或過(guò)道空間,要是臨時(shí)存放的時(shí)間超過(guò)了某個(gè)臨界點(diǎn),就可能對(duì)現(xiàn)場(chǎng)操作造成比較大的麻煩。

因此,一個(gè)很實(shí)用的指標(biāo)是連續(xù)三天庫(kù)存均值,比如說(shuō)一個(gè)月內(nèi)的平均庫(kù)存并不高,但某個(gè)連續(xù)三天的平均庫(kù)存很高,就說(shuō)明這三天的庫(kù)存空間可能是壓力很大的,值得我們的重點(diǎn)關(guān)注。

類似的例子是操作量數(shù)據(jù),只看平均數(shù)據(jù)也不一定意義很大,一些操作量暴增或暴減的情況需要被識(shí)別出來(lái)并重點(diǎn)關(guān)注。

操作量數(shù)據(jù)和庫(kù)存數(shù)據(jù)不一樣的地方在于,它沒有臨界點(diǎn)的概念,很大的操作量在短時(shí)間內(nèi)的集中一般都會(huì)對(duì)現(xiàn)場(chǎng)造成比較大的影響,也是我們極力避免的。但操作量的集中也可能可以通過(guò)比較靈活的方式進(jìn)行解決,比如說(shuō)預(yù)操作,也就是提前做好操作準(zhǔn)備或者提前完成一部分操作動(dòng)作。

在實(shí)際分析的時(shí)候,我們關(guān)注的峰值都是一段時(shí)間內(nèi)的峰值,而不一定是總體的最大最小值。比如一個(gè)月內(nèi)可能有一個(gè)操作量最大值,但一周內(nèi),一天內(nèi)也有峰值的出現(xiàn)。許多情況下,峰值一般也就意味著某種不穩(wěn)定因素的存在,意味著未來(lái)成為某種瓶頸的可能,因此是需要重點(diǎn)關(guān)注,必要的時(shí)候甚至要提出一些調(diào)節(jié)措施或備用方案。

最小值的應(yīng)用相對(duì)比較少,一般應(yīng)用于資源的臨時(shí)調(diào)整上。比如說(shuō)連續(xù)一段期間內(nèi),操作量都在某個(gè)閥值以下,就可能可以騰出部分操作資源做一些其它工作。


  1. 一類是描述數(shù)據(jù)中間值的,包括平均值、加權(quán)平均值、眾數(shù)、中位數(shù)、分位數(shù)等概念。
  • 平均值的使用比較普遍。一方面,有些數(shù)據(jù)差異是沒有意義的,通過(guò)平均值可以直接得到一個(gè)基本的代表性數(shù)字,不用再關(guān)注個(gè)別數(shù)據(jù)的差異,當(dāng)我們提供平均值的時(shí)候,也可以讓別人迅速地得到對(duì)某個(gè)事物的整體印象。

不論是庫(kù)存量還是操作量,當(dāng)我們覺得沒有必要進(jìn)行更細(xì)化的分析的時(shí)候,可能就直接使用一個(gè)平均值作為代表,這種思路雖然有時(shí)比較危險(xiǎn),但多數(shù)時(shí)候都可以很省事。

另一方面,平均值也是個(gè)別數(shù)據(jù)在整體中位置的有效參照,一個(gè)人每天操作10個(gè)訂單,并不能說(shuō)明他操作得是快還是慢,如果我們知道團(tuán)隊(duì)的平均操作量是5個(gè)訂單,可能就有一個(gè)基本判斷了。

加權(quán)平均值的使用和平均值是一樣的,只是在具體操作上有些不同。例如績(jī)效考核方式,一般是將一個(gè)人在不同方面的表現(xiàn)分配不同權(quán)重,最后得到一個(gè)加權(quán)平均值的,對(duì)庫(kù)區(qū)的考核也有可能采用加權(quán)平均的方式,以便把不同方面的結(jié)果轉(zhuǎn)化為一個(gè)綜合性的代表數(shù)據(jù)。

  • 眾數(shù)是指一組數(shù)據(jù)中出現(xiàn)次數(shù)最多的值,實(shí)際中用得不算多,但眾數(shù)的思想?yún)s無(wú)時(shí)無(wú)處不在。眾數(shù)的方便之處在于容易得到,一般不受特殊情況的影響,并且可用于非數(shù)值型數(shù)據(jù)。

比如說(shuō),我們統(tǒng)計(jì)倉(cāng)庫(kù)破損情況,可能涉及比較多個(gè)SKU,但比較集中的就是那么一兩個(gè),常見的表達(dá)方法是說(shuō),倉(cāng)庫(kù)現(xiàn)場(chǎng)80%的破損都發(fā)生于某個(gè)特定的SKU,這個(gè)SKU就是發(fā)生破損的SKU中的眾數(shù),值得我們的特別關(guān)注。

當(dāng)我們對(duì)事物進(jìn)行分類研究,判斷需要重點(diǎn)關(guān)注的類別時(shí),使用的也是眾數(shù)的基本思想,比方說(shuō),我們判斷庫(kù)存貨物中哪類物品最容易出現(xiàn)數(shù)量差異,這個(gè)最容易出現(xiàn)差異的物品類別,本質(zhì)上也是眾數(shù)的意思。

  • 中位數(shù)分位數(shù)其實(shí)是一個(gè)概念,中位數(shù)的意思就是二分位數(shù)。

分位的意思,就是說(shuō)這個(gè)數(shù)據(jù)所處的位置,正好可以把這組數(shù)據(jù)分為不同的比例。比如說(shuō)一共10個(gè)數(shù)字按順序排列,第五和第六個(gè)數(shù)字的平均數(shù)就是二分位數(shù)(中位數(shù)),從這個(gè)數(shù)據(jù)往上下兩邊看,上面有一半,下面有一半,真正的比上不足比下有余。

在對(duì)比現(xiàn)場(chǎng)操作量的時(shí)候,我們也經(jīng)常使用到分位數(shù)的概念。

比如說(shuō),一個(gè)月30天,其中有20天的操作量都在某個(gè)數(shù)值以上,這個(gè)數(shù)值,其實(shí)就是三分位數(shù),把一個(gè)月的操作量數(shù)據(jù)做三等分,就可以得到兩個(gè)三分位數(shù),一個(gè)代表三分之一,一個(gè)代表三分之二。

或者我們?cè)趯?duì)比團(tuán)隊(duì)操作量的時(shí)候,我們說(shuō),80%的成員操作量都在某個(gè)數(shù)值以上,某個(gè)數(shù)值以下,也是一種分位數(shù)的概念。不論是四分位、五分位、百分位、千分位,我們?cè)趯?shí)際使用的時(shí)候可能沒注意到,但其實(shí)基本思想是一致的。

分位數(shù)的使用,一般是讓我們對(duì)事物的結(jié)構(gòu)有一個(gè)相對(duì)具體的整體印象,比只用平均數(shù)要清楚一些。分位數(shù)的使用在許多情況下也能描述數(shù)據(jù)集中度的情況。


  1. 一類是描述數(shù)據(jù)離散程度的,常見的有極差、平均差、標(biāo)準(zhǔn)差等。

數(shù)據(jù)的離散程度有時(shí)候很重要。比方說(shuō),同樣是揀貨操作,一個(gè)人平均每天操作20個(gè)訂單,一個(gè)人平均每天操作10個(gè)訂單,排除訂單本身不一致的情況,這個(gè)差異就有點(diǎn)大了,現(xiàn)場(chǎng)就有必要跟蹤這兩個(gè)人的具體操作,看看到底是什么原因?qū)е铝诉@個(gè)差異。

  • 一組數(shù)據(jù),最大值減去最小值,就是極差,一般情況下,極差越大,數(shù)據(jù)的離散程度就越大,意思也就是差異越大。

極差反映的是數(shù)據(jù)中的最大差異,有時(shí)候不一定適用,可能存粹是因?yàn)橛袀€(gè)人天賦異稟導(dǎo)致的。

  • 平均差的意思,是算出一組數(shù)據(jù)的平均數(shù),讓每個(gè)數(shù)據(jù)都和平均數(shù)對(duì)比差異,再得出一個(gè)平均差異值。平均差反映的是一組數(shù)據(jù)的整體差異程度,就揀貨操作的例子來(lái)說(shuō),可以部分消除個(gè)別人天賦異稟帶來(lái)的影響,而得到一個(gè)基本的結(jié)論。

平均差的使用,一般要和平均值一起,同樣是差異10個(gè)訂單,如果平均值是20個(gè)訂單,這個(gè)差異就達(dá)到50%,大多數(shù)時(shí)候簡(jiǎn)直無(wú)法接受,而如果平均值是100個(gè)訂單,差異就只有10%,相對(duì)是比較正常的。

標(biāo)準(zhǔn)差和平均差所代表的意思是一樣的,只是出于計(jì)算的方便,進(jìn)行了一些計(jì)算過(guò)程的處理。對(duì)于現(xiàn)場(chǎng)的一些簡(jiǎn)單數(shù)據(jù),可能平均差用起來(lái)還要直觀一些。


五、常見對(duì)比與圖表


通過(guò)以上這些基本的描述統(tǒng)計(jì)概念,我們可以尋找一組數(shù)據(jù)可能存在的內(nèi)部規(guī)律,形成基本印象。而就一組數(shù)據(jù)來(lái)說(shuō),通常內(nèi)部觀察是遠(yuǎn)遠(yuǎn)不夠的,只有在外部對(duì)比的過(guò)程中,我們才能更準(zhǔn)確地理解這些數(shù)據(jù)所代表的意義。

事實(shí)上,我們?cè)谶M(jìn)行簡(jiǎn)單的描述分析之后,為了理解或者更準(zhǔn)確地表達(dá)這些數(shù)據(jù)所代表的意義,往往都要采用圖表的方法。圖表的好處,就在于方便對(duì)比,突出差異,可以給人以最直觀的感受和沖擊。

就具體的對(duì)比來(lái)說(shuō),我們常用的有結(jié)構(gòu)性對(duì)比、時(shí)序?qū)Ρ?、同類?duì)比、基準(zhǔn)對(duì)比等形式。

  1. 結(jié)構(gòu)對(duì)比查看的是事物內(nèi)部的組成結(jié)構(gòu)。
  • 我們查看庫(kù)存量組成,可能常溫貨物占一半,冷藏貨物占四分之一,冷凍貨物占四分之一,就是一種結(jié)構(gòu);
  • 我們分析訂單,可能60%的訂單在11點(diǎn)到13店間下達(dá),上午占20%,下午占20%,也是一種結(jié)構(gòu);
  • 我們梳理操作量,可能50%的操作量在出庫(kù)動(dòng)作,30%在入庫(kù)操作,20%在庫(kù)內(nèi)其它操作,也是一種結(jié)構(gòu)。

結(jié)構(gòu)影響到現(xiàn)場(chǎng)操作資源的分配,因此是我們特別注重的內(nèi)容。體現(xiàn)結(jié)構(gòu)比較合適的圖表是餅圖,大家應(yīng)該很熟悉。

  1. 時(shí)序?qū)Ρ炔榭吹氖鞘挛锏难葑冞^(guò)程。

庫(kù)存量的變化,操作量的變化等都屬于時(shí)序上的變化。通過(guò)時(shí)序?qū)Ρ龋覀兛梢钥吹剿鼈冋w的演變趨勢(shì)或者有規(guī)律的起伏波動(dòng)。

一些數(shù)據(jù)在時(shí)序上的變化是現(xiàn)場(chǎng)情況有新變動(dòng)的信號(hào),古人說(shuō)要見微知著,我們的目標(biāo),就是在過(guò)往數(shù)據(jù)的小變動(dòng)中發(fā)現(xiàn)未來(lái)更大變動(dòng)的可能,找到變動(dòng)發(fā)生的主導(dǎo)因素,削弱它或者增強(qiáng)它,從而讓現(xiàn)場(chǎng)情況往更為理想的方向發(fā)展。

發(fā)現(xiàn)了變動(dòng),卻不去追查這些變動(dòng)發(fā)生的原因,或者拋開數(shù)據(jù)而根據(jù)自己的直覺做一個(gè)簡(jiǎn)單判斷,都是不嚴(yán)謹(jǐn),有時(shí)候甚至是不負(fù)責(zé)任的做法。時(shí)序?qū)Ρ戎凶顬槌S玫氖钦劬€圖。

  1. 同類對(duì)比查看的是事物之間的差異。

時(shí)序?qū)Ρ缺举|(zhì)上也是同類對(duì)比的一種,只是有明確的時(shí)間次序,在應(yīng)用上也有不同的側(cè)重。我們查看同一個(gè)團(tuán)隊(duì)中不同個(gè)體的操作情況,就是同類對(duì)比;查看不同庫(kù)區(qū)的存儲(chǔ)情況和維護(hù)情況,也是同類對(duì)比。

同類對(duì)比的要點(diǎn)在于同類的定義,如果所謂的同類面對(duì)的具體條件非常不一致,我們把數(shù)據(jù)放在一起進(jìn)行對(duì)比,就會(huì)有問題,這種不倫不類的對(duì)比容易得出一些不符合現(xiàn)實(shí)情況的結(jié)論。

因此,我們必須非常清楚,兩個(gè)數(shù)據(jù)可以進(jìn)行同類對(duì)比,一般是從某種程度或者某個(gè)特定角度來(lái)說(shuō)的,超出這個(gè)程度或者角度的限定,就要謹(jǐn)慎一些了。同類對(duì)比往往使用柱狀圖或條形圖來(lái)表現(xiàn),使不同數(shù)據(jù)間的差異可以一目了然。

  1. 基準(zhǔn)對(duì)比的目的是查看一個(gè)數(shù)據(jù)是否達(dá)到了某個(gè)確定指標(biāo)。

不論是客戶設(shè)定的及格線,還是現(xiàn)場(chǎng)按平均值等方式設(shè)定的操作要求,都是一種確定的指標(biāo),最終的結(jié)果數(shù)據(jù)是否達(dá)到這個(gè)指標(biāo),影響著我們對(duì)這個(gè)結(jié)果的評(píng)價(jià),或者關(guān)系著我們之后需要采取的措施。

另一個(gè)基準(zhǔn)指標(biāo)的例子,是現(xiàn)場(chǎng)的一些操作閥值。比如說(shuō),如果連續(xù)三天平均庫(kù)存量達(dá)到某個(gè)數(shù)值,就要考慮擴(kuò)大倉(cāng)庫(kù)面積或者啟用外租倉(cāng)庫(kù)等?;鶞?zhǔn)對(duì)比在實(shí)踐中還是比較常見的,我們一般使用柱形圖或折線圖來(lái)表示。

除了餅圖、線圖、條形圖等基礎(chǔ)圖表,我們也經(jīng)常會(huì)看到雷達(dá)圖、散點(diǎn)圖等,這些年數(shù)據(jù)展示技術(shù)越來(lái)越成熟,面積圖、熱力圖也被越來(lái)越熟練地使用,不論如何,其進(jìn)行對(duì)比的基本思路是一致的。

就我們上面沒有說(shuō)到的圖表中,直方圖是值得另外討論的。

直方圖本質(zhì)上是對(duì)數(shù)據(jù)的集中度進(jìn)行對(duì)比,查看數(shù)據(jù)在哪一個(gè)區(qū)間分布得最為密集。數(shù)據(jù)集中度和離散程度有比較密切的聯(lián)系,但本質(zhì)上還是兩個(gè)概念,離散程度表示數(shù)據(jù)間的差異,我們之前已經(jīng)提到過(guò),而集中度的基本思想,則更接近于眾數(shù)。

還以揀貨操作為例,團(tuán)隊(duì)有10個(gè)人, 平均每人操作20個(gè)訂單,其中5個(gè)人的操作量都在25到30個(gè)訂單,另外5個(gè)人都在10到15個(gè)訂單,數(shù)據(jù)離散程度其實(shí)是比較高的,但集中度也很高。通過(guò)直方圖,我們可以很直觀地看到這些數(shù)據(jù)在不同區(qū)間內(nèi)的分布。

以上就是我們對(duì)數(shù)據(jù)分析中一些常用概念和思想方法的討論,主要回答的是如何描述的問題。這些基本概念和方法的具體應(yīng)用,則在分析者自己的掌握之中,很難說(shuō)有什么標(biāo)準(zhǔn)的答案或必須要遵守的規(guī)則,并且更為純熟的使用和更為深入的理解也只能來(lái)源于數(shù)據(jù)分析的具體實(shí)踐。


六、 數(shù)據(jù)追溯


從數(shù)學(xué)概念和思想方法的使用上說(shuō),數(shù)據(jù)追溯與數(shù)據(jù)描述是基本一致的,但從現(xiàn)場(chǎng)實(shí)踐上說(shuō),它們的過(guò)程恰恰相反。

數(shù)據(jù)描述是從事實(shí)出發(fā),跟著流程一步一步往前走,目標(biāo)是把事實(shí)描述清楚,發(fā)現(xiàn)其中一些值得注意的情況;數(shù)據(jù)追溯則是從問題出發(fā),就已經(jīng)注意到的情況,一步一步往回推,目標(biāo)是把問題的具體情況和發(fā)生緣由整理出來(lái),從而判斷接下來(lái)所需要采取的措施。

數(shù)據(jù)追溯的第一步當(dāng)然也是問題的分解。

比如說(shuō),我們看到這個(gè)月的庫(kù)存量大規(guī)模上漲,第一反應(yīng)可能不是打電話給客戶咨詢?cè)?,而是要搞清楚?kù)存上漲的具體情形:

  1. 首先,到底是哪一類庫(kù)存在上漲,是整體的上漲還是個(gè)別種類的上漲,或者只是個(gè)別SKU的大規(guī)模庫(kù)存變動(dòng)導(dǎo)致的,這是結(jié)構(gòu)上的分解;
  2. 找到具體的上漲品類以后,我們可能需要在時(shí)序上進(jìn)行分解,是什么時(shí)候開始出現(xiàn)上漲的趨勢(shì)的?到目前為止上漲的數(shù)量是多少?
  3. 之后,我們又可以在流程上進(jìn)行分解,看看這些庫(kù)存上漲的主要原因是入庫(kù)量的增加還是出庫(kù)量的減少;

又比如說(shuō),一定期間內(nèi)的操作異常集中出現(xiàn),已經(jīng)超出了正常范圍,我們進(jìn)行追查的第一步也是對(duì)這個(gè)現(xiàn)象進(jìn)行分解:

  1. 一個(gè)是結(jié)構(gòu)上的分解:
  • 可能是貨物類別上的結(jié)構(gòu),我們查看這些操作異常主要集中在哪些SKU;
  • 也可能是操作人員上的結(jié)構(gòu),就要清楚這些異常主要是誰(shuí)造成的;
  • 甚至可能是操作位置上的結(jié)構(gòu),看看這些異常主要是在倉(cāng)庫(kù)的哪個(gè)區(qū)域發(fā)生的;
  1. 一個(gè)是時(shí)序上的分解,判斷這些操作異常是不是集中在某幾天發(fā)生的,在整個(gè)時(shí)間區(qū)間內(nèi)的變化趨勢(shì)是怎么樣的,或者說(shuō),是集中在一天中的哪個(gè)時(shí)間段發(fā)生的;

  2. 一個(gè)是流程上的分解,有可能這些異常主要是在入庫(kù)流程中的上架動(dòng)作中發(fā)生的,也有可能是在出庫(kù)打包時(shí)發(fā)生的;

經(jīng)過(guò)層層分解的過(guò)程,我們對(duì)問題就有了比較清楚的了解,結(jié)合現(xiàn)場(chǎng)的具體情況,或者與客戶溝通得到的信息,要找到問題的緣由,決定接下來(lái)所需要采取的措施就有了一個(gè)基本的依據(jù)。

當(dāng)然,我們上面所說(shuō)的,是比較規(guī)范的分析流程,而在具體實(shí)踐中,一般都不需要這么復(fù)雜,可能對(duì)天天待在現(xiàn)場(chǎng)的人來(lái)說(shuō),在數(shù)據(jù)上看到一點(diǎn)端倪,馬上就能聯(lián)系實(shí)際想到可能的原因。

我們需要提醒的是,可能的原因畢竟只是一種可能,要驗(yàn)證這種可能,還是需要回到數(shù)據(jù)上來(lái):

  • 比如說(shuō),我們猜測(cè)庫(kù)存上漲的原因是某種季節(jié)性農(nóng)產(chǎn)品的大規(guī)模入庫(kù),那么,可能就可以直接查看這種農(nóng)產(chǎn)品的庫(kù)存量變化來(lái)進(jìn)行驗(yàn)證;
  • 又比如說(shuō),我們猜測(cè)操作異常的增多可能是某位新員工操作不熟練所致,那么,或許直接查看這位員工的操作異常情況就可以得到結(jié)論了。

另一個(gè)需要注意的地方是,我們猜測(cè)一個(gè)原因,并在數(shù)據(jù)上得到了證實(shí),并不一定說(shuō)明這個(gè)問題就徹底解釋清楚了。

比如說(shuō),庫(kù)存量上漲了100噸,季節(jié)性農(nóng)產(chǎn)品的入庫(kù)可以解釋其中的50噸,那么,剩下的50噸庫(kù)存上漲是不是正?,F(xiàn)象呢?如果不是正?,F(xiàn)象的話,又是什么原因?qū)е碌哪??如果?yàn)證自己的一個(gè)猜想后就拋開這個(gè)問題,不進(jìn)行下一步的分析,就容易有一個(gè)問題遮蓋另一個(gè)問題的現(xiàn)象,有時(shí)候,這種現(xiàn)象還是比較危險(xiǎn)的。

比如說(shuō),操作異常的增多有50%是由于新員工不熟練造成的,剩下的50%又是什么因素導(dǎo)致的呢?如果是一些安全相關(guān)的因素導(dǎo)致的,那么忽視這個(gè)問題就可能造成比較嚴(yán)重的后果了。

推測(cè)與驗(yàn)證一般來(lái)說(shuō)是數(shù)據(jù)描述中不太常用的辦法,不過(guò)在我們實(shí)際進(jìn)行數(shù)據(jù)描述的時(shí)候,肯定也會(huì)受一些推測(cè)的影響,我們推測(cè)哪些地方更容易出現(xiàn)問題,可能在這些地方就會(huì)進(jìn)行更加細(xì)化的數(shù)據(jù)分解,從而得到更加準(zhǔn)確的描述結(jié)論以供參考。

推測(cè)與驗(yàn)證的過(guò)程,其實(shí)是我們帶著一種既定的判斷去分析數(shù)據(jù),而一般性的數(shù)據(jù)描述則比較少會(huì)有這種既定的判斷。因此,一般性的數(shù)據(jù)描述分析是容易通過(guò)自動(dòng)化的辦法完成的。

事實(shí)上,我們的主張是,可以自動(dòng)化執(zhí)行的動(dòng)作應(yīng)該盡量自動(dòng)化,一方面是得到的結(jié)果更為標(biāo)準(zhǔn),不太容易有人為操作的失誤,另一方面,可以自動(dòng)化執(zhí)行的工作通常都沒有什么發(fā)揮個(gè)人能動(dòng)性的空間,長(zhǎng)期執(zhí)行是極為無(wú)聊枯燥的。

對(duì)于現(xiàn)場(chǎng)人員來(lái)說(shuō),其啟示有兩個(gè):

  1. 一個(gè)是除了基本的數(shù)據(jù)分析公式,最好還要能掌握一些數(shù)據(jù)自動(dòng)化處理的方法。不論是VBA(過(guò)氣了,不推薦,但還常用)也好,其它編程語(yǔ)言(比如python、R)也好,只有自動(dòng)化之后,長(zhǎng)期執(zhí)行一些已經(jīng)高度標(biāo)準(zhǔn)化的數(shù)據(jù)分析流程才不會(huì)無(wú)聊,說(shuō)得明白一些,也就是才能真正執(zhí)行下去。

  2. 第二個(gè)啟示是,現(xiàn)場(chǎng)人員需要在推測(cè)與驗(yàn)證方面更多地發(fā)揮自己的才能,結(jié)合自己在現(xiàn)場(chǎng)操作的切身體會(huì),深入繁蕪的數(shù)據(jù)叢中,于尋常處發(fā)現(xiàn)不尋常,在規(guī)范分析流程注意不到的地方找到解決問題的線索。


七、數(shù)據(jù)推測(cè)


與數(shù)據(jù)描述或數(shù)據(jù)追溯相比,數(shù)據(jù)推測(cè)的邏輯不太一樣,我們的意思是說(shuō),它的邏輯不太穩(wěn)固。不論是數(shù)據(jù)描述還是數(shù)據(jù)追溯,主要關(guān)注的都是過(guò)去的事情,不論我們能不能發(fā)現(xiàn),它們其實(shí)是有確切的結(jié)論的。

未來(lái)是不確定的,數(shù)據(jù)推測(cè)都需要一些基本的前提假設(shè),這些前提假設(shè)在未來(lái)是否真的成立,還需要經(jīng)過(guò)時(shí)間的驗(yàn)證。這可能是我們?cè)谟懻摂?shù)據(jù)推測(cè)時(shí)最不能忽視,也是最容易忘記的要點(diǎn)。

數(shù)據(jù)追溯關(guān)注的是一個(gè)現(xiàn)象的現(xiàn)狀與由來(lái),數(shù)據(jù)推測(cè)關(guān)注的則是這個(gè)現(xiàn)象的趨勢(shì)與未來(lái)。

對(duì)于未來(lái),在沒有其它信息支持的情況下,可能我們的一個(gè)基本假設(shè)是它會(huì)以之前的趨勢(shì)繼續(xù)發(fā)展。那么在計(jì)算方法上,比較常用的方法有線性擬合、移動(dòng)平均、指數(shù)平均等。

  1. 線性擬合是大家比較熟悉的方法。其基本的思路,是假設(shè)存在一個(gè)函數(shù),以時(shí)間為基本因子,我們所討論的對(duì)象數(shù)據(jù)是按照這個(gè)函數(shù)發(fā)展的,通過(guò)二分法求得標(biāo)準(zhǔn)差最小的函數(shù)結(jié)果,就是我們需要的函數(shù)。

標(biāo)準(zhǔn)差最小的意思,就是至少?gòu)闹暗臄?shù)據(jù)看,這個(gè)函數(shù)是最接近我們的對(duì)象數(shù)據(jù)的,如果未來(lái)趨勢(shì)不變,那么這個(gè)函數(shù)在下一個(gè)時(shí)間點(diǎn)的值就可以作為我們的預(yù)測(cè)值。

線性擬合考察的是數(shù)據(jù)的長(zhǎng)期發(fā)展趨勢(shì),而不太關(guān)注這個(gè)趨勢(shì)在最近的變化,有其優(yōu)勢(shì),也有其不足。我們?cè)诂F(xiàn)場(chǎng)實(shí)際上用得不是很多,如果真要說(shuō)使用,只能說(shuō)對(duì)平均數(shù)的使用比較多。

我們用平均數(shù)推測(cè)未來(lái),本質(zhì)上也是一種線性擬合方式,只是規(guī)定了這條線是不存在上升或下降趨勢(shì)的——有些時(shí)候,如果規(guī)定趨勢(shì)是平直的,平均數(shù)那條線就是進(jìn)行擬合的最優(yōu)解,或者至少是比較接近最優(yōu)解的線,而它的計(jì)算方法要比二分法求最小標(biāo)準(zhǔn)差的方法簡(jiǎn)單得多。

  1. 對(duì)事物最近的發(fā)展趨勢(shì)考慮得比較多的是移動(dòng)平均法。

假如我們手中有一年的數(shù)據(jù),平均數(shù)取的是這一年中所有數(shù)據(jù)的平均值,但很多時(shí)候,我們發(fā)現(xiàn)太久以前的數(shù)據(jù)沒什么參考意義,如果只取最近三個(gè)月的數(shù)據(jù)做一個(gè)平均,就是移動(dòng)平均。

之所以說(shuō)移動(dòng),是因?yàn)椤白罱边@個(gè)概念的具體意思是在不斷變化的,在4月份的時(shí)候,最近三個(gè)月就是1、2、3月,而在5月份的時(shí)候,最近三個(gè)月變成了2、3、4月。

移動(dòng)平均的方法本質(zhì)上還是預(yù)計(jì)未來(lái)的發(fā)展沒有什么上升或下降的趨勢(shì),只是穩(wěn)定在目前所處的水平。具體的使用,要取決于具體情況,對(duì)于倉(cāng)庫(kù)庫(kù)存來(lái)說(shuō),可能前期有一個(gè)從少到多的過(guò)程,但一段時(shí)間后趨于穩(wěn)定了,那么可能用移動(dòng)平均值預(yù)測(cè)的結(jié)果要比線性擬合更為接近。

事實(shí)上,移動(dòng)平均是一種思想方法,讓我們擺脫太久之前的、已經(jīng)不符合當(dāng)前趨勢(shì)的數(shù)據(jù)的束縛,直接使用最近的數(shù)據(jù)進(jìn)行分析,至于是不是使用平均值進(jìn)行預(yù)測(cè),則全看我們自己??赡芤环NSKU的庫(kù)存,開始幾個(gè)月的時(shí)候有多條生產(chǎn)線在生產(chǎn),存儲(chǔ)量是快速上升的,最近幾個(gè)月則只有一兩條生產(chǎn)線生產(chǎn),存儲(chǔ)量也在上升,只是比較慢,那么我們就可以按最近幾個(gè)月的數(shù)據(jù)進(jìn)行線性擬合,而完全拋開之前的數(shù)據(jù),避免受其誤導(dǎo)。

  1. 預(yù)測(cè)都是有一定誤差的,比如說(shuō),我們上個(gè)月按線性擬合或者移動(dòng)平均的方法得到的一個(gè)預(yù)測(cè)值,但實(shí)際的結(jié)果比預(yù)測(cè)值大一些或小一些。這個(gè)月我們學(xué)聰明了,當(dāng)我們?nèi)〉靡粋€(gè)預(yù)測(cè)值后,又加上了上個(gè)月預(yù)測(cè)值與實(shí)際值間的差異,希望得到一個(gè)更準(zhǔn)確的結(jié)果,這種思路就是指數(shù)平均

指數(shù)平均的方法實(shí)際上是對(duì)事物最近的發(fā)展趨勢(shì)有了更多的考慮——之前的預(yù)測(cè)值和實(shí)際值間的差異有可能代表的是一種趨勢(shì)而不是一個(gè)偶然,那么把這種趨勢(shì)考慮進(jìn)去顯然是合理的。

線性擬合、移動(dòng)平均、指數(shù)平均這幾種思路在現(xiàn)實(shí)中的具體應(yīng)用,很多時(shí)候都是相互結(jié)合,相互補(bǔ)充的。結(jié)合現(xiàn)場(chǎng)的具體情況,很多時(shí)候我們也很容易判斷我們使用哪種預(yù)測(cè)方式更為準(zhǔn)確。

在這里,我們判斷的基本原則,就是考察這幾種預(yù)測(cè)思路背后所需要的前提假設(shè),比如說(shuō):

  • 平均值方法的基本假設(shè)是:事物發(fā)展的趨勢(shì)是平直的,不會(huì)上升也不會(huì)下降;
  • 線性擬合方法的基本假設(shè)是:以我們進(jìn)行擬合的所有數(shù)據(jù)為基礎(chǔ),未來(lái)會(huì)順著一個(gè)整體的趨勢(shì)發(fā)展下去;
  • 拋開比較遠(yuǎn)的數(shù)據(jù)而只使用最近數(shù)據(jù)的基本假設(shè)是:最近數(shù)據(jù)的發(fā)展趨勢(shì)與較遠(yuǎn)前的發(fā)展趨勢(shì)不一致,并且未來(lái)是按照最近趨勢(shì)發(fā)展的;
  • 在得出預(yù)測(cè)值之后進(jìn)行二次修正的基本假設(shè)是:事物發(fā)展的趨勢(shì)在不斷變化,之前的預(yù)測(cè)值與實(shí)際值間的差異代表的是一種趨勢(shì)變化而不是偶然情況;

在現(xiàn)場(chǎng)的人,對(duì)于現(xiàn)場(chǎng)的情況容易有比較直觀的感受與經(jīng)驗(yàn),哪些假設(shè)是滿足的,哪些假設(shè)是不滿足的,我們使用哪種預(yù)測(cè)方式可能存在哪些問題,都可以有一個(gè)基本的判斷。

以上是我們對(duì)數(shù)據(jù)推測(cè)的一些基本方法的討論。


就現(xiàn)場(chǎng)的角度來(lái)看,進(jìn)行數(shù)據(jù)推測(cè)的目的:

  • 一個(gè)是外部因素主導(dǎo)的,即預(yù)知到某種變化的存在,想更準(zhǔn)確地理解這種變化,從而提前做好準(zhǔn)備;
  • 另一個(gè)是內(nèi)部因素主導(dǎo)的,即團(tuán)隊(duì)本身打算做一些事情,想提前預(yù)測(cè)一下做這種事情可能會(huì)有什么結(jié)果。

前面討論的數(shù)據(jù)推測(cè)思路主要是應(yīng)對(duì)外部因素變化的,而在預(yù)測(cè)行為結(jié)果方面,恐怕沒有什么規(guī)范的系統(tǒng)分析方法?;蛘哒f(shuō),能夠數(shù)據(jù)化的終究只是一部分,還是有相當(dāng)部分的結(jié)果是不太好數(shù)據(jù)化的,那么就有更多的對(duì)直覺和經(jīng)驗(yàn)的依賴。

預(yù)測(cè)行為結(jié)果的例子,我們?cè)谟懻摤F(xiàn)場(chǎng)計(jì)件制和承包責(zé)任制的時(shí)候已經(jīng)提到過(guò)。其基本的假設(shè),是現(xiàn)場(chǎng)的操作量和操作效率情況在接下來(lái)的時(shí)間里會(huì)保持穩(wěn)定。

那么,就可以把總的操作量做一個(gè)比較均衡的劃分,從而讓每個(gè)人專門負(fù)責(zé)一部分,進(jìn)行承包責(zé)任制;或者按目前的成本除以目前的操作量,得到單次操作成本,也就是計(jì)件價(jià)格,統(tǒng)計(jì)每個(gè)人的操作量,乘以計(jì)件價(jià)格,判斷未來(lái)每個(gè)人的收入水平是不是能保持在可接受范圍內(nèi),從而推進(jìn)計(jì)件制。

這一類的預(yù)測(cè)辦法,理解起來(lái)簡(jiǎn)單,執(zhí)行起來(lái)也相對(duì)容易,在現(xiàn)場(chǎng)是比較常用的。


八、總結(jié)


不論是數(shù)據(jù)描述、數(shù)據(jù)追溯,還是數(shù)據(jù)推測(cè),其基本的過(guò)程,都是把問題層層分解,其基本的原則,都是貼合現(xiàn)場(chǎng)實(shí)際,明確每一個(gè)數(shù)據(jù)所代表的具體意思,其基本的方法,都是描述統(tǒng)計(jì)和推斷統(tǒng)計(jì)中一些基本的思想概念。

數(shù)據(jù)是一種工具,一條路徑,是對(duì)現(xiàn)實(shí)的抽象,一方面我們依賴數(shù)據(jù),使用數(shù)據(jù),另一方面,我們也警惕數(shù)據(jù):

  1. 最根本的,是不能被數(shù)據(jù)所誤導(dǎo),而要時(shí)刻關(guān)注事實(shí),關(guān)注直覺。

理解每一個(gè)數(shù)據(jù)在現(xiàn)場(chǎng)的具體意思,如果數(shù)據(jù)與直覺相違背,一定要深入探究,找到數(shù)據(jù)或直覺的問題所在。

  1. 其次,是不能沉迷于數(shù)據(jù),終日里研究數(shù)據(jù)本身是沒有意義的。

基于數(shù)據(jù)發(fā)現(xiàn)問題、提出方案并不意味著問題的解決,問題的解決雖然終究要反映到數(shù)據(jù)上來(lái),其過(guò)程,卻在一點(diǎn)一滴的現(xiàn)場(chǎng)操作之中,現(xiàn)場(chǎng)操作有著各種各樣的現(xiàn)實(shí)條件限制,要比查看抽象數(shù)據(jù)艱難得多。

  1. 第三,是在數(shù)據(jù)分析時(shí)要保持明確的方向,要有整體的邏輯和基本的結(jié)構(gòu)。

也就是說(shuō),數(shù)據(jù)分析必須開始并終結(jié)于現(xiàn)場(chǎng)、流程或問題的分析與分解。一頭扎進(jìn)繁蕪的數(shù)據(jù)叢中,有時(shí)可以消耗無(wú)限的時(shí)間,最后卻不知道需要哪些方面的結(jié)果,沒有整體的思路和安排,偶爾得出一個(gè)結(jié)論,也沒有什么意義。這是新手比較常見的誤區(qū)。

  1. 最后,我們知道數(shù)據(jù)展示方面有一些技巧——全天下人都知道。

它們可以讓小問題變大,讓大問題變小,突出自己的觀點(diǎn),引導(dǎo)別人的認(rèn)知。

但在使用這些技巧的時(shí)候,數(shù)據(jù)分析者一定要非常清楚自己在做什么,想要表達(dá)什么,希望實(shí)現(xiàn)什么目的。如果不能立足現(xiàn)實(shí),立意真誠(chéng),那么在使用這些技巧的時(shí)候難免被這些技巧所誤,一方面缺乏對(duì)他人智商的尊重,另一方面,也可能反而誤導(dǎo)了自己對(duì)數(shù)據(jù)本身的理解。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容