經(jīng)過一段時(shí)間的學(xué)習(xí),現(xiàn)在對于歷史業(yè)務(wù)庫終于有了更多的了解了,無論是業(yè)務(wù)下查詢還是表結(jié)構(gòu)還是字段內(nèi)容構(gòu)成,以及表之間的關(guān)系,都做了不少記錄,下一步計(jì)劃開始準(zhǔn)備數(shù)據(jù)倉庫的在更大的環(huán)境下進(jìn)行查詢與分析。
首先是從業(yè)務(wù)庫中導(dǎo)出數(shù)據(jù),最好是平時(shí)增量,就是每天運(yùn)行,只導(dǎo)出昨天的數(shù)據(jù)(創(chuàng)建與變更),但是這里有個(gè)要求,就是被導(dǎo)出的表的創(chuàng)建與變更時(shí),都有時(shí)間記錄,否則就會(huì)遺漏,當(dāng)然這里也有一個(gè)補(bǔ)充方案,就是每個(gè)周末導(dǎo)出一份全量數(shù)據(jù),作用補(bǔ)充。
下一步是指定哪些表需要導(dǎo)出,由于對于業(yè)務(wù)流轉(zhuǎn)已經(jīng)有了認(rèn)知,主要的表已經(jīng)清楚了,可以指定出來。
下一步就是圍繞指定的表進(jìn)行導(dǎo)出開發(fā)。
這里要注意,由于存在多個(gè)歷史業(yè)務(wù)庫,所以不同客戶的業(yè)務(wù)是單獨(dú)導(dǎo)入到不同數(shù)據(jù)庫中的,只為他們具有相似的表結(jié)構(gòu),但是又不完全相同。導(dǎo)出到單庫以后,可以對單用戶進(jìn)行多維度分析,如果相對多客戶的數(shù)據(jù)進(jìn)行全局分析,就需要再將不同客戶的數(shù)據(jù)再導(dǎo)入到一個(gè)新庫中,成為全局的分析數(shù)據(jù)表,當(dāng)然,這里邊可能要進(jìn)一步整合兩個(gè)不完全相同的表結(jié)構(gòu)和數(shù)據(jù)。
先分析一下單客戶的數(shù)據(jù),這里對數(shù)據(jù)的查詢與分析的邏輯,是完全依賴對歷史業(yè)務(wù)數(shù)據(jù)代碼的分析而開展的,其中除了正常的多表關(guān)聯(lián)查詢外,還有一個(gè)重要的改變,就是將原來存儲在字段內(nèi)容中的標(biāo)志位單獨(dú)提煉出來,形成數(shù)據(jù)庫獨(dú)立字段,這樣才能更好的支持SQL查詢。
最后是滿足一些單客戶的主要業(yè)務(wù)場景的分析,最后能夠定期導(dǎo)出業(yè)務(wù)用的報(bào)表,顯示本次數(shù)據(jù)倉庫構(gòu)建的價(jià)值的冰山一角。