從數(shù)據(jù)到知識(shí)

圖片發(fā)自簡(jiǎn)書App


導(dǎo)讀:《大數(shù)據(jù)》這本書的作者是涂子沛,信息管理專家、科技作家。作者題記:一個(gè)真正的信息社會(huì),首先是一個(gè)公民社會(huì)。這給了我---需求分析人員,一個(gè)把工作做好的更加充足的理由。作者提到的一句話讓我印象深刻“數(shù)據(jù)可以治國(guó),還可以強(qiáng)國(guó)”,這句話讓我感到做有意義的事就是把當(dāng)下工作做好。全書包括數(shù)據(jù)的發(fā)展、數(shù)據(jù)治國(guó)、商務(wù)智能的發(fā)展、數(shù)據(jù)質(zhì)量法、數(shù)據(jù)的隱私以及大數(shù)據(jù)的發(fā)展趨勢(shì)等內(nèi)容。由于本次我只關(guān)注數(shù)據(jù)的統(tǒng)計(jì)和分析,所以下面部分重點(diǎn)對(duì)數(shù)據(jù)分析的四個(gè)必要條件進(jìn)行總結(jié)。

信息消費(fèi)了信息接受者的注意力,信息越豐富,就會(huì)導(dǎo)致注意力越匱乏。比如我們買衣服,可選擇的越多,選擇越困難。在企業(yè)中,信息并不匱乏,匱乏的是我們處理信息的能力。

我們有限的注意力是組織活動(dòng)的主要瓶頸。

人類的理性是有限的,因此所有的決策都是基于有限理性

有限理性是介于完全理性和非完全理性之間的在一定限制下的理性,是為抓住問題的本質(zhì)而簡(jiǎn)化決策變量的條件下表現(xiàn)出來的理性行為。舉個(gè)在稻草中尋針的例子,有限理性就是只要找到足可以縫衣服的針就滿足了,即尋求滿意;完全理性是要找到最鋒利的針,尋求最優(yōu),從所有的備選方案中找到最優(yōu)者。通過計(jì)算機(jī)里的信息輔助決策,人類理性的范圍將會(huì)擴(kuò)大,決策的質(zhì)量就能提高。

赫伯特·西蒙(科學(xué)家,曾獲圖靈獎(jiǎng)和諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng))預(yù)測(cè):在后工業(yè)時(shí)代,也就是信息時(shí)代,人類社會(huì)面臨的中心問題將從如何提高生產(chǎn)率轉(zhuǎn)變?yōu)槿绾胃玫乩眯畔磔o助決策。

如何將信息轉(zhuǎn)化為有用的知識(shí)為決策者提供數(shù)據(jù)支撐,可以總結(jié)為如下四點(diǎn):

圖片發(fā)自簡(jiǎn)書App

1、數(shù)據(jù)倉(cāng)庫--商務(wù)智能的依托,海量數(shù)據(jù)進(jìn)行分析的核心物理構(gòu)架

決策支持面臨的“瓶頸式”難題,是如何有機(jī)的聚集、整合多個(gè)不同運(yùn)營(yíng)信息系統(tǒng)產(chǎn)生的數(shù)據(jù)。

數(shù)據(jù)的處理是重點(diǎn),“數(shù)據(jù)倉(cāng)庫”不同于數(shù)據(jù)庫,欠著是以數(shù)據(jù)分析、決策支持為目的來組織存儲(chǔ)數(shù)據(jù),而數(shù)據(jù)庫的主要目的則是為運(yùn)營(yíng)性系統(tǒng)保存、查詢數(shù)據(jù)。一種格式一致的多源數(shù)據(jù)存儲(chǔ)中心,數(shù)據(jù)源可以來自不同的系統(tǒng),但是數(shù)據(jù)可以按統(tǒng)一定義的格式被提取出來,再通過清洗、轉(zhuǎn)換、集成,最后百流歸海,加載進(jìn)入數(shù)據(jù)倉(cāng)庫。這個(gè)提取、轉(zhuǎn)換、裝載的主要過程,可以借助ETL工具。

2、聯(lián)機(jī)分析--為企業(yè)開展高端的分析

將分立的數(shù)據(jù)庫“相聯(lián)”,進(jìn)行多維度的分析。重點(diǎn)在一個(gè)“維”,指的是人們觀察事物、計(jì)算數(shù)據(jù)的特定角度。如沃爾瑪超市,要分析自己的銷售量,可以按照時(shí)間序列分析、商品門類分析、地區(qū)國(guó)別分析,也可以按照進(jìn)貨渠道分析、客戶群體分析,這些不同的角度就是維度。作為軍工企業(yè),想了解產(chǎn)品設(shè)計(jì)和開發(fā)的質(zhì)量情況,就可以從現(xiàn)場(chǎng)設(shè)計(jì)更改閉環(huán)情況、設(shè)計(jì)驗(yàn)證完成情況、設(shè)計(jì)確認(rèn)一次通過情況、產(chǎn)品重要試驗(yàn)一次通過情況等多個(gè)維度進(jìn)行分析。

隨著維度的增多,問題可能變得復(fù)雜,一旦維度超過三個(gè),人類思維和想象力就受到很大的限制。及時(shí)同一個(gè)維度,也可以進(jìn)行下轉(zhuǎn)細(xì)分(drill down),如時(shí)間維度,一年的銷量,分析人員可能對(duì)半年、季度、每個(gè)月或者某一天(如雙十一)的銷量感興趣;和上轉(zhuǎn)細(xì)分對(duì)應(yīng)的是上卷(roll up),從某一個(gè)分店的銷量加總到一個(gè)城市的銷量。

需求分析人員就需要事先設(shè)計(jì)報(bào)表,即根據(jù)用戶指定的條件,由軟件人員事先一一定制,通過“一對(duì)一”的查詢,將結(jié)果通過報(bào)表的形式返回給用戶。

報(bào)表,是關(guān)系型數(shù)據(jù)庫時(shí)代將數(shù)據(jù)轉(zhuǎn)化為信息和知識(shí)最主要的手段。對(duì)于一個(gè)立足于決策的用戶來說,他的需要是“動(dòng)態(tài)”的,他可能問出任意維度交叉和細(xì)分的問題,但軟件開發(fā)人員只能將最常見的問題定制在軟件中,那么對(duì)于沒有定制的問題,系統(tǒng)就無法回答。所以靜態(tài)的、固定的報(bào)表根本無法滿足決策分析人員的全部需要。解決方案就是用戶可以根據(jù)自己的需要隨時(shí)創(chuàng)建“萬維”動(dòng)態(tài)報(bào)表,也就是說,報(bào)表的定制權(quán)由后臺(tái)的開發(fā)人員直接轉(zhuǎn)移到前端用戶。

3、數(shù)據(jù)挖掘--讓數(shù)據(jù)流動(dòng)的更好、管理的更好、分析的更好

其實(shí)一開始的時(shí)候,數(shù)據(jù)挖掘曾一度被稱為“基于數(shù)據(jù)庫的知識(shí)發(fā)現(xiàn)”。數(shù)據(jù)挖掘最經(jīng)典的例子就是在超市中跟尿布一起搭配購(gòu)買最多的商品是啤酒,那么這個(gè)微妙的關(guān)系很難被發(fā)現(xiàn),但是通過數(shù)據(jù)挖掘技術(shù)就可以實(shí)現(xiàn)。數(shù)據(jù)挖掘的主要目,一是發(fā)現(xiàn)潛藏在數(shù)據(jù)表面之下的歷史規(guī)律,二是對(duì)未來進(jìn)行預(yù)測(cè),即描述性分析和預(yù)測(cè)性分析。

圖片發(fā)自簡(jiǎn)書App

4、數(shù)據(jù)可視化--詮釋數(shù)據(jù)之間的關(guān)系和發(fā)展趨勢(shì),以期更好地理解、使用數(shù)據(jù)分析的結(jié)果

? 數(shù)據(jù)可視化的技術(shù),可以通過圖像在邏輯思維的基礎(chǔ)上進(jìn)一步激發(fā)人的形象思維和空間想象力,吸引、幫助用戶洞察數(shù)據(jù)之間隱藏的關(guān)系和規(guī)律。數(shù)據(jù)可視化的關(guān)鍵在于“設(shè)計(jì)”。信息過載不存在,問題出在糟糕的設(shè)計(jì)上,如果用來表達(dá)數(shù)據(jù)的圖形讓人感覺雜亂不解,那就需要修改設(shè)計(jì)。相對(duì)于簡(jiǎn)單的點(diǎn)線圖、直方圖等,儀表盤、計(jì)分板、三維圖、動(dòng)態(tài)模擬、動(dòng)畫技術(shù)等等講更加直覺話和趣味化。

新時(shí)代企業(yè)的競(jìng)爭(zhēng),將是知識(shí)生產(chǎn)率的競(jìng)爭(zhēng)。以發(fā)現(xiàn)新知識(shí)為使命的智能化,無疑是整個(gè)時(shí)代最為矚目的競(jìng)爭(zhēng)利器。

推薦相關(guān)書籍:赫伯特·西蒙的《行政組織的決策過程》、愛德華·塔夫特的《定量信息的視覺展示》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容