在小數據世界中,相關關系也是有用的,但在大數據的背景下,相關關系大放異彩。通過應用相關關系,我們可以比以前更容易、更快捷、更清楚地分析事物。
通過給我們找到一個現象的良好的關聯物,相關關系可以幫助我們捕捉現象和預測未來。如果A和B經常在一起發(fā)生,我們只需要注意到B發(fā)生了,就可以預測A也將要發(fā)生了。這個有助于我們捕捉可能和A一起發(fā)生的事物,即使我們不能直接測量或者觀察到A。當然,相關關系無法預知未來,他們只能預測可能發(fā)生的事情,但是已經極其珍貴了。
如:某大型保險公司,他們想利用信用報告和顧客市場分析數據來作為部分申請人的血液和尿液分析的關聯物。這些分析結果被用來找出更有可能患高血壓、糖尿病和抑郁癥的人。其中用來分析的數據包括好幾百種生活方式的數據,比如,愛好、常瀏覽的網站、??吹墓?jié)目、收入估計等等。這樣做的好處就是,申請者不再需要提供血液和尿液樣本,僅僅是利用相關關系而得出結論。(雖然我這里也覺得不太可能理解這樣做)

圖片發(fā)自簡書App