大數(shù)據(jù)到底能做什么

現(xiàn)在談這個(gè)問(wèn)題可能會(huì)讓大家笑話,似乎所有人都知道大數(shù)據(jù)能干這個(gè),能干那個(gè),最后連我們自己都覺(jué)得可笑。大數(shù)據(jù)已經(jīng)都不是被“妖魔化”了,是“娛樂(lè)化”。大數(shù)據(jù)似乎是個(gè)離我們忽遠(yuǎn)又忽近的事物了,變得不真實(shí)起來(lái)。

近兩年來(lái),大數(shù)據(jù)被應(yīng)用到影視制片行業(yè),基于對(duì)觀眾偏好的分析,去預(yù)測(cè)、設(shè)計(jì)觀眾喜歡的劇情,找觀眾喜愛(ài)的演員出演相關(guān)的角色,甚至可以去預(yù)測(cè)票房。這些所有的預(yù)測(cè)都是基于數(shù)據(jù)的基礎(chǔ)上,經(jīng)過(guò)一定的模型處理,得到接近真實(shí)的結(jié)論。從某種程度上給決策者決策的依據(jù),比如《紙牌屋》和《星星》。

大數(shù)據(jù)還有一個(gè)重要的作用,就是解決人們的“選擇”問(wèn)題。別笑,無(wú)論你的年齡、性別、教育背景,人們目前都面臨著前所未有的選擇問(wèn)題。講的學(xué)術(shù)一些,這是由于“長(zhǎng)尾效應(yīng)”導(dǎo)致的問(wèn)題;講得通俗一些,就是由于日益增多的可選擇的對(duì)象和我們自身的處理能力之間的矛盾。

科技的進(jìn)步讓人變得更懶,也就是我們自身的處理能力降低,無(wú)論是主觀的還是客觀的。而可被選擇的對(duì)象卻在日益增多。從紛繁復(fù)雜的商品(電商),到海量曲庫(kù)中的樂(lè)曲;從婚戀網(wǎng)站的男女朋友,到交通管理的信號(hào)燈。

基于人工智能下的大數(shù)據(jù),就是可以使人們“變懶”的一個(gè)手段?;谀愕臍v史行為,判斷出你可能的喜好,乃至需求,將最佳結(jié)果,推薦給你。這就是大數(shù)據(jù),她是你的貼心管家,或者說(shuō)是最懂你的朋友。

不要以為是海量數(shù)據(jù)就一定會(huì)有價(jià)值,在過(guò)往的工作中,我們經(jīng)常發(fā)現(xiàn)來(lái)自甲方的數(shù)據(jù)源有80-90%的數(shù)據(jù)都是無(wú)用的。只有10%-20%的數(shù)據(jù)才會(huì)產(chǎn)生一定的價(jià)值。這就又讓我想到Marry

Meeker打的那個(gè)比喻,“大數(shù)據(jù)的工作就像在一堆稻草中尋找一根針”。

何況,大多數(shù)領(lǐng)域本身業(yè)務(wù)屬于早期,所擁有的數(shù)據(jù)非常貧乏。冷啟動(dòng)、稀疏性是大數(shù)據(jù)在諸多領(lǐng)域面臨的挑戰(zhàn)。

另一方面,對(duì)于不同領(lǐng)域,不同項(xiàng)目,沒(méi)有放之四海而皆準(zhǔn)的算法,必須要根據(jù)具體問(wèn)題具體分析解決。在實(shí)際的工作中發(fā)現(xiàn),不只是不同的領(lǐng)域(如文章推薦與商品推薦),甚至同一領(lǐng)域的不同單元(同屬電商但不同類電商,如母嬰類和服裝類或者奢侈品類)也有所不同。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容