大數(shù)據(jù)還能火多久?通俗說大數(shù)據(jù)、人工智能、機(jī)器學(xué)習(xí)之關(guān)系

? ? ? ? 我感覺很多朋友,對(duì)“大數(shù)據(jù)”、“機(jī)器學(xué)習(xí)”、“深度學(xué)習(xí)”等概念挺暈的,沒有感官的認(rèn)識(shí),這里,我簡(jiǎn)單說一下:

????????“大數(shù)據(jù)”、“人工智能”、“機(jī)器學(xué)習(xí)”、“神經(jīng)網(wǎng)絡(luò)”、“深度學(xué)習(xí)”。這幾個(gè)詞往往摻雜在一起,讓人不知所云,這里我簡(jiǎn)單說一下,不求細(xì)節(jié)上100%準(zhǔn)確,只求能給各位一個(gè)感官上的印象,明白說起這幾詞時(shí),通常都是說什么。

????????首先,“人工智能”這個(gè)詞。大家說,什么是人工智能?每個(gè)人在自己心里,都有一個(gè)特定的人工智能定義。有人認(rèn)為,老版《星際迷航》里“Datas上校”這個(gè)東西叫人工智能;有人認(rèn)為《機(jī)器公敵》里機(jī)器人應(yīng)該叫人工智能;有人認(rèn)為電影異形里的“大衛(wèi)”,這么個(gè)東西叫人工智能。近一點(diǎn)的,有人認(rèn)為谷歌開發(fā)的下圍棋的系統(tǒng)“AlphaGo”,很吊,這玩意是人工智能;谷歌大腦能通過自己看視頻,自動(dòng)識(shí)別出貓,這就人工智能了;還有公司,我們通過“人工智能”干了XXXX。。。。。。因此,可以看出,這個(gè)詞大的沒邊,因此,真追究起來,誰(shuí)要說這個(gè)詞,除裝逼外,你就當(dāng)他什么都沒說就行了。

????????當(dāng)前,“大數(shù)據(jù)”這個(gè)詞,也跟“人工智能”這個(gè)詞一樣,大的沒邊,虛無(wú)飄渺的沒邊,誰(shuí)要是說這個(gè)詞而不說具體的東西,你也就當(dāng)他什么都沒說就好了。

【大數(shù)據(jù)開發(fā)學(xué)習(xí)資料領(lǐng)取方式】:加入大數(shù)據(jù)技術(shù)學(xué)習(xí)交流扣扣群458345782,私信管理員即可免費(fèi)領(lǐng)取開發(fā)工具以及入門學(xué)習(xí)資料

回過頭來,我們?cè)倏础叭斯ぶ悄堋边@個(gè)詞。究竟什么是人工智能?計(jì)算機(jī)的神級(jí)人物圖靈給出了“圖靈測(cè)試”,定義了人工智能——圖靈測(cè)試(The Turing test)由艾倫·麥席森·圖靈發(fā)明,指測(cè)試者與被測(cè)試者(一個(gè)人和一臺(tái)機(jī)器)隔開的情況下,通過一些裝置(如鍵盤)向被測(cè)試者隨意提問,進(jìn)行多次測(cè)試后,如果有超過30%的測(cè)試者不能確定出被測(cè)試者是人還是機(jī)器,那么這臺(tái)機(jī)器就通過了測(cè)試,并被認(rèn)為具有人類智能。(摘自百度百科)

????????上面,圖靈神人說神話,凡人聽不懂。針對(duì)“人工智能”,用人話講,如果,某個(gè)東西,具有了“學(xué)習(xí)”、“分類”、“預(yù)測(cè)”能力,我們就認(rèn)為這個(gè)東西是智能的。比如,我們說人。我們說諸葛亮,料事如神(預(yù)測(cè)能力強(qiáng))、神機(jī)妙算(“分類”強(qiáng))。。。因此,諸葛亮很智能。

????????其實(shí),現(xiàn)實(shí)中很多問題,都可以轉(zhuǎn)化為分類問題和回歸問題,如何即“準(zhǔn)”又“穩(wěn)”的把事物分類,是我們追求。比如,我們根據(jù)一系列指標(biāo),把一個(gè)妹子分類為“漂亮”、“不漂亮”;把某件事根據(jù)一系列指標(biāo),分為“可以干”、“不可以干”;把某個(gè)人,分為“人品好,可以交”、“人渣,不可交”;這類就是二分類問題。也有多分類問題,比如,把一篇文章,分類到“財(cái)經(jīng)新聞”、“娛樂八卦”、“武俠小說”、“黃色小說”。。。。等等多個(gè)類目下的一類中。


????????因此,為了給編個(gè)有“智能”的軟件,賦予它分類能力呢。簡(jiǎn)單,用編程語(yǔ)言語(yǔ)言里的判斷語(yǔ)句都能行:

????If XXX :

????????OOOO

????elif XXXXX :

????????oooooo

????else:

????OOOOO

????????各位看官也許會(huì)笑,這TMD算哪門子的智能。但是,在現(xiàn)實(shí)中,就這樣用編程語(yǔ)言的特性,編出來的軟件,在很多不懂計(jì)算機(jī)父輩們眼中,就很智能,就能把他們鎮(zhèn)住。。。。。

????????當(dāng)然,這么low的方案,計(jì)算機(jī)的神級(jí)人物們,是不屑的。畢竟,現(xiàn)實(shí)太復(fù)雜,對(duì)這個(gè)復(fù)雜的現(xiàn)實(shí)建模,對(duì)復(fù)雜的事物分類,豈能是幾個(gè)判斷語(yǔ)句所能夠描述的。所以,大神們,搞出來很多算法策略來搞這件事。這下算法,主流的也就那么多,比如說:決策樹算法、隨機(jī)森林算法、邏輯回歸、SVM、樸素貝葉斯、K最近鄰算法、K均值算法、Adaboost 算法、神經(jīng)網(wǎng)絡(luò)算法、馬爾可夫算法,還有最近火的“深度學(xué)習(xí)”算法、增強(qiáng)對(duì)抗網(wǎng)絡(luò)算法。。。等等。這些算都叫“機(jī)器學(xué)習(xí)”算法。

????????講到這里,各位看官,應(yīng)該對(duì)我們經(jīng)常講的“人工智能”、“機(jī)器學(xué)習(xí)”、“深度學(xué)習(xí)”,這些虛無(wú)縹緲的詞大概是什么意思,有個(gè)感官的認(rèn)識(shí)了。

好了,現(xiàn)在我們討論“人工智能”、“機(jī)器學(xué)習(xí)”、“深度學(xué)習(xí)”等等這些詞時(shí),具體就討論這些算法就行了,那些虛無(wú)縹緲的概念,留給裝逼的人、想要吸引投資的人去說吧。

????????從總體理論方向來說,來說,這些算法,大體上可分為兩類,“神經(jīng)網(wǎng)絡(luò)”算法和“深度學(xué)習(xí)”算法,算作一類,其它的算法作為另一類。

但是,不管怎么分類,這些算法要想正常的工作,對(duì)事物的分類能夠達(dá)到實(shí)用的水平,兩個(gè)條件是不可或缺的,那就是“數(shù)據(jù)”、“計(jì)算力”。計(jì)算力很好理解,這些算法,都比較復(fù)雜,沒有強(qiáng)大的CPU、內(nèi)存等硬件支撐,這些算法,要么不能運(yùn)行,要么猴年馬月也運(yùn)行不完,給不出結(jié)果。如果你訓(xùn)練模型,利用這些算法編好程序后,扔給計(jì)算機(jī),它花了半年才計(jì)算完,給你打印出結(jié)果。你心中,也一定是一萬(wàn)個(gè)“草泥馬”飄過。。。。。對(duì)于數(shù)據(jù)的要求,這是因?yàn)椋@些算法的背后的數(shù)學(xué)原理,大部分都跟概率論有關(guān)。各位看官,如果興趣,可百度“VC維”理論,針對(duì)“深度學(xué)習(xí)”的可學(xué)習(xí)性的理論解釋,人類現(xiàn)在也沒有研究透,只知道這玩意挺管用,在很多方面效果挺好,科技前沿,給出的解釋是用“泛函空間概率論”來解釋。但不管怎么說,就是概率論,就是瞎猜。瞎猜嘛,當(dāng)然是依據(jù)越多,猜的的越準(zhǔn),猜的越穩(wěn)。也就是數(shù)據(jù)越多,這些算法就會(huì)猜的越準(zhǔn),猜的越穩(wěn)。好了,現(xiàn)在“大數(shù)據(jù)”,就可以攙和進(jìn)來了。沒有數(shù)據(jù),或者數(shù)據(jù)很少、數(shù)據(jù)緯度較少,不夠詳細(xì),這些算法“巧婦”,也會(huì)無(wú)米下鍋,做不出可口的飯菜的。

????????有了所謂的“大數(shù)據(jù)”和云計(jì)算,我們就可以方便的命令這些算法“巧婦”們給我們做飯了。從‘?dāng)?shù)據(jù)’這個(gè)“米”的角度說,我們可以HDFS存儲(chǔ)更多的米,更豐富的食材;從‘大數(shù)據(jù)組件’這個(gè)鍋碗瓢盆的‘工具’角度來說,我們有了spark等組件(利用深度學(xué)習(xí)算法,比較強(qiáng)大的組件是TensorFlow),有了更強(qiáng)大的計(jì)算工具,我們可以利用這些組件調(diào)用這些高大上的分類算法,再加上所謂的“大數(shù)據(jù)”、“深度學(xué)習(xí)”、“機(jī)器學(xué)習(xí)”,就可以做出更好吃的飯了。從系統(tǒng)架構(gòu)上來說,猜嘛。猜對(duì)、猜錯(cuò)都是很正常的,可能這么猜不對(duì),換個(gè)參數(shù)、換個(gè)算法 重新猜一下,就猜對(duì)了。因此,也就有了“數(shù)據(jù)挖坑一身功,全靠調(diào)參”的說法。這就要求,我們的系統(tǒng),有更好靈活性,方便我們對(duì)針對(duì)這些算法“休妻再娶”。

。。。。。。。。。。

????????有了上面大體的介紹,針對(duì)“大數(shù)據(jù)”、“人工智能”、“深度學(xué)習(xí)”、“機(jī)器學(xué)習(xí)”等具體行業(yè)應(yīng)用,我再簡(jiǎn)單說兩句。

????????以電商行業(yè)為例,有一個(gè)概念叫“用戶畫像”,它是很多系統(tǒng)的基礎(chǔ),比如推薦系統(tǒng)、精準(zhǔn)廣告系統(tǒng)、大數(shù)據(jù)風(fēng)控系統(tǒng)的等等。

????????用戶畫像,是什么呢。說到底,就是對(duì)用戶的分類數(shù)據(jù)。比如說,ID 000001110011,性別:女,性格描述:萌妹子,性格特點(diǎn)描述,資產(chǎn)狀況描述,信用狀況描述,喜歡的顏色,鐘愛的品牌,大姨媽的日期,上周的購(gòu)物。。。。。。。。有了這些信息,我們就可以針對(duì)這個(gè)用戶,進(jìn)行精準(zhǔn)的廣告營(yíng)銷、精準(zhǔn)的購(gòu)物推薦、個(gè)性化的服務(wù)。。。。。。

????????那么問題來了?,F(xiàn)實(shí)中,這位妹子注冊(cè)信息時(shí),性別欄里,可能填的是“男”,年齡欄里填了“5”或者“150”。你怎么知道這個(gè)妹子,可能喜歡相宜本草的面膜,她又沒明確告訴你。。。。

????????沒辦法了,只能猜。如果,我們有了關(guān)于這位妹子的各類“大數(shù)據(jù)”,再結(jié)合上面的各種算法,就可以猜了。如果這個(gè)ID的用戶,上購(gòu)物網(wǎng)站時(shí),經(jīng)常瀏覽的是“胸罩”、“衛(wèi)生巾”等女性用品,我們的算法(機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等)把他猜成“女性”,是可以理解的。當(dāng)然,如果是位暖男,為他女朋友、老婆買這些東西,也是可以理解的。如果我們?cè)僭黾右粋€(gè)緯度的“大數(shù)據(jù)”,這個(gè)ID用戶,最近經(jīng)??错n劇,那么他是女性可能性,就又提高了。再增加一個(gè)緯度的“大數(shù)據(jù)”,這個(gè)ID在某個(gè)評(píng)論里說“最近剛生完寶寶,聽老公說XXXX,我覺的XXXX”。。。。這里,針對(duì)這個(gè)ID的畫像,把他的性別改為“女”,是可以的,是有99.99%的把握的。但也無(wú)法排除0.01%的變態(tài)。。。。。

????????這個(gè)例子中,就把“大數(shù)據(jù)”、“機(jī)器學(xué)習(xí)”等等熱門的概念都搞一塊了。。。

實(shí)際工作的過程中,情況和限制,也就更多更復(fù)雜了。針對(duì)各類企業(yè)、每個(gè)企業(yè),我想都在某些時(shí)刻,有去猜(也就是去分類)某些事情的需求。此時(shí),找猜的“米”時(shí),一看,之前很多數(shù)據(jù)沒保存,無(wú)米下鍋。沒有人才,沒多少人會(huì)利用這些牛逼的“算法+數(shù)據(jù)”去猜。更多是沒有數(shù)據(jù)意識(shí),針對(duì)馬云口中“DT時(shí)代”,沒有感官認(rèn)識(shí),不明白具體是什么意思。。。。。。

????????在具體落地的解決方案過程中,數(shù)據(jù)收集、存儲(chǔ)、計(jì)算工具等等方面,現(xiàn)在技術(shù)發(fā)展的還是可以的。再具體“怎么猜”(是利用if elif else與語(yǔ)句猜,是利用線性模型猜,還是利用“深度學(xué)習(xí)”猜)的過程中,那就要具體情況具體分析了:

總共才兩三中情況,看一眼就知道怎么回事,提煉出規(guī)則,編程成固定規(guī)則就行了,上深度學(xué)習(xí),純屬腦子有病;

????????但像BAT這種大公司,有很多牛叉的研究員,整天研究如何利用盡可能對(duì)的數(shù)據(jù)(“大數(shù)據(jù)”),比較牛逼的算法策略(比如“深度學(xué)習(xí)”等),盡可能多猜的更準(zhǔn)、更穩(wěn)。哪怕猜準(zhǔn)確率提高1%,那么可能多銷售幾個(gè)億的商品。。。。。

????????目前,語(yǔ)音識(shí)別、機(jī)器翻譯。等等,本質(zhì)上,也是“猜”嘛。英語(yǔ)中某個(gè)句話猜成中文的意思,有30%準(zhǔn)確率,用上深度學(xué)習(xí)后,猜對(duì)的可能性提高到了45%。。。。。某段錄音,根據(jù)記錄的音波,之前猜對(duì)概率是85%,積累的數(shù)據(jù)多了,用的算法牛逼了,參數(shù)調(diào)的好點(diǎn)了,猜對(duì)概率95%了,這就是進(jìn)步啊。等到,你說依據(jù)話,計(jì)算機(jī)猜你的意思,猜對(duì)的概率是99%了,我想那時(shí),你百度什么東西,就不用輸關(guān)鍵詞了,對(duì)這電腦說就行了。。。。

????????但無(wú)論怎么樣,即便是BAT、谷歌等大公司,前沿研究除外,能為資本家?guī)碇苯永麧?rùn)的機(jī)器學(xué)習(xí)算法,目前還是比較簡(jiǎn)單的機(jī)器學(xué)習(xí)算法為主,比如一些線性模型類的算法(我記得我第一次學(xué)線性回歸時(shí),在初中數(shù)學(xué)里的內(nèi)容),所以,這些算法的原理也是比較簡(jiǎn)單的。上世界90年代各方面就研究的很透了,只不過那時(shí)候,人類積累的數(shù)據(jù)少(數(shù)據(jù)就在那里,每天都在產(chǎn)成,只不過,那是沒有性價(jià)比高的記錄手段)、計(jì)算機(jī)的計(jì)算能力不足。。。。。。至于更高大上一些的算法,比如深度學(xué)習(xí)等,主要用來對(duì)系統(tǒng)里的某一些環(huán)節(jié)改造,增加猜對(duì)的概率。嚴(yán)格意義說,跟所謂的“大數(shù)據(jù)”,沒多少直接關(guān)系。即便是沒有“深度學(xué)習(xí)”,用其他的算法,要想達(dá)到實(shí)用效果,所需要的數(shù)據(jù)量也不一定少。

????????回望,很多概念,“火”與不“火”的歷程也是有規(guī)律可循的。07、08、09年時(shí),與“云”有關(guān)的很火,什么“公有云”、“私有云”、“混合云”,12、13、14年時(shí),“大數(shù)據(jù)”很火;現(xiàn)在,16、17年,“機(jī)器學(xué)習(xí)”、“人工智能”很火。有了“云”架構(gòu),我們有了靈活手段的去調(diào)度硬件資源,所以要利用搞點(diǎn)事情啊,再加上谷歌的工程師發(fā)表了著名的三篇論文,全世界的工程師開發(fā)了相關(guān)軟件;因此,后來的“大數(shù)據(jù)”火了,這時(shí)的“火”,更多是建立“數(shù)據(jù)倉(cāng)庫(kù)”等存儲(chǔ)等階段,針對(duì)數(shù)據(jù)利用、處理,也是普通簡(jiǎn)單算法范圍,如統(tǒng)計(jì)一下數(shù)據(jù),出一些Top榜什么的。。。。后來,有了積累了多數(shù)據(jù)、更多資源了,我們有什么理由不把跟牛逼的策略、算法搬出來,對(duì)數(shù)據(jù)挖的更深、利用的更好呢。。。。從中可以看出,這些概念火起來,是計(jì)算力的進(jìn)步,是人類收集、存儲(chǔ)、加工、處理、利用信息能力的進(jìn)步。。。。

————————————————————————————————————————

????????首先聲明,本人現(xiàn)在杭州一家互聯(lián)網(wǎng)公司做大數(shù)據(jù)平臺(tái)架構(gòu)師和數(shù)據(jù)分析師。因此,以下的回答,可能帶有自己的視野局限,敬請(qǐng)各位看官理性地指教,討論。

根據(jù)我個(gè)人的行業(yè)經(jīng)驗(yàn)來看?,F(xiàn)在很多人,對(duì)大數(shù)據(jù)的理解都有些偏了。目前,對(duì)大數(shù)據(jù)的主流看法就是"深度學(xué)習(xí)","人工智能"等很火,很高大上的東西,都需要大量的數(shù)據(jù),所以大數(shù)據(jù)會(huì)怎樣、怎樣。。。。

其實(shí),大數(shù)據(jù)的背后,是人類處理信息(也就是數(shù)據(jù),大家不要認(rèn)為大數(shù)據(jù),這個(gè)概念中的"數(shù)據(jù)",是12345等阿拉伯?dāng)?shù)字組成的東西,凡是能存電腦里的東西,都是數(shù)據(jù))的IT系統(tǒng)的一次革命性升級(jí)。這次技術(shù)的升級(jí),是繼數(shù)據(jù)庫(kù)系統(tǒng)后,人類處理數(shù)據(jù)手段和技能的提升。下面,我以一個(gè)例子,來說明我們信息處理手段的提升。

張三是個(gè)創(chuàng)業(yè)者,每晚到夜市擺攤。由于攤子很小,每天回家后,找一只筆,一個(gè)香煙盒子紙,就能把賬算了、把貨盤了,這時(shí),憑借著一只鉛筆,一張破紙,就能把該處理的數(shù)據(jù)信息處理了。后來,攤子稍微大了一點(diǎn),張三到門口小超市花幾塊錢買了個(gè)計(jì)算器,每天在計(jì)算器"為零"的幫助下,再加上一只筆、一張紙把信息處理了。再后來,張三開了個(gè)小超市,他處理信息的能力也增強(qiáng)了,用上了Excel、word等軟件來處理信息。后來,張三開開了個(gè)大超市,其信息處理工具也鳥槍換炮了,用上了進(jìn)銷存管理系統(tǒng)、財(cái)務(wù)管理系統(tǒng)、人事管理系統(tǒng)。。。。這些系統(tǒng),在數(shù)據(jù)存儲(chǔ)方面,用數(shù)據(jù)庫(kù),如mysql。在業(yè)務(wù)處理方面,招幾個(gè)程序員,用php、python或java,寫具體的業(yè)務(wù)處理邏輯(也就是當(dāng)年張三在紙上寫寫畫畫的處理過程)。這一階段的IT處理段位,是目前大多數(shù)中小企業(yè)所在的段位。可以看出,這個(gè)段位的IT系統(tǒng)和處理能力有以下不足:

1、只能處理結(jié)構(gòu)化數(shù)據(jù),對(duì)大量非結(jié)構(gòu)化數(shù)據(jù)(文字、語(yǔ)音、視頻等),處理能力嚴(yán)重不足。

2、能處理的數(shù)據(jù)量還是太小,比如,用張破紙,你處理10條數(shù)據(jù)沒問題,給你個(gè)計(jì)算器,你處理100條數(shù)據(jù)沒壓力。用Excel,你處理10萬(wàn)條無(wú)壓力。給你個(gè)mysql,你在千萬(wàn)條數(shù)據(jù)的級(jí)別范圍內(nèi)增刪改查無(wú)壓力。但是,當(dāng)你要面對(duì)的數(shù)據(jù)是100億條級(jí)別時(shí),你的數(shù)據(jù)庫(kù)、存儲(chǔ)、業(yè)務(wù)處理代碼等,就有可能分分鐘鬧毛病給你看。 注意:利用各種中間件構(gòu)建分布式關(guān)系型數(shù)據(jù)庫(kù)集群,是能應(yīng)付的。此處,各位看官領(lǐng)會(huì)我說的什么意思就好,先不要糾結(jié)具體技術(shù)解決方案。

3、處理的手段單一,只能跑程序員編好的程序,比較死板。只能按著代碼邏輯跑,一點(diǎn)都不"智能"。

4、從技術(shù)上講,靈活性還是不足。你的進(jìn)銷存、財(cái)務(wù)、人事等系統(tǒng)。程序員編完,能用了,也就完了。沒有重要問題和需求變更,也不會(huì)去頻繁升級(jí)、重構(gòu)和迭代更新。從這方面講,也會(huì)造成企業(yè)在想要XX數(shù)據(jù)時(shí),發(fā)現(xiàn)沒有。想要XX功能時(shí),發(fā)現(xiàn)要實(shí)現(xiàn)的成本太大?;蛘?,在你的威嚴(yán)下,你手下的程序員辭職了,你滿心委屈"我不就是想要個(gè)這么小、這么簡(jiǎn)單的功能么。這小子居然花了那么長(zhǎng)時(shí)間弄,還TMD辭職了,90后,真是一代不如一代。。。。"。所以,這些,到最后,大多都不了了之。。。

5、從具體的實(shí)際流程上看,流程太長(zhǎng)、太慢。比如說,您是集團(tuán)公司的老總,有一天突發(fā)奇想,想到了一個(gè)項(xiàng)目,想"看看相關(guān)數(shù)據(jù)"。此時(shí),你的秘書幫你去搞數(shù)據(jù)了,北京分公司的數(shù)據(jù),很快上來了,上海分公司的數(shù)據(jù),秘書打了好幾遍電話,才要來。山東分公司的說,我們這邊忙著陪客戶吃飯喝酒了,具體數(shù)據(jù)沒收集呢,您稍等,我?guī)湍鷨枂?、查一下。浙江分公司的,?shù)據(jù)報(bào)上來了,剛放你辦公桌上,你剛翻了一下,他們打電話說,數(shù)據(jù)報(bào)錯(cuò)了、漏報(bào)了,您稍等,我們組織人力物力,重新幫你核查。。。此時(shí),時(shí)間上,少說也一個(gè)月過去了,還不一定保證數(shù)據(jù)都正確。數(shù)據(jù)收集上來,您也不用"分析"了。市場(chǎng)風(fēng)云變幻,黃花菜都涼了。。。

.......

鑒于此,大數(shù)據(jù)處理系統(tǒng)來了。有了hadoop、spark、storm、hbase、 Elasticsearch、zookeeper等等大數(shù)據(jù)工具搭建起來的數(shù)據(jù)處理集群,張三終于炮換導(dǎo)彈了。

1、有了hdfs,張三可以把以前覺得沒太大價(jià)值的數(shù)據(jù)保存起來。未來的事,誰(shuí)知道呢,數(shù)據(jù)總是要的,說不定以后用的到呢。如果阿里巴巴沒有保存、整理用戶的交易數(shù)據(jù)等,花唄、借唄等業(yè)務(wù),開展起來,簡(jiǎn)直就是做夢(mèng)。巧婦難為無(wú)米之炊。

2、有了spark等編程框架,你的業(yè)務(wù)處理流程,也更加靈活和牛逼了。你可以用python、java,scala等編寫一些腳本似的數(shù)據(jù)分析程序,盡情地挖掘出有價(jià)值的東西。這一個(gè)個(gè)的job,寫完后,扔給調(diào)度系統(tǒng),定時(shí),每天晚上讓集群幫你跑出來就好了。挺靈活的。

3、調(diào)用一些開發(fā)庫(kù),你可以玩一些機(jī)器學(xué)習(xí)等高大上的東西。出去吹牛逼也有料了。

4、建立統(tǒng)一的數(shù)據(jù)處理中心,再加上互聯(lián)網(wǎng)的力量,終于可以在可接受的時(shí)間范圍內(nèi)獲得你想要的數(shù)據(jù)了,而且數(shù)據(jù)還能詳細(xì),方方面面的數(shù)據(jù)都有,最后還附有機(jī)器人"小優(yōu)"的"智能"建議和溫馨提示。

5、借助比如storm等實(shí)時(shí)處理框架,很多結(jié)果可以秒級(jí)回饋。性能遇到瓶頸了,大不了加機(jī)器。反正一切都是分布式的。

.......

我記得13、14年時(shí),大數(shù)據(jù)最火的時(shí)候。在一次電視節(jié)目中,李彥宏面對(duì)楊瀾,大談大數(shù)據(jù),并舉例"谷歌利用大數(shù)據(jù)預(yù)測(cè)流感。。。。"等等balabala的一大通,全是忽悠套路,沒一點(diǎn)干貨??!我想大多數(shù)人,聽到這些東西,一般都不care,說不準(zhǔn)還暗暗的罵一句"草,這些關(guān)我鳥事"。。。

最近,談起大數(shù)據(jù),很多人都往"人工智能"等高大上的東西上。我想大多數(shù)人,特別是中小企業(yè),也不會(huì)關(guān)心。那是BAT等大公司的事,我們公司小、數(shù)據(jù)少,業(yè)務(wù)也簡(jiǎn)單。"分析",也是電腦不如人腦。因此,大多人,也是覺得,大數(shù)據(jù)或許是未來,但是,對(duì)我來說,似乎也沒多大用處。如果,此人當(dāng)時(shí)心情不好,還多半認(rèn)為"大數(shù)據(jù)",純粹是瞎忽悠。

回到本次話題,針對(duì)"大數(shù)據(jù)能火多久",這個(gè)問題,這就要看大數(shù)據(jù)的本質(zhì)了。在我看來,我們業(yè)內(nèi)目前討論"大數(shù)據(jù)",應(yīng)該更傾向于看它背后的技術(shù)對(duì)當(dāng)前企業(yè)IT系統(tǒng)的革新。就如同目前大多數(shù)企業(yè)以關(guān)系型數(shù)據(jù)庫(kù)為中心的IT系統(tǒng)一樣,現(xiàn)在,我們處理信息的手段中,又添加了新的成員?,F(xiàn)在,如果你向老大建議,我們不要以關(guān)系型數(shù)據(jù)庫(kù)為核心的各類"進(jìn)銷存"、財(cái)務(wù)等系統(tǒng)了,全體回退到以Excel、word來處理信息,我相信,他會(huì)分分鐘扇死你。我相信,20年后,你向老板建議,我們放棄各類以大數(shù)據(jù)處理集群為核心的精準(zhǔn)營(yíng)銷系統(tǒng)、智能客服系統(tǒng)、用戶智能分析系統(tǒng)等等,大家集體回退到以純關(guān)系型數(shù)據(jù)庫(kù)為核心的時(shí)代;我相信,他也一定會(huì)分分鐘扇死你。

????????當(dāng)前,我們對(duì)大數(shù)據(jù)的理解,越來越清晰和接地氣。阿里巴巴已經(jīng)把他們的大數(shù)據(jù)系統(tǒng),改名為了"maxComputer"。從名字不難看出,大數(shù)據(jù)就是大電腦,這意味著更大的信息處理能力、更高的靈活性。。。

????????大數(shù)據(jù)能火多久,如同穿越到上世紀(jì)80年代,去問個(gè)人電腦能火多久一樣?,F(xiàn)在,我們都不會(huì)認(rèn)為"個(gè)人電腦"很"火"。因?yàn)椋呀?jīng)成為了人類工具箱里一件強(qiáng)大的工具,提高了人類的生產(chǎn)力。我相信,"大數(shù)據(jù)",也會(huì)成為我們的工具箱里的這么一樣工具的。

【大數(shù)據(jù)開發(fā)學(xué)習(xí)資料領(lǐng)取方式】:加入大數(shù)據(jù)技術(shù)學(xué)習(xí)交流扣扣群458345782,私信管理員即可免費(fèi)領(lǐng)取開發(fā)工具以及入門學(xué)習(xí)資料

????????目前,看知乎里的答案。很多人討論起大數(shù)據(jù),很多人的看法,還是照搬教科書里的內(nèi)容。其實(shí),對(duì)真正大數(shù)據(jù)圈而言,大數(shù)據(jù)已經(jīng)落地了。下了凡的七仙女,雖然是神仙,但也成為了農(nóng)家媳婦,沒太大討論的必要了。大數(shù)據(jù)從幾年前很火,到現(xiàn)在,從PPT上下凡到數(shù)據(jù)中心,也就沒多大的討論必要了。用就行了,有啥好瞎bb的。。。。。。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容