實(shí)時(shí)機(jī)器學(xué)習(xí)是什么,面臨哪些挑戰(zhàn)?

? ? ? ?最近能夠隨數(shù)據(jù)獲取實(shí)時(shí)調(diào)整模型的實(shí)時(shí)機(jī)器學(xué)習(xí),正在成為媒體技術(shù)領(lǐng)域的新“網(wǎng)紅”。曾經(jīng)連續(xù)兩年,都被FTI評為傳媒業(yè)的重要技術(shù)趨勢之一,與自然語言理解NLU、機(jī)器閱讀理解MRC、音視頻算法等共享金字塔頂端的榮光。 ?

那實(shí)時(shí)機(jī)器學(xué)習(xí)到底是什么呢?

  在開啟扒皮模式之前,我們先來了解一下,實(shí)時(shí)機(jī)器學(xué)習(xí)究竟在哪些地方比傳統(tǒng)的機(jī)器學(xué)習(xí)更強(qiáng)?

  傳統(tǒng)的機(jī)器學(xué)習(xí)(ML)正在媒體領(lǐng)域得到越來越多的應(yīng)用,利用算法實(shí)現(xiàn)內(nèi)容的“個(gè)性化推薦”,已經(jīng)成為主流媒體的標(biāo)配。

  但過去的算法,主要側(cè)重于使用靜態(tài)模型和歷史數(shù)據(jù)進(jìn)行訓(xùn)練并提供預(yù)測。比如用戶在瀏覽網(wǎng)站時(shí),可以根據(jù)用戶歷史行為數(shù)據(jù)來推送新聞。

  而一些新的涉及動態(tài)實(shí)施決策的業(yè)務(wù),比如具備時(shí)效性的熱點(diǎn)新聞,或是用戶想要看點(diǎn)新東西,這就需要用一種新的算法來實(shí)現(xiàn),即實(shí)時(shí)機(jī)器學(xué)習(xí)Real-Time Machine Learning。


  以頭條的核心技術(shù)“個(gè)性化推薦算法”為例,其核心原理就是根據(jù)用戶對文章的歷史行為數(shù)據(jù)反饋,進(jìn)行統(tǒng)計(jì)挖掘和判斷。

  比如具有相同偏好的三個(gè)用戶,分別選擇了自己喜歡的文章,得到最高票數(shù)的文章就會被推薦給被系統(tǒng)打上同一屬性標(biāo)簽的第四個(gè)人……以此類推。

  不難發(fā)現(xiàn),傳統(tǒng)機(jī)器學(xué)習(xí)算法的成功,依賴于對用戶的“知根知底”,需要用戶不斷開放自己的私人領(lǐng)地。

  而實(shí)時(shí)機(jī)器學(xué)習(xí),更擅長對用戶的當(dāng)下需求體察入微,讓用戶在保持隱私安全感的同時(shí),獲得如沐春風(fēng)的瀏覽體驗(yàn)。

顯然,實(shí)時(shí)機(jī)器學(xué)習(xí)算法將主導(dǎo)一個(gè)令人期待的新世界,也有越來越多的媒體在為此做著準(zhǔn)備。


? ? ? ?實(shí)時(shí)機(jī)器學(xué)習(xí)技術(shù)的深入應(yīng)用,將解鎖很多超乎想象的媒體功能和應(yīng)用場景。但是,盡管學(xué)界已經(jīng)在算法上提出了幾種理想的架構(gòu),但產(chǎn)業(yè)端卻未迎來蓬勃的質(zhì)變。這究竟是為什么?實(shí)時(shí)機(jī)器學(xué)習(xí)落地到底面臨哪些挑戰(zhàn)呢?

  1.高吞吐量與低延遲的平衡。

  媒體平臺的海量用戶需求,決定了實(shí)時(shí)機(jī)器學(xué)習(xí)要在每秒處理數(shù)百萬任務(wù)量級。以這樣的速度進(jìn)行大規(guī)模的信息分發(fā),需要細(xì)致到毫秒級的任務(wù)執(zhí)行能力。

  2.動態(tài)異構(gòu)任務(wù)模塊的高效喚醒。

  對于Facebook這樣體量龐大的平臺來說,其服務(wù)是由成千上萬個(gè)不同模塊構(gòu)建而成的,流量調(diào)節(jié)、圖像轉(zhuǎn)碼、存儲編碼等等。在實(shí)時(shí)任務(wù)中,會伴隨生成很多不同資源支持的新任務(wù),增加系統(tǒng)的響應(yīng)和處理難度。

  如何對這些重要且不一樣的特性進(jìn)行預(yù)測,十分具有挑戰(zhàn)性。


  3.實(shí)時(shí)算法與業(yè)務(wù)場景的融合。

  實(shí)時(shí)響應(yīng)和預(yù)測,意味著留給系統(tǒng)的容錯(cuò)空間更小。要保障這一技術(shù)在實(shí)際應(yīng)用場景中的穩(wěn)定性,就要在完成高吞吐量任務(wù)的同時(shí),能夠快速模擬真實(shí)世界的交互,然后精準(zhǔn)地判斷出,哪些是結(jié)果的決定性因素,從而做出正確的響應(yīng)。

  舉個(gè)例子,如果想給用戶推薦“哪些朋友贊過此貼”,實(shí)時(shí)算法會快速判斷出“最近一次查看”這一數(shù)據(jù)集對完成該任務(wù)毫無意義,然后快速修改關(guān)聯(lián)并重新學(xué)習(xí)。這種自適應(yīng)調(diào)整,可以有效防止用戶收到的結(jié)果中出現(xiàn)明顯的錯(cuò)誤點(diǎn)。


作者:腦極體

原文鏈接:https://www.kg.com/article/512402530874036224

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容