要你從10短視頻里面找出所有“狗”出現(xiàn)的畫面,要花多久時間呢?對Google來說,可能只要不到一秒鐘。
美國時間8日登場的Google Cloud Next云端大會上,Google云端人工智慧暨機(jī)器學(xué)習(xí)首席科學(xué)家李飛飛,發(fā)表了Google通過深度學(xué)習(xí)技術(shù)打造的云端影音智能應(yīng)用程序介面 (Cloud Video Intelligence API)。
從現(xiàn)場的示范可以看到,現(xiàn)在Google的機(jī)器學(xué)習(xí)已經(jīng)不只能做到圖片或語音、文字識別,也可以精準(zhǔn)地找出每段視頻中特定物件出現(xiàn)的時間點(diǎn),或者也可以用于挖掘出同類型影音內(nèi)容。
例如只要搜尋“老虎”,資料庫中所有出現(xiàn)“老虎”的相關(guān)視頻都會被標(biāo)列出來,可以說是機(jī)器學(xué)習(xí)在影音領(lǐng)域的一大突破。
雖然目前云端影音智能應(yīng)用程序介面還是在封閉測試階段(Private Beta),但就像李飛飛說的:
“我們就像是在黑暗中為數(shù)字世界點(diǎn)燃一盞燭光?!?/p>
可以想像未來如YouTube、媒體公司、監(jiān)控系統(tǒng)從業(yè)者,或者是Google提到的消費(fèi)科技公司等等,都可能因此更容易建立媒體分類、并也更有效地做內(nèi)容管理和應(yīng)用,或是在這樣的基礎(chǔ)上發(fā)展出更多的變化。