2016-12-09 人工智能

前一陣從淼哥那里知道了訊飛聽見,就是上傳一段音頻,選擇機(jī)器轉(zhuǎn)錄,可以很快時(shí)間內(nèi)轉(zhuǎn)錄成文字,準(zhǔn)確率可達(dá)95%。人工轉(zhuǎn)錄的準(zhǔn)確率大概在98%,也就是說機(jī)器轉(zhuǎn)錄只比人工差一點(diǎn)點(diǎn),但是速度快了好多倍,成本也低了好多倍。

因?yàn)槲易鲞^好多年字幕,曾經(jīng)接過一個(gè)商業(yè)活就是為中文講座配字幕,但是文字都要自己去聽打。一個(gè)不到兩小時(shí)的講座,作為一個(gè)打字還算快,打軸也算熟練的人,我滿負(fù)荷狀態(tài)做了兩天才做完。(我就不說給多少錢了,年輕的時(shí)候?qū)r(shí)間真是沒概念哎。)

而放到現(xiàn)在,可以直接丟去訊飛平臺轉(zhuǎn)錄,不到半小時(shí)可以下載字幕,然后做一點(diǎn)校對,據(jù)我估計(jì)可以在3小時(shí)之內(nèi)完成工作??萍紝π袠I(yè)的影響就是這么大。

而就在前幾天,我知道原來在遙遠(yuǎn)的美利堅(jiān)也有類似的平臺——AcousDoc,似乎是來自Standford的華人學(xué)生做的,可以理解為英語版的訊飛聽見。

那么這個(gè)有什么用呢?作為一個(gè)做了多年美劇字幕的人,知道字幕組要翻譯一個(gè)劇,有一樣?xùn)|西是必不可少的,那就是英文字幕。英文字幕一般都是從美國電視臺錄下來的。如果一個(gè)劇沒有英文字幕,那么聽譯難度會成倍上升,除非有一幫狂熱的人特別想做,否則一般不會去翻譯。

而這個(gè)東西的出現(xiàn),意味著可以靠機(jī)器生成一個(gè)片子的字幕,并且準(zhǔn)確率很高,這就直接解決了一個(gè)極大的痛點(diǎn)。之前有個(gè)NASA的聽譯任務(wù),因?yàn)闆]有字幕,幾乎沒有人報(bào)名。用這個(gè)平臺生成了字幕之后,總?cè)豪锩嬉话l(fā),翻譯當(dāng)晚報(bào)滿。

科技改變生活。


一陣激動之余,在知乎搜了一下相關(guān)內(nèi)容,發(fā)現(xiàn)這樣一篇回答(為什么 Deep Learning 最先在語音識別和圖像處理領(lǐng)域取得突破? ),大概是說30年前學(xué)者就建立了深度學(xué)習(xí)的模型,但是直到近年來機(jī)器處理速度大幅提升,互聯(lián)網(wǎng)資訊大量增長,讓機(jī)器能夠足夠快的學(xué)習(xí)足夠多的材料,才使得語音識別準(zhǔn)確率取得突破。

看完對學(xué)者致以崇高的敬意。一個(gè)研究成果可以在30年后時(shí)機(jī)成熟的時(shí)候釋放巨大的能量。在我的人生觀當(dāng)中,來世界一遭,也應(yīng)該留下這樣的成果。我還記得曾經(jīng)看過霍金講宇宙的紀(jì)錄片,其中提到地球在幾十億年后是會毀滅的,所以人類需要一直探索外太空。但是可能出現(xiàn)合適的居住地的地方,不是人類壽命的時(shí)間能到達(dá)的。那么就有兩個(gè)可能,一是生物技術(shù)的發(fā)展,使得人類能夠活到到達(dá)能夠移居的星球。另一個(gè)是通過人工智能的發(fā)展,讓機(jī)器人代替人類探索宇宙。

從這方面來看,人工智能將是數(shù)十億年后人類文明得以延續(xù)的關(guān)鍵。


大學(xué)時(shí)候雖然讀的是數(shù)學(xué)系,但是并沒有學(xué)好數(shù)學(xué)。在我第一個(gè)100天計(jì)劃中,就包含了微積分的學(xué)習(xí),要把落下的東西補(bǔ)回來。之前并沒有想過為什么要補(bǔ)數(shù)學(xué),只是覺得有必要。今天這么一看更明確了,如果以后要做人工智能方面的研究,那么數(shù)學(xué)的底子是必不可少的。

嗯,就是這樣。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容