
大家好,我是人人詞典的負(fù)責(zé)人,笪小強(qiáng)。
非常感謝大家來參加這次ifanr主持的這個mindtalk分享活動,今天我們分享的主題是如何利用人人詞典來更有效率的學(xué)習(xí)外語。
人人詞典最早是在2014年底開始立項(xiàng),在這個過程當(dāng)中呢,我們拜訪了非常多的專家學(xué)者、一線的老師,跟他們討教了很多。然后我們2015年用整年時間認(rèn)真的對優(yōu)秀的翻譯作品進(jìn)行加工處理,就是將“字幕與對應(yīng)的影視作品的一些視頻原生截圖片段的數(shù)據(jù),進(jìn)行了整理和校對”,目前人人詞典的語料庫有280萬條,這個就是平行的原料,但這個量還是非常小的,僅占人人影視語料庫的5%左右。
什么是二語習(xí)得理論?
我想先簡單介紹一下語言學(xué)的很重要的一個分支:二語習(xí)得。
第二語言習(xí)得(Second Language Acquisition /SLA,簡稱二語習(xí)得),通常指母語習(xí)得之后的任何其他語言學(xué)習(xí)。人們從社會、心理、語言學(xué)等角度去研究它。第二語言習(xí)得研究作為一個獨(dú)立學(xué)科,大概形成于二十世紀(jì)60年代末70年代初,已有35年的歷史。它對學(xué)習(xí)者的第二語言特征及其發(fā)展變化、學(xué)習(xí)者學(xué)習(xí)第二外語時所具有的共同特征和個別差異進(jìn)行描寫,并分析影響二語習(xí)得的內(nèi)外部因素。 -轉(zhuǎn)自“百度百科”、知乎詳見這里。
二語習(xí)得理論尚存爭議,我個人認(rèn)為這個理論是非常有趣且實(shí)用的。
我們目前學(xué)到的其實(shí)是啞巴英語,學(xué)也只是學(xué)會了讀或者寫,但實(shí)際交流,是非常困難的。
我們可以回想一下我們是如何掌握母語的呢?
基本所有的小孩兒,都是在一歲半到兩歲之間,就開口說話,那此前為什么會有沉默期?這可能是我們身體他本身語言天賦所自帶的一種學(xué)習(xí)機(jī)制。在沉默期里,是在觀察周圍的世界,再觀察父母之間的對話,包括周圍人的一些對話,這樣就形成了一個語言的大數(shù)據(jù),當(dāng)這個數(shù)據(jù)積累到足夠高的時候,那么開口說話變成一種非常自然的過程。
這跟人工智能非常像,就是所有的人工智能產(chǎn)品,都有一個大數(shù)據(jù)采集的過程,就等在足夠準(zhǔn)確之前,先要積累足夠量的數(shù)據(jù)。
所以我們之前的傳統(tǒng)教育,一來就讓我們開口說話,這在“二語習(xí)得"的理論里邊,不是一個好方法。其實(shí)是不應(yīng)該直接去說的,而是先要去多聽,先去接受非常大量的可理解性的輸入,來提高我們對語言的一些認(rèn)知。
怎么跟“人人影視”字幕組一起學(xué)英語呢?
重點(diǎn)來了!笪小強(qiáng)同學(xué),開發(fā)了一款應(yīng)用,叫“人人詞典”,牛X的點(diǎn)在哪里呢?人人詞典的每一個例句,都對應(yīng)一個視頻的片段,原聲。
不過笪小強(qiáng)同學(xué)也說,目前應(yīng)用的功能還是比較單一的,有將近一半的功能都還在計劃要做。
我下載這個軟件并體驗(yàn)幾分鐘的體會:覺得看圖片聽“斷句”(不是短句),上下文都沒有,其實(shí)不如看視頻不過癮。

“人人詞典”后續(xù)要做什么事情?
目前已經(jīng)在成都投資了一家做虛擬現(xiàn)實(shí)的公司,后面,希望希望通過技術(shù)手段訓(xùn)練詞庫,將真實(shí)場景復(fù)原,會比看視頻的學(xué)習(xí)形式更有效率。
再分享一個“屌絲逆襲學(xué)好外語”的小例子。
我有一個英語very poor的朋友,然后陰差陽錯跑到一個國際青年旅社,當(dāng)了前臺。
于是在那里,每天接觸到全世界很多國家的背包客,一年以后,當(dāng)我再見到他的時候,他的英語已經(jīng)超棒了,因?yàn)樗谀谦@得了比我們平時大的多的接觸英語的機(jī)會。所以,我覺得這是學(xué)習(xí)英語很好的方法。
我們后面會組織全國的國際青年旅社,將有興趣的同學(xué)去做實(shí)習(xí)等工作,這是比較廉價有很棒的實(shí)踐活動。
-end-