《Factored Neural Machine Translation》簡(jiǎn)讀

paper來(lái)源:arXiv.org

問(wèn)題

實(shí)驗(yàn)任務(wù)----屬于機(jī)器翻譯(NMT)任務(wù),具體來(lái)說(shuō),本paper實(shí)驗(yàn)任務(wù)為英語(yǔ)翻譯為法語(yǔ);

paperwork----在傳統(tǒng)NMT的“seq2seq+attention”的基礎(chǔ)上引入先驗(yàn)知識(shí)/工具改進(jìn)了decoder的結(jié)構(gòu),在一定程度上解決大詞表(Large Vocabulary)和OOV(Out Of Vocabulary)問(wèn)題;

摘要:

首先,作者使用morphological and grammatical analysis(形態(tài)學(xué)與語(yǔ)法分析器)來(lái)獲取單詞的因素表示,lemmas, Part of Speech tag, tense, person, gender and number等;

其次,作者改進(jìn)了傳統(tǒng)的NMT的decoder,把輸出由一個(gè)變成了兩個(gè),分別表示lemmas和其他的factors,獨(dú)立學(xué)習(xí),然后重組為word;

由此帶來(lái)的好處是,同樣大的詞表可以表示更多的詞;再者,它可以生產(chǎn)詞表中不存在的新詞,減少OOV詞項(xiàng)的出現(xiàn)頻率;

形態(tài)學(xué)與語(yǔ)法分析器(本文使用的是MACAON):

舉例:法語(yǔ)詞devient(對(duì)應(yīng)英文詞becomes)可以表示為devenir和“vP3#s”, devenir為lemma,可以理解為詞根;“vP3#s”為factors,可理解為修飾限制詞根的其他因素;v表示verb,P表示Present(時(shí)態(tài)),3表示3rd person(第三人稱),#表示無(wú)關(guān)性別,s表示單數(shù);

網(wǎng)絡(luò)結(jié)構(gòu):

傳統(tǒng)的NMT結(jié)構(gòu)圖:

兩個(gè)重要概念:seq2seq,attention

FNMT提出的新的decoder的結(jié)構(gòu):

P變成獨(dú)立的Lemma和factors向量(由此可能會(huì)帶來(lái)長(zhǎng)度差異,最終翻譯結(jié)果的長(zhǎng)度以lemma長(zhǎng)度為準(zhǔn));

將P層輸入給softmax決定lemma和factor后,再將二者輸送給形態(tài)學(xué)分析器來(lái)產(chǎn)生word;

(feedback采用的是lemma向量,根據(jù)如下實(shí)驗(yàn)效果選擇的):

實(shí)驗(yàn)結(jié)果:

1,詞表比較大的時(shí)候,表現(xiàn)基本持平;詞表縮小的話,F(xiàn)NMT的表現(xiàn)就要好得多;

2,相同的參數(shù)量,F(xiàn)NMT能夠囊括更多的word;

3,在OOV問(wèn)題的解決上,F(xiàn)NMT表現(xiàn)更好;

4,最后一列是忽略factor誤差帶來(lái)的影響,lemma正確就算正確的結(jié)果;

簡(jiǎn)評(píng):

1,本文利用先驗(yàn)知識(shí)(詞根+限制條件表示詞匯)給解決大詞表和OOV問(wèn)題提供了一種思路;

2,實(shí)驗(yàn)的效果很大一部分依賴于先驗(yàn)的語(yǔ)態(tài)學(xué)分析器的效果,比如目標(biāo)語(yǔ)言如果是中文或者英文就沒(méi)有這樣靠譜的分析器;

3,如有問(wèn)題或建議,歡迎留言交流~

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 近日,谷歌官方在 Github開(kāi)放了一份神經(jīng)機(jī)器翻譯教程,該教程從基本概念實(shí)現(xiàn)開(kāi)始,首先搭建了一個(gè)簡(jiǎn)單的NMT模型...
    MiracleJQ閱讀 6,745評(píng)論 1 11
  • 前面的文章主要從理論的角度介紹了自然語(yǔ)言人機(jī)對(duì)話系統(tǒng)所可能涉及到的多個(gè)領(lǐng)域的經(jīng)典模型和基礎(chǔ)知識(shí)。這篇文章,甚至之后...
    我偏笑_NSNirvana閱讀 14,424評(píng)論 2 64
  • 語(yǔ)言與精神分析 四川大學(xué)哲學(xué)系 霍大同 第一講 1999年3月1日 這是一個(gè)比較困難的題目,我準(zhǔn)備講的課的題目是“...
    團(tuán)的花園閱讀 5,770評(píng)論 0 19
  • Spring Cloud為開(kāi)發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見(jiàn)模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,545評(píng)論 19 139
  • 每每與各方朋友談及人生道路如何走,經(jīng)常聽(tīng)到的一句話就是:做事先做人。這句話可以說(shuō)是約定俗成的大家都統(tǒng)統(tǒng)認(rèn)可的一...
    太原家老馮閱讀 810評(píng)論 4 3

友情鏈接更多精彩內(nèi)容