論文筆記:Predicting Target Language CCG Supertags Improves Neural Machine Translation

一、文章有什么貢獻(xiàn)?

  1. 主要共享是提出了一個新的思路,以CCG (Combinatory Categorial Grammar) Supertag的形式將句法信息引入了,NMT(神經(jīng)機(jī)器翻譯)的解碼器端,對NMT的性能有了一定提高。
  2. 用兩種方式將CCG Supertag任務(wù)引入解碼器,一種是直接插入輸出的序列,一種是利用了多任務(wù)學(xué)習(xí),對多任務(wù)學(xué)習(xí)的研究也有一些貢獻(xiàn)。
  3. 展示了不光是解碼器,當(dāng)同時(shí)在編碼器端輸入語言學(xué)信息的時(shí)候,性能得到進(jìn)一步提高。
  4. 對其中更多細(xì)節(jié),如句子種類還有句子長度也進(jìn)行了詳細(xì)的分析。進(jìn)一步理解,引入語言學(xué)信息后對NMT系統(tǒng)的影響。

二、本文研究問題有什么價(jià)值?

首先引入CCG Supertag來對NMT的解碼器加入語法學(xué)信息,而且證明了這種情況下直接插入輸出序列比多任務(wù)學(xué)習(xí)的性能要好。當(dāng)然主要還是證明了,語言學(xué)對NMT系統(tǒng)的影響。

三、研究問題有什么挑戰(zhàn)?

大概就是如何將CCG supertag的語法信息引入編碼器端吧。

之后很多都是對系統(tǒng)的詳細(xì)分析了。

四、本文解決思路?

本文提出了兩個解決思路。

  1. 一個是interleaving,也就是將CCG supertag直接相間插入目標(biāo)語言的序列中去,也就是將輸出序列長度增加一倍,一個單詞一個相應(yīng)的tag。如這樣 $y{'}=y_1{tag},y_1{word},...,y_T{tag},y_T^{word}$ .

    然后就把這個當(dāng)做是原來的目標(biāo)語言序列,進(jìn)行解碼預(yù)測。

    interleaving
  2. 還有一種思路是利用多任務(wù)學(xué)習(xí)(Multi-task Learning),兩個解碼器分別用來翻譯和輸出CCG supertag,這兩個解碼器共享一個編碼器。

    multitasking

    結(jié)果是第一個方案更好一些。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,680評論 19 139
  • 在保證視頻圖像質(zhì)量的前提下,HEVC通過增加一定的計(jì)算復(fù)雜度,可以實(shí)現(xiàn)碼流在H.264/AVC的基礎(chǔ)上降低50%。...
    加劉景長閱讀 8,304評論 0 6
  • 本系列第三篇,承接前面的《淺談機(jī)器學(xué)習(xí)基礎(chǔ)》和《淺談深度學(xué)習(xí)基礎(chǔ)》。 自然語言處理緒論 什么是自然語言處理? 自然...
    我偏笑_NSNirvana閱讀 18,476評論 2 68
  • 近日,谷歌官方在 Github開放了一份神經(jīng)機(jī)器翻譯教程,該教程從基本概念實(shí)現(xiàn)開始,首先搭建了一個簡單的NMT模型...
    MiracleJQ閱讀 6,759評論 1 11
  • 0, 就……就這么結(jié)束了嗎? 我抓著樹根,看了看腳下,似乎可以墜落很久的樣子。 又看了看頭上,似乎也要墜落很久的樣...
    LostAbaddon閱讀 835評論 7 4

友情鏈接更多精彩內(nèi)容