小伙伴們,上一篇文章給大家介紹了如何訓(xùn)練甄嬛體聊天機(jī)器人。更準(zhǔn)確地說,它不能稱之為聊天機(jī)器人,應(yīng)該是一個文本生成器。在上文www.itdecent.cn/p/752b06546277的基礎(chǔ)上,我做了小小的改進(jìn)(其實(shí)是一個朋友幫忙^_^),讓模型預(yù)測出的結(jié)果不是一個詞,而是一句話。實(shí)驗(yàn)結(jié)果如下:

訓(xùn)練數(shù)據(jù)為1000時的結(jié)果截圖
圖中,“風(fēng)波 我 的 那一天 , 是 個 非常 晴朗 的 日子 。 乾元? 十二年 八月 二十 , 。 站”這句話為輸入語句;“在 在 的 說來? 每 以后 它 驚住 想 的 淚 , 流露出 莊和德 莊和德 看不得 , 就是 想一想 聰明人”這句話為預(yù)測出的語句。
可以看到輸出不是一個詞,是一句話。大家一定會發(fā)現(xiàn)這個結(jié)果不能稱之為“話”,因?yàn)樗⒉煌?,而且有些詞重復(fù)出現(xiàn)。但是,在實(shí)驗(yàn)室的服務(wù)器上,將訓(xùn)練數(shù)據(jù)增加到10000條時,輸出結(jié)果要比1000條訓(xùn)練數(shù)據(jù)好得多,語句中的詞語不再重復(fù),而且更加通順,但那個結(jié)果我沒有截圖,我也不想為了截個圖再花大量的時間去訓(xùn)練、生成了。想要告訴大家的是,這個結(jié)果通過增加訓(xùn)練數(shù)據(jù)是可以改善的。聰明的你也許不僅僅選擇增加訓(xùn)練數(shù)據(jù),甚至可以調(diào)整模型中的各種參數(shù),達(dá)到一個更好的效果,期待大家的新思路。