詞向量的應(yīng)用
第一種應(yīng)用是找同義詞。具體應(yīng)用案例就是google的word2vec工具,通過訓(xùn)練好的詞向量,指定一個詞,可以返回和它cos距離最相近的詞并排序。
第二種應(yīng)用是詞性標(biāo)注和語義角色標(biāo)注任務(wù)。具體使用方法是:把詞向量作為神經(jīng)網(wǎng)絡(luò)的輸入層,通過前饋網(wǎng)絡(luò)和卷積網(wǎng)絡(luò)完成。
第三種應(yīng)用是句法分析和情感分析任務(wù)。具體使用方法是:把詞向量作為遞歸神經(jīng)網(wǎng)絡(luò)的輸入。
第四種應(yīng)用是命名實體識別和短語識別。具體使用方法是:把詞向量作為擴展特征使用。
另外詞向量有一個非常特別的現(xiàn)象:C(king)-C(queue)≈C(man)-C(woman),這里的減法就是向量逐維相減,換個表達方式就是:C(king)-C(man)+C(woman)和它最相近的向量就是C(queue),
這里面的原理其實就是:語義空間中的線性關(guān)系?;谶@個結(jié)論相信會有更多奇妙的功能出現(xiàn)。