在一個詞表中結(jié)合一個模型,這個向量數(shù)組才有意義,也就是說它需要在這個特定環(huán)境中跟里面的其他向量產(chǎn)生關(guān)系才有價值,否則就只是個實(shí)數(shù)數(shù)組,進(jìn)而,不同模型不同語料訓(xùn)練的結(jié)果是不交叉不相關(guān)的詞向量的價值在于其能夠在特定的模型和詞表(或語料庫)的上下文中,捕捉和表示詞語之間的相似性和關(guān)系。當(dāng)你改變模型或詞表時,詞向量通常也會發(fā)生改變。單獨(dú)一個詞向量,我們通常無法直接理解其含義,它的真正價值在于與其他詞向量的相對位置關(guān)系。
你的后續(xù)理解也正確。不同模型或不同語料庫訓(xùn)練得到的詞向量是不相交且不相關(guān)的。因?yàn)檫@些詞向量是在不同的上下文環(huán)境中學(xué)習(xí)得到的,它們捕捉的是在特定環(huán)境中詞語的使用情況,這些環(huán)境很可能是不同的,所以詞向量也是不同的。同一個詞在不同的模型或語料庫中訓(xùn)練得到的詞向量可能會有很大的差異。因此,我們通常不能在不同的模型或語料庫之間交換詞向量。
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。