Word2Vec 究竟選擇Tensorflow還是 gensim

最近想訓(xùn)練專(zhuān)業(yè)領(lǐng)域的語(yǔ)料庫(kù),深度學(xué)習(xí)領(lǐng)域python的版本較多,國(guó)內(nèi)普遍使用gensim來(lái)訓(xùn)練,而word2vec是Google提出的,Tensorflow上有例子實(shí)現(xiàn)。最近tensorflow越來(lái)越流行,所以考慮采用tensorflow來(lái)訓(xùn)練,可能能達(dá)到更快的訓(xùn)練速度,在技術(shù)方案上更符合主流。經(jīng)過(guò)一周的實(shí)驗(yàn),發(fā)現(xiàn)效果不如人意。具體如下:
-網(wǎng)上評(píng)估gensim的效果比tensorflow好很多。原文鏈接
-沒(méi)有找到tensorflow運(yùn)行windows上的word2vec說(shuō)明,word2vec_basic運(yùn)行沒(méi)有問(wèn)題,但高級(jí)版需要編譯op。
-沒(méi)有找到tensorflow上word2vec版本中的questions_words.txt中文方面的具體應(yīng)用。
上述情況說(shuō)明gensim在文本訓(xùn)練的難易程度、準(zhǔn)確率方面比tensorflow示范程序里面介紹的方法好多了。但國(guó)內(nèi)沒(méi)有找到具體的原因,最后在stackoverflow.com上找到了一篇文章,詳細(xì)說(shuō)明了可能的原因,讓我徹底放棄了tensorflow上實(shí)現(xiàn)word2vec的想法。
經(jīng)過(guò)實(shí)際測(cè)試, gensim通過(guò)Cpython來(lái)實(shí)現(xiàn)底層算法,速度很快,簡(jiǎn)單易用。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容