今天來講解一個(gè)非常經(jīng)典的詞向量模型word2vec并介紹一個(gè)非常強(qiáng)大的庫gensim。先貼一段代碼。
from gensim.models import Word2Vec
en_wiki_word2vec_model = Word2Vec.load('wiki.zh.text.model')
test_words = ['蘋果', '數(shù)學(xué)', '學(xué)術(shù)', '白癡', '籃球']
for i in range(5):
res = wn_wiki_word2vec_model.most_similar(test_words[i])
print(test_words[i])
print(res)
n-gram

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png
logistic回歸用于二分類,挑選出重要的詞。

sigmiod

image.png

image.png

image.png
極大似然函數(shù)

image.png

image.png

image.png
Negative Sampling負(fù)采樣

image.png

image.png

image.png