review了一下Word2vec。
背景知識:
1. 基于詞共現(xiàn)概率這一目標(biāo)函數(shù),詞表中任意index=i的單詞有兩部分表示,中心詞向量ui和上下文詞向量vi,其中,上下文是通過滑窗在中心詞周圍括起來的2*window_size的詞;
2. 負采樣就是給定中心詞后,詞表中滑窗m外的詞匯中隨機抽取K個,即random.choice([V-2m-1],? K)




review了一下Word2vec。
背景知識:
1. 基于詞共現(xiàn)概率這一目標(biāo)函數(shù),詞表中任意index=i的單詞有兩部分表示,中心詞向量ui和上下文詞向量vi,其中,上下文是通過滑窗在中心詞周圍括起來的2*window_size的詞;
2. 負采樣就是給定中心詞后,詞表中滑窗m外的詞匯中隨機抽取K個,即random.choice([V-2m-1],? K)