邏輯回歸常見面試總結(jié) 一、基本知識 簡要介紹:邏輯回歸假設(shè)數(shù)據(jù)服從伯努利分布,通過極大似然函數(shù)的估計方法,運用梯度下降的方法來求解參數(shù),來達到將...
VS Code之Python環(huán)境配置 一、配置本地的python環(huán)境 1、安裝Anaconda3 在Anaconda官網(wǎng)下載最新版的Anacon...
Contextual Word Representations and Pretraining 一、Word Representations 在...
Subword Models 一、Morphology: Parts of words 在傳統(tǒng)上,我們通常將語素作為最小的語義單位。在深度學(xué)習(xí)中...
ConvNets for NLP 一、From RNNs to Convolutional Neural Nets RNN無法捕獲沒有前綴上下文...
QA 一般來說,問答系統(tǒng)的目的就是根據(jù)給定的問題給出相應(yīng)的答案。我們可以將其分解為兩個步驟:1、查找(可能)包含答案的文檔;2、在段落或文檔中找...
機器翻譯與seq2seq 一、早期的機器翻譯 機器翻譯(MT)是將句子x從一種語言(源語言)翻譯成另一種語言(目標(biāo)語言)的句子y的任務(wù)。機器翻譯...
RNN中的梯度消失問題 一、RNN中的梯度消失 1、梯度消失的影響 梯度消失是神經(jīng)網(wǎng)絡(luò)中比較常見也是比較嚴(yán)重的一個問題,在RNN中它會導(dǎo)致長距離...
語言模型和循環(huán)神經(jīng)網(wǎng)絡(luò) 一、語言模型 1、簡介 簡單來講,語言模型就是通過對預(yù)測接下來會出現(xiàn)什么詞這個任務(wù)建模得到的一個模型。下圖就是一個簡單的...