1. Boosting Boosting(提升方法)是將弱學(xué)習(xí)器算法提升為強(qiáng)學(xué)習(xí)算法的統(tǒng)計(jì)學(xué)習(xí)方法。在分類問題中,提升方法通過反復(fù)修改訓(xùn)練數(shù)據(jù)的權(quán)值分布,構(gòu)建一系列基本分類器...
1. Boosting Boosting(提升方法)是將弱學(xué)習(xí)器算法提升為強(qiáng)學(xué)習(xí)算法的統(tǒng)計(jì)學(xué)習(xí)方法。在分類問題中,提升方法通過反復(fù)修改訓(xùn)練數(shù)據(jù)的權(quán)值分布,構(gòu)建一系列基本分類器...
在上一篇邏輯回歸中,我們利用批量梯度下降算法BGD求解使損失函數(shù)J(θ)取得最小值的θ,同時(shí)也提到了SGD和MBGD,本篇我們實(shí)現(xiàn)下這三個(gè)算法,并進(jìn)行簡單比較。關(guān)于梯度下降算...
思維導(dǎo)圖如下: 在機(jī)器學(xué)習(xí)應(yīng)用中,特征工程扮演重要的角色,可以說特征工程時(shí)機(jī)器學(xué)習(xí)應(yīng)用的基礎(chǔ)。我們都知道,數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)算法的上限,而模型和算法只是不斷逼近這個(gè)上限...
思維導(dǎo)圖如下: 機(jī)器學(xué)習(xí)解決問題的通用流程 問題建模-特種工程-模型選擇-模型融合。 問題建模應(yīng)包含三方面的內(nèi)容:評(píng)估指標(biāo)、樣本選擇、交叉驗(yàn)證。 評(píng)估指標(biāo) 評(píng)估指標(biāo)很多,我們...
在模型開發(fā)中,并不是所有的特征要全部篩選進(jìn)模型,因?yàn)榻鹑跀?shù)據(jù)一般特征有很多,如果全部放入模型,一方面可能會(huì)引起“維度災(zāi)難”,另一方面得到的結(jié)果也許并不是最好的,因?yàn)橛行┨卣髦?..
邏輯回歸(Logistic Regression)是一種用于分類問題的算法。 建立一個(gè)Logistic Regression模型,需要以下三部分工作: 構(gòu)造預(yù)測函數(shù) 構(gòu)建損失...
前文 中文分詞、詞性標(biāo)注、命名實(shí)體識(shí)別是自然語言理解中,基礎(chǔ)性的工作,同時(shí)也是非常重要的工作。在很多NLP的項(xiàng)目中,工作開始之前都要經(jīng)過這三者中的一到多項(xiàng)工作的處理。在深度學(xué)...
作為一個(gè)NLP屆的菜鳥,想把自己學(xué)到的一點(diǎn)知識(shí)寫下來,一是幫助自己梳理知識(shí);二是希望能夠幫到一些打算入門以及正在入門的NLPer.由于我的文筆挺差的,以及學(xué)識(shí)有限,有不忍直視...
3.1餐飲銷售額數(shù)據(jù)異常值檢測 2數(shù)據(jù)特征分析 分布分析:分布分析能揭示數(shù)據(jù)的分布特征和分布類型;定量數(shù)據(jù)的分布分析; 3Python主要數(shù)據(jù)探索函數(shù): python中用于數(shù)...
本文從實(shí)踐的角度,來講一下如何構(gòu)建LSTM+CNN的模型對(duì)文本進(jìn)行分類。 本文Github RNN網(wǎng)絡(luò)與CNN網(wǎng)絡(luò)可以分別用來進(jìn)行文本分類。RNN網(wǎng)絡(luò)在文本分類中,作用是用來...
之前介紹過RNN的分類,本文介紹一下使用預(yù)訓(xùn)練詞向量進(jìn)行RNN+Attention的分類模型。 下面來正式開始,RNN+Attention在tensorflow中的實(shí)現(xiàn)。 運(yùn)...
本篇先考慮二分類問題,記錄常用到的評(píng)估指標(biāo)。 混淆矩陣 假設(shè)在訓(xùn)練之前和預(yù)測之后,一個(gè)樣本的標(biāo)記是確定的兩個(gè)類別,一個(gè)是真實(shí)的1/0,一個(gè)是預(yù)測的1/0,其中1表示正例、0表...