思維導(dǎo)圖如下: 在機(jī)器學(xué)習(xí)應(yīng)用中,特征工程扮演重要的角色,可以說特征工程時(shí)機(jī)器學(xué)習(xí)應(yīng)用的基礎(chǔ)。我們都知道,數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)算法的上限,而模型和算法只是不斷逼近這個(gè)上限...
思維導(dǎo)圖如下: 在機(jī)器學(xué)習(xí)應(yīng)用中,特征工程扮演重要的角色,可以說特征工程時(shí)機(jī)器學(xué)習(xí)應(yīng)用的基礎(chǔ)。我們都知道,數(shù)據(jù)和特征決定了機(jī)器學(xué)習(xí)算法的上限,而模型和算法只是不斷逼近這個(gè)上限...
思維導(dǎo)圖如下: 機(jī)器學(xué)習(xí)解決問題的通用流程 問題建模-特種工程-模型選擇-模型融合。 問題建模應(yīng)包含三方面的內(nèi)容:評(píng)估指標(biāo)、樣本選擇、交叉驗(yàn)證。 評(píng)估指標(biāo) 評(píng)估指標(biāo)很多,我們...
在模型開發(fā)中,并不是所有的特征要全部篩選進(jìn)模型,因?yàn)榻鹑跀?shù)據(jù)一般特征有很多,如果全部放入模型,一方面可能會(huì)引起“維度災(zāi)難”,另一方面得到的結(jié)果也許并不是最好的,因?yàn)橛行┨卣髦?..
前文 中文分詞、詞性標(biāo)注、命名實(shí)體識(shí)別是自然語(yǔ)言理解中,基礎(chǔ)性的工作,同時(shí)也是非常重要的工作。在很多NLP的項(xiàng)目中,工作開始之前都要經(jīng)過這三者中的一到多項(xiàng)工作的處理。在深度學(xué)...
本篇先考慮二分類問題,記錄常用到的評(píng)估指標(biāo)。 混淆矩陣 假設(shè)在訓(xùn)練之前和預(yù)測(cè)之后,一個(gè)樣本的標(biāo)記是確定的兩個(gè)類別,一個(gè)是真實(shí)的1/0,一個(gè)是預(yù)測(cè)的1/0,其中1表示正例、0表...
3.1餐飲銷售額數(shù)據(jù)異常值檢測(cè) 2數(shù)據(jù)特征分析 分布分析:分布分析能揭示數(shù)據(jù)的分布特征和分布類型;定量數(shù)據(jù)的分布分析; 3Python主要數(shù)據(jù)探索函數(shù): python中用于數(shù)...
本文從實(shí)踐的角度,來講一下如何構(gòu)建LSTM+CNN的模型對(duì)文本進(jìn)行分類。 本文Github RNN網(wǎng)絡(luò)與CNN網(wǎng)絡(luò)可以分別用來進(jìn)行文本分類。RNN網(wǎng)絡(luò)在文本分類中,作用是用來...
之前介紹過RNN的分類,本文介紹一下使用預(yù)訓(xùn)練詞向量進(jìn)行RNN+Attention的分類模型。 下面來正式開始,RNN+Attention在tensorflow中的實(shí)現(xiàn)。 運(yùn)...