FIXED 詳細(xì)級別表達(dá)式使用指定的維度計算值,而不引用視圖中的維度。INCLUDE表達(dá)式,將隨視圖中的任何其他維度一起添加表達(dá)式中的維度來確定...
最近讀了一本書,書名叫《增長黑客》,感覺受益良多,讀完就迫不及待想要分享一下。這本書就是著名“黑客增長之父”肖恩·埃利斯 歷時十年的重磅之作,主...
一、算法思路:(這里主要關(guān)注兩種) 生成模型:先計算樣本特征的總體的聯(lián)合分布,將所有有標(biāo)注的樣本計算出一個分布,然后把沒有標(biāo)注的樣本放入這個分布...
一、分類模型1.KNN算法函數(shù):KNeighborsClassifier()思路:對k個最近的鄰居進(jìn)行擬合,調(diào)試出最佳n_neighbors的值...
一、概念 人工神經(jīng)網(wǎng)絡(luò)是是一種應(yīng)用類似于大腦神經(jīng)突觸聯(lián)接的結(jié)構(gòu)進(jìn)行信息處理的數(shù)學(xué)模型。這種模型可以適用于分類與回歸。 神經(jīng)網(wǎng)絡(luò)的優(yōu)點:可以把非線...
特征處理包括:數(shù)據(jù)清洗和特征預(yù)處理。 一、數(shù)據(jù)清洗: 1.數(shù)據(jù)樣本抽樣 ①樣本要具備代表性 ②樣本比例要平衡以及樣本不平衡時如何處理 ③考慮全量...
一、概念 LDA:Linear Discriminant Analysis 線性判別式分析 (NOT:在文本分析領(lǐng)域,還有個LDA的概念,全稱為...
特征選擇就是剔除與標(biāo)注不相關(guān)或者冗余的特征,它是數(shù)據(jù)歸約的思路之一(另一個思路為抽樣) 特征選擇主要包括三種思想:過濾思想、包裹思想和嵌入思想。...
相關(guān)分析最常用的方法就是用相關(guān)系數(shù)直接衡量連續(xù)值的相關(guān)性,而離散屬性的相關(guān)性是用熵增益轉(zhuǎn)換成相關(guān)性的形式來衡量。 一、分析連續(xù)值的相關(guān)性: Pe...