加載數(shù)據(jù) 分類器 評估
RawData Over-sampling RandomOverSample SMOTE ADASYN BorderlineSMOTE Unde...
FP-growth(頻繁模式增長) 數(shù)據(jù)庫的第一遍掃描用來統(tǒng)計出現(xiàn)的頻率;第二遍掃面中考慮那些頻繁元素 優(yōu)點: 大約比Apriori算法快一個數(shù)...
關(guān)聯(lián)分析概念: 關(guān)聯(lián)分析是一種在大規(guī)模數(shù)據(jù)集中尋找有趣關(guān)系的任務(wù);目標(biāo)是發(fā)現(xiàn)頻繁項集和發(fā)現(xiàn)關(guān)聯(lián)規(guī)則; 頻繁項集:是經(jīng)常出項在一塊的物品的集合; ...
原理 聚類是無監(jiān)督學(xué)習(xí),將相似的對象歸到同一個簇中,簇內(nèi)的對象越相似,聚類的效果越好; 首先,隨機確定K個初始點作為質(zhì)心; 然后,將數(shù)據(jù)集中的每...
原理: 將數(shù)據(jù)集切分成很多份易建模的數(shù)據(jù) 利用線性回歸技術(shù)建模 優(yōu)點 可以對復(fù)雜和非線性的數(shù)據(jù)建模 缺點 結(jié)果不易理解 適用數(shù)據(jù)類型 數(shù)值型和標(biāo)...
線性回歸 原理: 尋找一組最優(yōu)參數(shù)來擬合數(shù)據(jù) 優(yōu)點 結(jié)果易于理解,計算上不復(fù)雜 缺點 對非線性的數(shù)據(jù)擬合不好 適用數(shù)據(jù)類型 數(shù)值型和標(biāo)稱型數(shù)據(jù) ...
原理: 通過改變訓(xùn)練樣本的權(quán)重,學(xué)習(xí)多個分類器,并將這些分類器進行線性組合,提高分類的性能; bagging是通過隨機抽樣的替換方式,得到與原數(shù)...
天池o2o優(yōu)惠券使用預(yù)測比賽解析(初級) 賽題鏈接: 天池o2o優(yōu)惠券使用預(yù)測 加載數(shù)據(jù) 缺失值處理 統(tǒng)計 比賽的意義是把優(yōu)惠券給那要購買商品卻...