大師兄的數(shù)據(jù)分析學習筆記(三十一):機器學習模型總結(jié)

大師兄的數(shù)據(jù)分析學習筆記(三十):半監(jiān)督學習
大師兄的數(shù)據(jù)分析學習筆記(三十二):模型評估(一)

一、分類模型

二、回歸模型

三、聚類

四、關聯(lián)

五、半監(jiān)督學習

六、模型的選擇

  • 在當前的環(huán)境下,靠一種模型解決所有問題不現(xiàn)實,所以面對不同的情況,需要選擇不同的算法模型。


  • 根據(jù)上圖可以看出SKLEAN官網(wǎng)建議如下:
  • 樣本<50:獲得更多數(shù)據(jù)
  • 如果有標簽化的數(shù)據(jù)
  • 樣本<100k:使用線性的支持向量機
  • 如果線性的支持向量機不工作:
  • 如果是文本數(shù)據(jù):使用樸素貝葉斯
  • 如果不是文本數(shù)據(jù):使用KNN
  • 如果KNN不工作:使用集成支持向量機
  • 樣本>100k:使用梯度下降法
  • 如果梯度下降法不工作:使用kernel approximation
  • 如果沒有標簽化數(shù)據(jù)類型的數(shù)量已知:
  • 樣本<10k:使用K-means
  • 如果K-means不工作:使用層次聚類GMM
  • 向本>10k: 使用MiniBatch Kmeans
  • 如果沒有標簽化數(shù)據(jù)類型的數(shù)量未知:
  • 樣本<10k:使用MeanShiftVBGMM
  • 樣本>10k:靠運氣
  • 如果預測的不是類別,而是連續(xù)數(shù)值:
  • 樣本<100k:
  • 少量重要特征:使用LassoElasticNet
  • 非少量重要特征:使用嶺回歸SVR
  • 如果嶺回歸SVR不工作,使用和函數(shù)更復雜的SVR集成算法
  • 如果預測的不是類別、也不是連續(xù)值:
  • 使用降維方式
  • 如果降維方式不工作:
  • 樣本<10k:使用Isomapspectral Embedding
  • 如果Isomapspectral Embedding不工作:使用LLE
  • 樣本>10k:使用kernel approximation
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容