具體參考博文http://bigdata.51cto.com/art/201610/519753.htm?utm_source=tuicool&utm_medium=referral,寫得非常棒,而且列出了相關優(yōu)秀博客。
目的:提升性能=提高模型的準確率。
四種方式:
1.從數(shù)據(jù)上提升性能
2.從算法上提升性能
3.從算法調(diào)優(yōu)上提升性能
4.從模型融合上提升性能
性能提升的力度按上表的順序從上到下依次遞減。舉個例子,新的建模方法或者更多的數(shù)據(jù)帶來的效果提升往往好于調(diào)出最優(yōu)的參數(shù)。
(一)從數(shù)據(jù)上提升性能
1)收集更多的數(shù)據(jù)

2)產(chǎn)生更多的數(shù)據(jù)
深度學習算法往往在數(shù)據(jù)量大的時候效果好。由于某些原因你得不到更多的數(shù)據(jù),也可以制造一些數(shù)據(jù)。
如果你的數(shù)據(jù)是數(shù)值型的向量,那么隨機生成已有向量的變形向量。
如果你的數(shù)據(jù)是圖像,用已有的圖像隨機生成相似圖像。
如果你的數(shù)據(jù)是文本,做法你懂。
這類做法通常被稱為數(shù)據(jù)擴展或是數(shù)據(jù)生成。
3)對數(shù)據(jù)做縮放
4)對數(shù)據(jù)做變換
5)特征選擇
6)重新定義問題
(二)從算法上提升性能
1) 算法的篩選
2)從文獻中學習
3)重采樣的方法
(三)從算法調(diào)優(yōu)上提升性能
1)模型可診斷性
2)權重的初始化
3)學習率
4)激活函數(shù)
5)網(wǎng)絡結構
6)batch和epoch
7)正則項
8)優(yōu)化目標
9)提早結束訓練