【論文筆記】Bag of Tricks for Image Classification with Convolution Neutral Networks

URL:
https://arxiv.org/pdf/1812.01187.pdf

TL;DR

一系列的訓練tricks。large batch、Low-precision、Label Smoothing、Cosine Learning Rate Decay、Knowledge Distillation和Mixup Training等。


方法

方法沒什么具體可講解的,主要是介紹了上述一系列的訓練tricks。

加trick vs 不加trick的實驗。

加trick vs 不加trick的實驗

各個trick帶來的影響。有些奇怪的是batchsize變大時掉點,而低精度訓練卻漲點。


各個trick帶來的影響

第二批tricks帶來的影響?;臼蔷兴鶟q點。但蒸餾和mixup的混用在不同模型上效果不同。


第二批tricks帶來的影響

這些trick不僅對識別任務有效,部分trick在檢測、分割等任務上也有效。但并不是所有trick都有效,具體可以看論文中的實驗。

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容