Shotgun: Parallel CD for L1-LR

1. Abstract

單機多核并行,near-linear speedup

2. Intro

  • L1 regularization適合sparse高維大數(shù)據(jù)
  • CD: 本文稱為Shooting,每輪迭代只更新一個坐標
  • 并行SGD:單機多核 and 分布式,切分samples,但是L1應(yīng)用一般feature比sample數(shù)量多,因此切分數(shù)據(jù)不合適
  • 因此選用一種相反的方式,切分features,并行化L1-regularized CD
  • Shotgun:多核算法,讓P個維度并行地更新
  • 證明了Shotgun的convergence bound,near-linear in P,同時提供了P的最佳的估計

3. Parallel CD

  • 從所有weights中平均地選擇P個weights,然后用同樣的更新規(guī)則更新它們
  • 并行地更新可能增加divergence的風險。如果features不相關(guān),那么并行更新會加快收斂;如果features相關(guān),那么并行更新就可能會增加objective value

4. Experiment

  • Shotgun的實現(xiàn):pathwise 優(yōu)化方法;atomic compare-and-swap opearation
  • 對LR,比較Shotgun和SGD variants
  • Shotgun CDN(Coordinate Descent Newton)的實現(xiàn):使用backtrack line-search策略尋找step size
  • SGD適合大數(shù)據(jù)(large n),Shotgun適合大維度(large d)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容