1. Abstract
單機多核并行,near-linear speedup
2. Intro
- L1 regularization適合sparse高維大數(shù)據(jù)
- CD: 本文稱為Shooting,每輪迭代只更新一個坐標
- 并行SGD:單機多核 and 分布式,切分samples,但是L1應(yīng)用一般feature比sample數(shù)量多,因此切分數(shù)據(jù)不合適
- 因此選用一種相反的方式,切分features,并行化L1-regularized CD
- Shotgun:多核算法,讓P個維度并行地更新
- 證明了Shotgun的convergence bound,near-linear in P,同時提供了P的最佳的估計
3. Parallel CD
- 從所有weights中平均地選擇P個weights,然后用同樣的更新規(guī)則更新它們
- 并行地更新可能增加divergence的風險。如果features不相關(guān),那么并行更新會加快收斂;如果features相關(guān),那么并行更新就可能會增加objective value
4. Experiment
- Shotgun的實現(xiàn):pathwise 優(yōu)化方法;atomic compare-and-swap opearation
- 對LR,比較Shotgun和SGD variants
- Shotgun CDN(Coordinate Descent Newton)的實現(xiàn):使用backtrack line-search策略尋找step size
- SGD適合大數(shù)據(jù)(large n),Shotgun適合大維度(large d)