模型壓縮(一)模型量化、剪枝,張量分解

https://jackgittes.github.io/2018/08/24/paper-reading-10/
https://zhuanlan.zhihu.com/p/36051603
https://zhuanlan.zhihu.com/p/57410790
https://www.sohu.com/a/232047203_473283

一、常見模型壓縮方法
1.蒸餾
2.量化
3.剪枝
4.低秩分解->張量分解
5.TS
二、模型量化
量化是指將信號(hào)的連續(xù)取值近似為有限多個(gè)離散值的過(guò)程??衫斫獬梢环N信息壓縮的方法。在計(jì)算機(jī)系統(tǒng)上考慮這個(gè)概念,一般用“低比特”來(lái)表示。也有人稱量化為“定點(diǎn)化”,但是嚴(yán)格來(lái)講所表示的范圍是縮小的。定點(diǎn)化特指scale為2的冪次的線性量化,是一種更加實(shí)用的量化方法。
(一)、Deep Compression


image.png

使用k-measn聚類,讓相近的數(shù)值聚類到同一個(gè)聚類中心,服用同一個(gè)數(shù)值,從而達(dá)到用更少的數(shù)值表示更多的數(shù)。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 模型壓縮和加速是兩個(gè)不同的話題,有時(shí)候壓縮并不一定能帶來(lái)加速的效果.壓縮重點(diǎn)在于較少網(wǎng)絡(luò)參數(shù)量,加速則側(cè)重在降低計(jì)...
    大圣神通閱讀 1,029評(píng)論 0 1
  • 1.研究背景 對(duì)模型預(yù)測(cè)精度無(wú)明顯影響 壓縮模型的參數(shù)數(shù)量、深度來(lái)降低模型空間復(fù)雜度全連接層參數(shù)多,模型大小由全連...
    愛吃西瓜的菜鳥閱讀 3,761評(píng)論 0 2
  • 原創(chuàng)聲明:本文為 SIGAI 原創(chuàng)文章,僅供個(gè)人學(xué)習(xí)使用,未經(jīng)允許,不能用于商業(yè)目的。 相關(guān)背景 為什么要對(duì)網(wǎng)絡(luò)進(jìn)...
    城市中迷途小書童閱讀 5,516評(píng)論 0 3
  • 網(wǎng)絡(luò)剪枝 剪枝目的在于找出網(wǎng)絡(luò)冗余連接并移除。由于全連接的連接冗余度遠(yuǎn)高于卷積層,傳統(tǒng)的剪枝多在全連接層對(duì)冗余神經(jīng)...
    趙小鬧鬧閱讀 4,524評(píng)論 0 0
  • 推薦指數(shù): 6.0 書籍主旨關(guān)鍵詞:特權(quán)、焦點(diǎn)、注意力、語(yǔ)言聯(lián)想、情景聯(lián)想 觀點(diǎn): 1.統(tǒng)計(jì)學(xué)現(xiàn)在叫數(shù)據(jù)分析,社會(huì)...
    Jenaral閱讀 6,038評(píng)論 0 5

友情鏈接更多精彩內(nèi)容