飛槳x昇騰生態(tài)適配方案:00_整體方案介紹

前言

  • 本文重點(diǎn)介紹Paddle與NPU的適配工作,PaddlePaddle是一個(gè)深度學(xué)習(xí)框架,類似于pytorch;PaddleCustomDeviece是適配層代碼,類似于pytorch adapter;模型側(cè)代碼根據(jù)領(lǐng)域分為PaddleNLP、PaddleMix、PaddleClas、PaddleOCR等。
  • 如果需要運(yùn)行在線的訓(xùn)練或者推理,可以直接參考模型倉(cāng)的README,并更改deviece為NPU即可。當(dāng)前已經(jīng)支持了大部分主流模型且在持續(xù)增加中,具體的模型列表可參照飛槳-昇騰模型支持列表,大部分模型的性能基本持平V100,少部分專項(xiàng)調(diào)優(yōu)模型可以達(dá)到0.8*A800(主要是大模型,多模態(tài))。
  • 如果在線推理性能較差且只需要推理的場(chǎng)景,統(tǒng)一建議使用離線場(chǎng)景,Paddle2ONNX工具轉(zhuǎn)化為ONNX,并使用atc轉(zhuǎn)換為OM,具體可參照Paddle轉(zhuǎn)OM以及離線推理章節(jié)內(nèi)容。

硬件適配說明

  • 當(dāng)前的適配工作主要針對(duì)A2芯片,以下所有內(nèi)容如果沒有特殊說明都只針對(duì)A2芯片;
  • A1芯片在大部分情況下沒有問題,且使用方式與A2相同,如遇到類似項(xiàng)目可自行使用相同方式進(jìn)行驗(yàn)證,遇到問題單點(diǎn)支撐;
  • 310系列芯片沒有進(jìn)行過適配,建議直接走離線推理路徑。

常用Paddle模型倉(cāng)

整體方案導(dǎo)覽

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容