● v1.13.3 新版本發(fā)布 https://github.com/MegEngine/MegEngine/releases/tag/v1.13.3[https://git...
● v1.13.3 新版本發(fā)布 https://github.com/MegEngine/MegEngine/releases/tag/v1.13.3[https://git...
近日,MegEngine 在 v1.13.3 正式完成了與國內(nèi) AI 芯片獨角獸寒武紀旗下云端人工智能處理器芯片的兼容性適配。MegEngine 與 寒武紀目前完成了常見 c...
業(yè)務模型訓練中 Data 部分可能是瓶頸所在 在訓練業(yè)務模型過程中,如果我們發(fā)現(xiàn)模型的訓練速度不符合預期,往往會下意識地認為網(wǎng)絡本身出了問題。但實際上,大多數(shù)時候問題發(fā)生在模...
XLA(Accelerated Linear Algebra)是 Google 提出的一個神經(jīng)網(wǎng)絡編譯器,可以用于加速 AI 模型的訓練和推理。MegEngine 1.13....
MegEngine 開發(fā)者說」直播課程第二期火爆來襲!本期既有技術大佬帶來深度學習編譯器 MegCC 的詳細教程,又有實習經(jīng)歷豐富的在校同學分享 MegEngine 算子開發(fā)...
一個程序首先要保證正確性,在保證正確性的基礎上,性能也是一個重要的考量。要編寫高性能的程序,第一,必須選擇合適的算法和數(shù)據(jù)結構;第二,應該編寫編譯器能夠有效優(yōu)化以轉(zhuǎn)換成高效可...
v1.13.1 新版本發(fā)布[https://github.com/MegEngine/MegEngine/releases/tag/v1.13.0] MegCC 新版本發(fā)布[...
曠視開源的深度學習框架 MegEngine[https://github.com/MegEngine/MegEngine],MegEngine 是一個快速、可拓展、易于使用且...
在前面的文章[http://www.itdecent.cn/p/d2c5bdbfba67]中,我們簡單介紹了在 MegEngine imperative 中的各模塊以及它們...
在前面的文章[http://www.itdecent.cn/p/a155ef09e4f4]中,我們簡單介紹了在 MegEngine imperative 中的各模塊以及它們...
在前面的文章[http://www.itdecent.cn/p/eaa0074e0cd1]中,我們簡單介紹了在 MegEngine imperative 中的各模塊以及它們...
MegEngine[https://github.com/MegEngine] 作為一個訓推一體的 AI 框架,為用戶提供了模型訓練以及部署的能力。但是在部署模型時,由于會存...
在之前的文章[https://zhuanlan.zhihu.com/p/635504419]中我們介紹過 MegEngine 的 Imperative Runtime 以及它...
MegCC[https://github.com/MegEngine/MegCC] 是一個深度學習模型編譯器,具有以下特點: 極輕量級運行時:只在二進制文件中保留所需的計算內(nèi)...
當我們談論 MegEngine 時,我們在談論什么 眾所周知,開源深度學習框架曠視天元(MegEngine[https://github.com/MegEngine/MegE...
MegCC[https://github.com/MegEngine/MegCC] 是一個真真實實的深度學習模型編譯器,具備極其輕量的 Runtime 二進制體積,高性能,方...
前言 roofline 分析是一種簡單評估當前計算任務對當前平臺計算/訪存能力的利用情況的方法,可以幫助分析算子的優(yōu)化方向和優(yōu)化潛力。mperf[https://github...