引言
最近在做一個(gè)項(xiàng)目,需要使用TensorRT去加速神經(jīng)網(wǎng)絡(luò)模型運(yùn)行。TensorRT支持FP16、 INT8等數(shù)據(jù)類(lèi)型, 在運(yùn)用后,發(fā)現(xiàn)模型推理速度大大提高,英偉達(dá)的TensorRT實(shí)在太強(qiáng)了。只可惜這個(gè)工具沒(méi)有開(kāi)源,不然真要好好研究。
由于我原本使用了PyTorch來(lái)訓(xùn)練我的模型, 而TensorRT無(wú)法直接加載PyTorch的模型,需要使用ONNX作為中間媒介。中間踩了些坑,不過(guò)后面都解決了。根據(jù)此寫(xiě)了個(gè)小教程,分享給大家
教程
代碼已經(jīng)上傳到GitHub啦,請(qǐng)移步傳送門(mén)
結(jié)語(yǔ)
聽(tīng)說(shuō)TensorRT已經(jīng)出INT4類(lèi)型的加速了,真是可怕,后續(xù)會(huì)跟進(jìn)的。
喜歡的話請(qǐng)加星點(diǎn)贊喲