tensorflow集成tensorRT及原理分析

版本號:cuda-10.0 && cudnn7.3 && tensorflow 1.13 && tensorRT5.0.2.6 && ?T4 GPU

使用:在tensorflow里graph換成tensorRT返回的graph。

tf.import_graph_def(self.convFP16Graph(output_graph_def), name="")

def convFP16Graph(self, inGraph):

? ? ? ? return self.convRTGraph("FP16", inGraph)


Create_inference_graph 函數將凍結住的 TensorFlow 圖作為輸入,返回一個經過 TensorRT 節(jié)點優(yōu)化過的圖。我們看看這個函數的參數:

Input_graph_def:凍結住的 TensorFlow 圖

Outputs:輸出節(jié)點名字的字符串列表,比如:[“resnet_v1_50/predictions/Resape_1”]

Max_batch_size:整數,輸入的 batch size,比如,16

Max_workspace_size_bytes:整數,能分配給 TensorRT 的最大 GPU 顯存大小

Precision_mode:字符串,可選的值為「FP32」, 「FP16」, 「INT8」


報錯W tensorflow/contrib/tensorrt/convert/convert_nodes.cc:3710] Validation failed for TensorRTInputPH_0 and input slot 0: Input tensor with shape [?,?,?,2048] has an unknown non-batch dimension at dim 1

在Create_inference_graph里面加上參數,is_dynamic_op=True 。ok

原理分析:

在使用的過程中,log里能明顯看出將nodes和edgs變少了很多。附上鏈接:https://docs.nvidia.com/deeplearning/sdk/tensorrt-developer-guide/index.html

構建階段在圖層圖上執(zhí)行以下優(yōu)化:

1.Elimination of layers whose outputs are not used:消除未使用輸出的層

2.Fusion of convolution, bias and ReLU operations:融合conv || bias || Relu 操作

3.Aggregation of operations with sufficiently similar parameters and the same source tensor:

聚合相似或相同參數的向量。(for example, the 1x1 convolutions in GoogleNet v5’s inception module)、

4.Merging of concatenation layers by directing layer outputs to the correct eventual destination.

通過輸出合并鏈接層

?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 該文章為轉載文章,作者簡介:汪劍,現(xiàn)在在出門問問負責推薦與個性化。曾在微軟雅虎工作,從事過搜索和推薦相關工作。 T...
    名字真的不重要閱讀 5,551評論 0 3
  • 新書訊——長江文藝出版社重點推介 長篇小說 《雙鳳記》 作者:長江文藝出版社 《雙鳳記》是繼《白鹿原》之后又一部書...
    流云滿樹閱讀 1,440評論 1 1
  • 清晨天空飄著零星的雪花, 地面上鋪了一層薄薄的柳絮。 注定是驗證未經嚴寒怎能體會到溫暖, 中午陽光沖出云霄把燦爛的...
    阿山老師閱讀 702評論 0 0
  • 我所有奔跑的行裝 并不想將它們早早地收藏 我所有還存留的夢想 并不想將它們圍上城墻 奔跑的路上 道阻且長 就算是最...
    風吹雨落田閱讀 196評論 0 0
  • 都說感情的世界——認真,你就輸了;但寫作的世界——點評,你就賺了。點評,可以提高你的總結能力、思考能力、分析能力、...
    蝸牛筆耕閱讀 180評論 0 0

友情鏈接更多精彩內容