目錄:
- 1. 圖片預(yù)處理
- 2. RPN網(wǎng)絡(luò)預(yù)測
- 3. RPN to ROIs
- 4. Classifier 網(wǎng)絡(luò)預(yù)測
- 5. Classifier網(wǎng)絡(luò)輸出對 ROIs過濾與修正
- 6. NMS (非最大值抑制)
7. 坐標轉(zhuǎn)換為原始圖片維度
一: 輸入輸出
輸入:
- boxes_on_resize: 最終提取出來的bbox,是在VGG16 輸入圖片維度上的坐標
- ratio: 原始圖片與VGG16 輸入圖片的比例關(guān)系
輸出:
- boxes_on_origin: 原圖上的矩形框.
二: 流程
- 坐標除以ratio
三: code by code
ratio是 resize 圖片size / 原始圖片size
將 VGG16 輸入圖片維度上的坐標 轉(zhuǎn)換為原始圖片維度上.
private INDArray get_real_coordinates(INDArray bboxes_on_resize, float ratio)
{
assert bboxes_on_resize.rank() == 2;
assert bboxes_on_resize.shape()[1] == 4;
return Transforms.round(bboxes_on_resize.castTo(DataType.FLOAT).div(ratio));
}