目前transformer從語(yǔ)言到視覺(jué)任務(wù)的挑戰(zhàn)主要是由于這兩個(gè)領(lǐng)域間的差異: 1、尺度變化大 2、高分辨率的輸入 為了解決以上兩點(diǎn),我們提出了層級(jí)Transformer,通...
目前transformer從語(yǔ)言到視覺(jué)任務(wù)的挑戰(zhàn)主要是由于這兩個(gè)領(lǐng)域間的差異: 1、尺度變化大 2、高分辨率的輸入 為了解決以上兩點(diǎn),我們提出了層級(jí)Transformer,通...
個(gè)人理解 1、為什么和其他anchor-based方法相比,小目標(biāo)檢測(cè)的表現(xiàn)差?可能有兩個(gè)原因: Encoder模塊中的Residual Blocks中的3x3依次使用dil...
個(gè)人感覺(jué)從理論上在實(shí)際場(chǎng)景下應(yīng)該很有效,在自己的數(shù)據(jù)集上使用也漲了2個(gè)點(diǎn)?,F(xiàn)實(shí)中標(biāo)注的數(shù)據(jù)大部分不確定性都很很強(qiáng)、場(chǎng)景也更復(fù)雜。引入Generalized Focal Los...
一、主要貢獻(xiàn) 作者以RetinaNet和FCOS為例,分析了anchor-based和anchor-free的性能差異的原因: 1、每個(gè)位置的anchor數(shù)量不同。retin...
個(gè)人看法 關(guān)于作者提出的norm-based的方法的依賴(lài)條件,我認(rèn)為通過(guò)簡(jiǎn)單的修改就能解決,并且在自己的yolov3的項(xiàng)目中也成功應(yīng)用,剪枝率大于90%。但是在Paddle ...
DeepSort學(xué)習(xí)筆記 deepsort作為多目標(biāo)跟蹤的經(jīng)典算法,相信每個(gè)入門(mén)MOT領(lǐng)域的人都是從deepsort開(kāi)始,網(wǎng)上有大量的學(xué)習(xí)教程,但是相比別人喂我還是更喜歡自己...
個(gè)人理解 針對(duì)作者的幾點(diǎn)結(jié)論的個(gè)人理解,感覺(jué)根本原因并不是在anchor based和anchor free的方法上,個(gè)人認(rèn)為,造成結(jié)果不同的主要差異就是在訓(xùn)練reid網(wǎng)絡(luò)的...
基于TPS的STN模塊-Robust Scene Text Recognition with Automatic Rectification TPS:薄板樣條插值(Thin ...
DBNet 簡(jiǎn)介 由于分割網(wǎng)絡(luò)的結(jié)果可以準(zhǔn)確描述諸如扭曲文本的場(chǎng)景,因而基于分割的自然場(chǎng)景文本檢測(cè)方法變得流行起來(lái)。基于分割的方法其中關(guān)鍵的步驟是其后處理部分,這步中將分割的...
論文鏈接 代碼鏈接 先盜一張大佬總結(jié)的圖: 個(gè)人如何看待yolov4 Yolov4的作者在論文中通篇都在強(qiáng)調(diào)其實(shí)用性,它并不是一篇面向?qū)W術(shù)界的paper,從學(xué)術(shù)角度看待它確實(shí)...
Macos通過(guò)SSH連接顯示docker容器的GUI界面 服務(wù)器沒(méi)有g(shù)ui界面,但是項(xiàng)目中需要接實(shí)時(shí)視頻流進(jìn)行可視化。所以只能遠(yuǎn)程連接通過(guò)X11進(jìn)行轉(zhuǎn)發(fā)到本機(jī)可視化。 一、配...
YOLOV3剪枝 論文:Network Slimming-Learning Efficient Convolutional Networks through Network ...
這里直接貼一個(gè)知乎鏈接,可以說(shuō)講得很好了https://zhuanlan.zhihu.com/p/80594704 在單階段的目標(biāo)檢測(cè)任務(wù)中,由于前景和背景不平衡的問(wèn)題導(dǎo)致效...
Github:FCOS 摘要 提出了一種全卷積的one-stage目標(biāo)檢測(cè)方法,以逐像素點(diǎn)的方式解決目標(biāo)檢測(cè)問(wèn)題,類(lèi)似于語(yǔ)義分割。FCOS是anchor free的方法,F(xiàn)C...
一、簡(jiǎn)介 解決擁堵場(chǎng)景的的人群計(jì)數(shù)方法從簡(jiǎn)單的人群統(tǒng)計(jì)(僅輸出目標(biāo)圖像的人數(shù))到以輸出密度圖(顯示人群分布特征)作為結(jié)果。這種發(fā)展趨勢(shì)是為了滿(mǎn)足更多場(chǎng)景下的需求,因?yàn)橥瑯訑?shù)量...
confidence loss部分已經(jīng)改正確了
目標(biāo)檢測(cè)之YOLOv2,最詳細(xì)的代碼解析一、前言 最近一直在研究深度學(xué)習(xí)在目標(biāo)檢測(cè)的應(yīng)用,看完了YOLOv2的paper和YAD2K的實(shí)現(xiàn)源碼,來(lái)總結(jié)一下自己的收獲,以便于加深理解。 二、關(guān)于目標(biāo)檢測(cè) 目標(biāo)檢測(cè)可簡(jiǎn)...
前言 自己很早就看到過(guò)這篇論文了,論文中的工作和我的一個(gè)項(xiàng)目也是有很多共通之處,但是自己實(shí)力不夠也沒(méi)有想法去把它們?nèi)靠偨Y(jié)下來(lái),只能在此膜拜一下大佬。 涉及到的方法總覽 Tr...
一、參賽背景 一條通信專(zhuān)業(yè)的閑魚(yú)突然對(duì)AI產(chǎn)生了濃厚的興趣,天天看著各種新聞報(bào)導(dǎo)AI相關(guān)的東西,只是知道它的相關(guān)應(yīng)用,但具體是怎么回事一直困擾著我,求知欲迫使自己開(kāi)始了這段艱...