Transformer 是 Google 團隊在 17 年 6 月提出的 NLP 經(jīng)典之作,由 Ashish Vaswani 等人在 2017 年發(fā)表的論文 Attentio...
Transformer 是 Google 團隊在 17 年 6 月提出的 NLP 經(jīng)典之作,由 Ashish Vaswani 等人在 2017 年發(fā)表的論文 Attentio...
Romero, A.; Ballas, N.; Kahou, S. E.; Chassang, A.; Gatta, C.; and Bengio, Y. 2015. Fit...
單階段 Zhang, Shifeng, Xiangyu Zhu, Zhen Lei, Hailin Shi, Xiaobo Wang, and Stan Z. Li. 201...
@67b57286b3ce 不了解,估計沒
IncepText: A New Inception-Text Module with Deformable PSROI Pooling for Multi-Oriented Scene Tex...阿里巴巴公司的工作。在FCIS的基礎(chǔ)上,繼續(xù)水。主要貢獻(xiàn): Deformable PSROIpooling。 Inception 中引入Deformable結(jié)構(gòu)。(大預(yù)測頭,...
Cython第二章,編譯和運行cython 編譯Pipeline 由于cython是python的超集,因此python解釋器不能直接解釋cython的代碼,通過cython...
本文依舊是曠視科技的作品,曠視的工作一直緊貼實際,直面問題和方法的靈魂。 本文解決的是Anchor的設(shè)置策略不好把握的問題。YOLOv2的指導(dǎo)策略是Anchor與目標(biāo)的的IO...
很簡單樸素卻抓住了問題本質(zhì)的思路。牢牢把握住用分割的方法來做文本檢測這一捷徑,并針對文本毗鄰時的單例分割做不好的問題,提出從文本中心開始,擴散到整個文本,分步完成預(yù)測的方法。...
比如單精度浮點數(shù)(32位),階碼8位,尾數(shù)那就是24位咯(尾數(shù)中內(nèi)含一位符號位); 比如雙精度浮點數(shù)(64位),階碼11位,尾數(shù)那就是53位(一樣)。 浮點型變量在計算機內(nèi)存...
本文提出了CTW-1500 數(shù)據(jù)集,并提出了CTD+TLOC彎曲文字檢測算法。 方法是,在proposal基礎(chǔ)上預(yù)測14個文字關(guān)鍵點。采用的方法基本就是faster rcnn...
數(shù)據(jù)擴增方面:FOTS: 在synth800k 訓(xùn)練+MLT 訓(xùn)練+驗證集上預(yù)訓(xùn)練,然后再繼續(xù)finetune。旋轉(zhuǎn)-10~10度數(shù)據(jù)擴增。 多尺度測試方面:FOTS:短邊1...
阿里巴巴公司的工作。在FCIS的基礎(chǔ)上,繼續(xù)水。主要貢獻(xiàn): Deformable PSROIpooling。 Inception 中引入Deformable結(jié)構(gòu)。(大預(yù)測頭,...
近期計劃對Faster RCNN、SSD的一系列trick進(jìn)行總結(jié)。主要分為:框架結(jié)構(gòu)上面的trick、參數(shù)設(shè)置上的trick、在文字檢測特定領(lǐng)域的trick。 首先,是對F...
貢獻(xiàn): 基于FPN+RFCN。 用EAST來替換RPN,并提出scale-friendly 的尺度匹配策略。 尺度分配時,將短邊的寬度作為分配的指標(biāo)。 采用了Light-he...
打開.dot文件并畫圖的方法: dot -Tps filename.dot -o outfile.ps dot -Tpdf filename.dot -o outfile.pdf
簡單概括: 本文貢獻(xiàn): 1. 提出了一個針對文本檢測和識別任務(wù)的數(shù)據(jù)擴增方法。該方法合成的圖片相當(dāng)真實,可以以假亂真,極大提高了準(zhǔn)確率。其他任務(wù)可以借鑒。 2. 借鑒YOLO...
作者:采石工 鏈接:https://www.zhihu.com/question/49571479/answer/116840869 來源:知乎 著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請...