2019-01-31 上限分析(ceiling analysis)

上限分析通常能提供一種很有價值的信號或者說很有用的導向告訴你流水線中的哪個部分最值得你花時間。

舉例:數(shù)值評價量度,字符準確度,圖像中的文字識別正確的比例

上限分析的主要思想:

首先關注這個機器學習流程中的第一個模塊文字檢測,歷每個測試集樣本,然后人為地告訴算法每一個測試樣本中什么地方出現(xiàn)了文字,即100%正確地檢測出圖片中的文字信息。然后繼續(xù)運行完接下來的幾個模塊,也就是字符分割和字符識別,然后使用跟之前一樣的評價量度指標來測量整個系統(tǒng)的總體準確度。假如準確定提升,則改進文字檢測有機會可以整體提高系統(tǒng)的準確性。用標準的文字檢測結(jié)果,同時用標準的字符分割結(jié)果,遍歷測試樣本得到準確率。

上限分析

進行上限分析的一個好處是知道了如果對每一個模塊進行改善 它們各自的上升空間是多大。

如果我們擁有完美的文字檢測模塊,那么整個系統(tǒng)的表現(xiàn)將會從準確率72%上升到89%,因此效果的增益是17%。這就意味著如果你在現(xiàn)有系統(tǒng)的基礎上花費時間和精力改善文字檢測模塊的效果,那么系統(tǒng)的表現(xiàn)可能會提高17%看起來這還挺值得。但是系統(tǒng)表現(xiàn)只提升了1%,這便提供了一個很重要的信息告訴我們不管我們投入多大精力在字符分割上,系統(tǒng)效果的潛在上升空間也都是很小很小。

示例
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • ORA-00001: 違反唯一約束條件 (.) 錯誤說明:當在唯一索引所對應的列上鍵入重復值時,會觸發(fā)此異常。 O...
    我想起個好名字閱讀 5,985評論 0 9
  • 北京時間6月14日23時,2018年世界杯揭幕戰(zhàn)在莫斯科盧日尼基體育場舉行,東道主俄羅斯迎戰(zhàn)沙特阿拉伯。上半...
    一念唯歌閱讀 844評論 7 23
  • ①中島衛(wèi)生巾區(qū) 圖1總體陳列包裝雜亂,高低不平,不符合品牌與店鋪形象。 圖2、3重新組合和擺放這樣不但整齊,也給顧...
    卓林林閱讀 636評論 0 0
  • 隨著自己心意,每天一篇,回頭看看,應該會不錯。
    影瓊gege閱讀 285評論 0 0

友情鏈接更多精彩內(nèi)容