想要訓練一個好用的機器學習模型該怎么辦?標注數(shù)據去吧!
是呀,數(shù)據不行,模型怎么能行?可是面對成千上萬的數(shù)據只能看模型而嘆氣了。
有錢一起花,有數(shù)據當然一起標了,趕緊做一個簡單的數(shù)據標注系統(tǒng),發(fā)動組里的人一起標數(shù)據吧!
基本構造

在這里插入圖片描述
還是傳統(tǒng)的構造方法,有顯示,有控制,還有數(shù)據庫
前端頁面
用于展現(xiàn)你要標注的數(shù)據,提交標注的結果(是,否,疑惑)的按鈕,標注規(guī)則
后端控制
處理前端的標注結果并讓前端發(fā)過去需要標注的數(shù)據
數(shù)據庫
存放這要標記的數(shù)據,并且有這條數(shù)據的id 號,數(shù)據內容,標注結果,標注狀態(tài)
實現(xiàn)工具
- 前端:HTML, jQuery,bootstrap
- 后端 : python flask
- 數(shù)據庫:mysql
前端基本樣式:
在這里插入圖片描述
主要寫的內容就是js
首先在加載的頁面的時候需要讓后臺訪問一次數(shù)據庫,并把需要標注的數(shù)據返回
點擊對應的按鈕,給后臺發(fā)送對應的數(shù)據,然后后臺根據前端的指示進行數(shù)據庫的操作并返回數(shù)據
后臺的功能主要有兩個
- 1 用于頁面初始化的查詢操作
- 2 用于點擊按鈕的處理操作
查詢操作是數(shù)據庫的select操作,而處理操作就是先把前端做的處理對數(shù)據庫進行更新,然后查詢一條沒有標注的數(shù)據進行返回。
數(shù)據庫的設計只需要有一個id主鍵,數(shù)據內容,標注的結果,還有對應的標注狀態(tài)這么幾條。
開始標注數(shù)據吧!
實現(xiàn)快,療效好,這里就不放代碼了。如果有人感興趣可以留言,我給你們進行單獨的介紹