Instruction
1、用scrapy框架編寫,抓取試卷及試題
2、相關(guān)模塊
BeautifulSoup4、Pillow、lxml、baidu-aip...
3、圖片下載,圖片文字識(shí)別
4、MySQL、Redis、MongoDB數(shù)據(jù)庫存儲(chǔ)
5、多管道處理
Usage
1、切換到工作目錄
cd zujuan
2、運(yùn)行spider
scrapy crawl `spiderName`

papers

exercises