4月份給自己挖一個(gè)爬蟲(chóng)系列的坑,主要涉及HTTP 協(xié)議、正則表達(dá)式、爬蟲(chóng)框架 Scrapy、消息隊(duì)列、數(shù)據(jù)庫(kù)等內(nèi)容。 爬蟲(chóng)的基本原理是模擬瀏覽器進(jìn)行 HTTP 請(qǐng)求,理解 H...
由于最近想做一個(gè)爬蟲(chóng),把爬回來(lái)的數(shù)據(jù)放到數(shù)據(jù)庫(kù)中??墒俏也欢?,MySQL。但由于未來(lái)工作很可能都是在Linux上做開(kāi)發(fā)。所以,從前天起我就先掉進(jìn)了Linux的坑。虛擬機(jī)上的c...