上了一個(gè)Python網(wǎng)絡(luò)爬蟲的課,學(xué)的七葷八素,暈頭暈?zāi)X。在這里整理一下大致的學(xué)習(xí)路線,待以后有需要的時(shí)候回來繼續(xù)學(xué)習(xí)。
Python自帶的網(wǎng)絡(luò)解析庫(kù)urllib
升級(jí)版的解析庫(kù)requests
正則表達(dá)式
Beautiful Soup
爬蟲框架scrapy
xpath和css選擇器的使用
動(dòng)態(tài)網(wǎng)頁(yè)解析selenium和PhantomJS