前置知識和要求:
- Python基本語法,程序邏輯基礎(chǔ)完成
- 了解HTML
- 正則表達(dá)式
推薦視頻:Python開發(fā)簡單爬蟲
視頻介紹了完整的爬蟲流程:URL管理,網(wǎng)頁下載,頁面解析。
正則表達(dá)式30分鐘入門教程 (這篇內(nèi)容比較多,全面)
010 - 使用BeautifulSoup和XPath抓取結(jié)構(gòu)化數(shù)據(jù)
正則表達(dá)式在線測試工具:http://tool.oschina.net/regex/
開始你的第一個(gè)爬蟲程序~