大綱:
python能做什么
一個(gè)爬蟲的實(shí)際案例
后續(xù)教程大綱
一、python能做什么




二、一個(gè)爬蟲的實(shí)際案例
總的來說python能做如下工作:爬蟲、數(shù)據(jù)分析、機(jī)器學(xué)習(xí)、web開發(fā)、自動(dòng)化腳本等等。
通過這次課程,我們重點(diǎn)學(xué)習(xí)爬蟲。
爬蟲的主要流程一般如下:
構(gòu)建/發(fā)送請(qǐng)求 -> 解析響應(yīng) -> 獲得數(shù)據(jù) -> 清洗數(shù)據(jù) -> 存儲(chǔ)數(shù)據(jù)
爬蟲常見問題:
1)違法問題
2)太頻繁爬會(huì)被封ip,或返回空數(shù)據(jù)/錯(cuò)誤數(shù)據(jù)
3)驗(yàn)證碼
4)網(wǎng)站結(jié)構(gòu)是否固定
三、后續(xù)教程大綱
1、最基礎(chǔ)的知識(shí):Python?基礎(chǔ)教程

附:如何學(xué)習(xí)Python,以及新手如何入門?
2、一些基礎(chǔ)python庫(kù):文件庫(kù),urllib庫(kù),html相關(guān)庫(kù),日期時(shí)間庫(kù),BeautifulSoup(bs4)、Xpath(lxml)
3、其他計(jì)算機(jī)知識(shí):
html+css
json,xml
正則表達(dá)式
mysql和對(duì)應(yīng)的數(shù)據(jù)庫(kù)工具
瀏覽器調(diào)試工具