(三)爬蟲-入門

心理學專業(yè)的人學習爬蟲有很多困難,但是還是一點點艱難地學習,記錄下自己的學習成果。


學習爬蟲的目的:

(1)????獲得相應的資料,可以方便爬取文章、書籍、圖片、量表,由于研究的原因經(jīng)常去一些論壇,也可以批量獲取論壇的文字、圖片、視頻信息。

(2)????熟悉python的語法。

(3)????熟悉后端的一些結構。


相關工具以及版本:

(1)?python 3.6.3 Anaconda

(2)????requests庫。發(fā)送http請求

(3)????BeautifulSoup 4.4。解析代碼,能夠得到一個BeautifulSoup?的對象,并能按照標準的縮進格式的結構輸出。

(4)????操作系統(tǒng):macOS 10.14


例子:爬取https://ibaotu.com/ui/15-91803-0-0-0-1.html的ui設計圖片。


截圖


結果

注:

1.????類似該例子的方法適合爬取html的內(nèi)容,并且是在網(wǎng)頁上直接呈現(xiàn)的內(nèi)容。

2.????不能獲取還沒有下拉加載的內(nèi)容。

3.?Requests的get請求使用了headers參數(shù),這個是用來模擬瀏覽器的。Chrome瀏覽器,按F12,刷新,network-request hearders-user agent。

最后編輯于
?著作權歸作者所有,轉載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內(nèi)容