為了做到更優(yōu)雅,這次拋棄了urllib庫的引用,使用requests和beautifulsoup搭配的方式進行
首先構建一個請求并且響應它

構建請求
然后呢到簡書上找一篇文章試試手,看一下網頁源碼找到文章的div

找到標題
以及找到文章內容,仔細看看內容還挺不錯哈哈

內容
可以發(fā)現(xiàn)所有的內容都在p標簽里面,那么接下來就簡單多了只需要

f5運行一下

最后使用codecs庫來進行文件操作將文章保存到本地

沒錯使用上requests和bs4之后爬取文章的工作是那么的輕松呢

效果圖