python爬取拉勾網(wǎng)招聘數(shù)據(jù)

又一年的畢業(yè)季來臨了,一大波大學生加入了找工作的大軍,給這些新加入職場的學生們提供寶貴的招聘的信息,通過python爬取拉勾網(wǎng)的招聘的數(shù)據(jù)。

拉勾網(wǎng)的鏈接是https://www.lagou.com/,先爬取各崗位的鏈接地址,例如java崗位

找到html代碼的標簽的位置

獲取不同崗位的具體代碼:

接下來獲取JAVA等崗位的具體信息,具體獲取崗位名稱,公司名稱,薪水,地區(qū),公司類型這幾個主要的信息。

找到具體想要獲取信息的html標簽的位置

獲取java等不同崗位的具體信息的代碼:

完整代碼貼在下面,采用了BeautifulSoup這個包:


最終爬取的數(shù)據(jù)存儲到excel中了,效果是:

后續(xù)將對數(shù)據(jù)進行分析,統(tǒng)計不同地區(qū)的薪水等……

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

友情鏈接更多精彩內容