一、抓取詳細(xì)的職位描述信息
詳情頁(yè)分析
在詳情頁(yè)中,比較重要的就是職位描述和工作地址這兩個(gè)
由于在頁(yè)面代碼中崗位職責(zé)和任職要求是在一個(gè) div 中的,所以在抓的時(shí)候就不太好分,后續(xù)需要把這個(gè)連體嬰兒,分開(kāi)分析。
推薦下我自己創(chuàng)建的Python學(xué)習(xí)交流群960410445,這是Python學(xué)習(xí)交流的地方,不管你是小白還是大牛,小編都?xì)g迎,不定期分享干貨,包括我整理的一份適合零基礎(chǔ)學(xué)習(xí)Python的資料和入門(mén)教程。
爬蟲(chóng)用到的庫(kù)
使用的庫(kù)有:
requests
BeautifulSoup4
pymongo
Python 代碼
代碼 easy,初學(xué)者都能看懂。
二、數(shù)據(jù)清洗
校正發(fā)布日期
校正薪水以數(shù)字保存
根據(jù) 工作經(jīng)驗(yàn)?zāi)晗?劃分招聘等級(jí)