1.把前期做的代理池修改一下
(預(yù)計(jì)完成時(shí)間為0.75天)
修改主要有以下幾點(diǎn):
- 爬出來的數(shù)據(jù)在保存的時(shí)候?qū)懭胧裁磿r(shí)候保存(
存入日期) - 不要一連不上就拋棄,需要在在保存數(shù)據(jù)內(nèi)增加
失敗次數(shù),超過某個(gè)測(cè)試失敗次數(shù)的才拋棄,只要有一次鏈接成功則失敗次數(shù)歸0 - 看是否增加把更多的內(nèi)容放進(jìn)
配置文件
其中前期路徑如下:
拾肆-NodeJS簡(jiǎn)單代理池(起)
全球大型交友網(wǎng)站路徑
2.在騰訊云服務(wù)器上配置PM2
(預(yù)計(jì)完成時(shí)間為0.5天)
找 PM2 相關(guān)的操作信息,并在云服務(wù)器上設(shè)置該 NodeJS 項(xiàng)目管理。
配置好并測(cè)試。
3.找尋 Python 爬蟲相關(guān)包及方法
(預(yù)計(jì)完成時(shí)間為0.3天)
4.思考關(guān)鍵字輿情該怎么保存
(預(yù)計(jì)完成時(shí)間為0.5天)
嘗試給出流程圖,并按照寫出保存表格、字段等信息。
5.吃個(gè)好早餐
(預(yù)計(jì)完成時(shí)間為0.1天)