- 以喜馬拉雅節(jié)目分類(lèi)為入口,分析網(wǎng)站結(jié)構(gòu)
首先爬取喜馬拉雅的所有分類(lèi)的鏈接和類(lèi)別名

左側(cè)分類(lèi)列表.png
- 獲取每個(gè)分類(lèi)的頁(yè)面后獲取每個(gè)分類(lèi)下面的所有節(jié)目的的相關(guān)內(nèi)容
每個(gè)類(lèi)別下面的所有節(jié)目.png
每個(gè)類(lèi)別的節(jié)目都是用分頁(yè)形式來(lái)展示,所有構(gòu)建頁(yè)碼,通過(guò)獲取每個(gè)分類(lèi)下最多分多少頁(yè),來(lái)構(gòu)建每個(gè)分頁(yè)面的的url鏈接,再通過(guò)鏈接地址獲取相應(yīng)分頁(yè)的頁(yè)面
分頁(yè)頁(yè)面url示例.png
- 獲取每個(gè)節(jié)目中的信息,例如音頻id

節(jié)目頁(yè)面.png

一個(gè)節(jié)目中的每期音頻的id.png

對(duì)比.png
未完。。。

