驚嘆!還可以這樣爬取豆瓣電影

上一篇寫了使用excel爬取足彩賠率數(shù)據(jù),用到的公式=Web.Page(Web.Contents(URL))?,F(xiàn)在大多數(shù)網(wǎng)站是Javascript進行數(shù)據(jù)傳遞,這里教大家如何抓取豆瓣電影的數(shù)據(jù),這次用到的公式是=Json.Document(Web.Contents(URL))



首先獲取數(shù)據(jù)源的網(wǎng)址

Step1:你先使用谷歌瀏覽器(或者使用谷歌內(nèi)核的瀏覽器也可以),進入豆瓣網(wǎng)站,用f12呼出開發(fā)者工具,進入network選擇XHR標(biāo)簽。

Step2:顯示一些網(wǎng)址,點擊查看每個網(wǎng)址,看里面的數(shù)據(jù)哪個是展示我們想要的



Step3:點擊頁面加載更多,尋找加載數(shù)據(jù)的網(wǎng)址并發(fā)現(xiàn)規(guī)律



接下來我們對數(shù)據(jù)抓取并處理:

Step1:我們打開一個excel,在excel里面創(chuàng)建列,然后建立查詢數(shù)據(jù)表。



Step2:把查詢表中的列設(shè)置為文本格式



Step3:添加列選項卡中自定義列,并添加相關(guān)公式





這次使用到的公式:=Json.Document(Web.Contents(URL))

Step4:勾選需要展示的數(shù)據(jù)





Step5:選擇關(guān)閉并上傳數(shù)據(jù)上傳完成了,就這么簡單。



整個豆瓣電影數(shù)據(jù)抓取導(dǎo)入完成,如果教程中哪些不懂歡迎在評論進行回復(fù)。


? ? ? ? ? ? ? ? ? ?

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,569評論 19 139
  • 上一篇講了如何使用excel一鍵爬蟲使用功能,有同學(xué)在評論里面問如何抓足彩相關(guān)數(shù)據(jù),這次給大家講解一下哈。 這次我...
    幸福的耗子閱讀 10,241評論 1 4
  • 這兩天摸索了下scrapy,剛看文檔的時候覺得有點生無可戀,scrapy框架個人還是覺得比較難懂的,需要學(xué)習(xí)的地方...
    Treehl閱讀 5,844評論 7 10
  • 今日感恩: 1.感恩今天發(fā)現(xiàn)衣柜因上次家里跑水而受潮,霉味散發(fā),利用周末得以徹底清理底層。包包,衣物,整個收拾整理...
    露穎_閱讀 231評論 0 0
  • 相信很多小伙伴們跟我一樣,期待著歡樂五美的回歸。經(jīng)過漫長的等待,終于等到你,《歡樂頌2》! 第一部結(jié)尾的時候,過年...
    慢慢又慢慢閱讀 219評論 0 1

友情鏈接更多精彩內(nèi)容