下載 tumblr 標(biāo)記為喜歡的內(nèi)容

源代碼發(fā)布在github : get_tumblr_likes

一、介紹

本項目使用 python 編寫,分析 tumblr 賬戶中喜歡的內(nèi)容,給出資源鏈接,并下載。
其中 test.json 是一份 tumblr 返回的喜歡數(shù)據(jù)的 json 示例,提取里面圖片和視頻的資源地址后下載,下載的內(nèi)容如下圖。

download_file.png

二、使用方法

  • 首先,你需要通過 tumblr API 來獲取賬戶喜歡內(nèi)容。這個過程是需要通過 OAuth 認(rèn)證的,具體可參看這個網(wǎng)頁

  • 得到認(rèn)證后可以通過腳本來獲取資源內(nèi)容,也可以通過這個網(wǎng)頁來查詢,結(jié)果會通過 json 的形式返回

  • 保存你得到的 json 數(shù)據(jù),命名為test.json,執(zhí)行命令 python json_parse.py,這可以從 json 文件中提取出資源的真正鏈接,并存為 url_list.txt 文件

    json_parse.png

  • 執(zhí)行 python download.py,之后資源文件就會挨個下載到 download 文件夾下
    downloading.png

三、其他

  • 由于眾所周知的原因,tumblr 的資源地址是不能直接下載的,因此需要設(shè)置代理。測試時使用 ssr 代理本地連接,因此 download.py 中有 PROXIES = { "http": "http://127.0.0.1:1080", "https": "https://127.0.0.1:1080" },如果是在可直接訪問 tumblr 的 VPS 上運(yùn)行,可對代碼做如下修改。

    # r = requests.get(url,proxies=PROXIES) # use proxy
    r = requests.get(url)             # directly access
    
  • 這個項目下載的是賬戶中的喜歡內(nèi)容,因此需要進(jìn)行認(rèn)證。如果是下載某個賬戶發(fā)布的內(nèi)容,可使用tumblr-crawler,再次感謝 tumblr-crawler 項目

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容