scrapy 頭像圖像的爬取

練習(四)

目標抓取

  1. 抓取用戶頭像圖片

圖像處理支持

官方推薦使用Pillow替代PIL

#安裝pillow
pip install Pillow

新建一個spider用于爬取用戶頭像

scrapy genspider head segmentfault.com

修改保存圖像配置

ITEM_PIPELINES = {
    'scrapy.pipelines.images.ImagesPipeline': 300 #圖片處理Pipeline
}

#圖片保存位置
IMAGES_STORE = 'E:\\coding\\segmentfault\\head image'


#下面是可選設置
# 30天圖像過期時間
IMAGES_EXPIRES = 30

#縮率圖設置
IMAGES_THUMBS = {
    'small': (50, 50),
    'big': (270, 270),
}

#過濾圖片最小寬(高)度
IMAGES_MIN_HEIGHT = 110
IMAGES_MIN_WIDTH = 110

修改parse方法

    def parse(self, response):
        images = response.css('img.program-avatar64') #提取所有圖片元素
        for img in images:
            #image_urls屬性為默認屬性用于收集圖片地址集合,可以是item的字段也可以是dict的關鍵字
            yield {"image_urls" : img.css("::attr(src)").extract()}

執(zhí)行后我們可以在我們配置的圖像保存目錄(E:\coding\segmentfault\head image)中看到爬取的圖片

完整代碼下載https://www.jianguoyun.com/p/DcAyJkoQvrm_Bhi7-jI

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,941評論 25 709
  • scrapy學習筆記(有示例版) 我的博客 scrapy學習筆記1.使用scrapy1.1創(chuàng)建工程1.2創(chuàng)建爬蟲模...
    陳思煜閱讀 13,074評論 4 46
  • 下載及處理文件和圖片Scrapy為下載item中包含的文件(比如在爬取到產(chǎn)品時,同時也想保存對應的圖片)提供了一個...
    王小魚鱻閱讀 815評論 0 0
  • 幸福莫過于一個家有你有我還有他
    特別的愛閱讀 166評論 0 0
  • 告訴自己 將滿腔熱血注滿每一分秒 不求充滿一天 穿著便服有穿上小禮服的狀態(tài) 告訴自己 對友好地對身邊的人 不端著揣...
    站在30的邊上閱讀 503評論 0 49

友情鏈接更多精彩內容