Python爬蟲-小愛同學(xué)感恩節(jié)活動-感恩信

2019年11月28日,把玩了好幾個月的小米9SE,推送了一條消息“小愛 『同學(xué)們』的感恩信”,順手點開開啟感恩信,第一篇就是Are U OK的雷軍。

雷軍親筆明信片1.jpg

嘿,閑來無事,順手點點,發(fā)現(xiàn)小愛同學(xué)里應(yīng)該都是優(yōu)秀的人才啊。

出于對小米系統(tǒng)的喜愛,處于對小愛同學(xué)語音助手的喜愛,決定將所有的感恩信全部下載下來,留存?zhèn)浞荨m椖看枴皭哿藧哿恕薄?/p>

挑選一些自己認(rèn)為比較有意思的明信片。

工程師篇192.jpg

工程師篇4.jpg

產(chǎn)品經(jīng)理篇93.jpg

產(chǎn)品經(jīng)理篇8.jpg

產(chǎn)品經(jīng)理篇76.jpg

產(chǎn)品經(jīng)理篇4.jpg

產(chǎn)品經(jīng)理篇53.jpg

產(chǎn)品經(jīng)理篇26.jpg

設(shè)計師篇72.jpg

產(chǎn)品經(jīng)理篇129.jpg
# -*- coding: utf-8 -*-
'''
獲取小米感恩節(jié)中小愛同學(xué)的所有祝福卡片
'''
from selenium import webdriver
from grab import Grab
import os
import requests
import time

def getSources(i=None):
    level = driver.find_element_by_class_name('index_title__2AG9z').get_attribute('textContent')
    # print(level)
    pic_url = driver.find_element_by_class_name('index_letterImg__3DlbL').get_attribute('src')
    # print(pic_url)

    # 獲取圖片
    img = requests.get(pic_url)

    # 保存圖片到指定文件夾下
    path = 'D:\Sources\XiaoMiThanksgivingDay\pic'
    # 如果沒有對應(yīng)文件夾,自動創(chuàng)建文件夾
    if not os.path.isdir(path):
        os.mkdir(path)
    paths = path + '\\'

    # 按照level和讀取順序保存圖片
    file = open(paths + level + str(i) + '.jpg', 'ab')
    file.write(img.content)
    print(level + str(i), '文件保存成功!')
    file.close()

    return pic_url

if __name__ == '__main__':
    driver = webdriver.Chrome()
    driver.get('https://i.ai.mi.com/h5/ai-thanksgiving-letter-fe/#/letter')

    for i in range(1, 300):
        old_url=getSources(i)

        # 點擊進(jìn)入下一張圖片
        driver.find_element_by_class_name('index_nextButton__2CRzD').click()
        time.sleep(5)



在這些代碼基礎(chǔ)上,開始下載保存圖片。因為一開始沒有確認(rèn)一共有多少感謝信,只設(shè)置下載到299張。后來仔細(xì)閱讀發(fā)現(xiàn),一共其實是608人。

所以現(xiàn)在這299張圖片的基礎(chǔ)上進(jìn)行一個分析。圖片中有部分重復(fù),但不影響產(chǎn)品經(jīng)理、工程師、設(shè)計師之間的比例。至于為什么會重復(fù),答案未知。(也許代碼可以修改為判斷是否是同一張圖片,如果是就不去下載了。然后for循環(huán)他個1000次)

以下是圖片截圖:

設(shè)計師篇:不愧是設(shè)計師,過大半比例都是涂涂畫畫,還挺好看。


1.png

工程師篇:符合大家對工程師的認(rèn)知,文字為主,圖片為輔,不乏特色。

2.png

Image3.png

Image4.png

Image5.png

Image6.png

產(chǎn)品經(jīng)理篇:恩,產(chǎn)品經(jīng)理的感謝信介于工程師與設(shè)計師之間吧,風(fēng)格各異,有個性的極具個性。


Image7.png

Image8.png

Image9.png

產(chǎn)品經(jīng)理89張,工程師179張,設(shè)計師37張。

PM:RD:Designer=89:179:37≈3:6:1,從這個關(guān)系中可以看出小愛同學(xué)的整個項目中,開發(fā)工程師占據(jù)的大半,產(chǎn)品經(jīng)理占據(jù)三成,設(shè)計師比例一成。

項目源碼與收集到的資源在Github上,地址:

https://github.com/PLUSLEE/XiaomiAiThanksGivingDay

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容