楊班長的需求(一)

? ? 某晚,突然收到楊大班長的一條消息,詢問是否有相識的程序猿,可以利用程序來幫忙整理一些數(shù)據(jù),可支持適當付費,當即講了仔細的需求:在某動態(tài)作文語料庫,找尋關(guān)鍵詞為“何必”,且總分數(shù)不低于350的所有文章,并將其標注版內(nèi)容下載下來;而且后續(xù)可能會改變關(guān)鍵詞,并同時改變總分。雖然小飛不是一個正經(jīng)的程序猿,但好歹也學過幾天程序,于是眉頭一皺,想著這紅包我收了,啥也木說默默掛了語音開始擼代碼。

????小飛默默的看了下某動態(tài)作文語料庫,它長下面這樣,提供搜索框并有基本的檢索條件,但是并沒有提供總分的篩選項,眉頭一皺,有了一個想法。

利用python操作瀏覽器自動登錄,輸入自己想要搜索的關(guān)鍵詞及總分數(shù),然后獲取其總頁數(shù),遍歷每一頁的每一條數(shù)據(jù),獲取其總分值,凡是大于或者等于我們要求的分數(shù)則點擊標注版獲取對應的文章內(nèi)容并保存到程序的當前目錄中,最終完成的程序如下視頻所示:


python操作selenium控制瀏覽器

????運行程序時,設置關(guān)鍵字和總分要求,輸入驗證碼,登錄網(wǎng)址后,可以放松的喝一杯咖啡,等待程序下載符合條件的文章,當程序運行完成后,會自己靜默的關(guān)閉瀏覽器,此時,我們打開運行程序的文件夾,可以發(fā)現(xiàn),旁邊多了一份名為“何必”的csv文件,使用Excel或者WPS打開,可以發(fā)現(xiàn)總分數(shù)都是超過350分之上的文章,此時就可以拿著這份數(shù)據(jù)進行相關(guān)的分析啦。

當小飛將程序發(fā)送給前任班長后,正準備客套一下,“楊總,咱們這么熟,紅包意思意思下就行啦”,發(fā)現(xiàn)某聊天軟件居然找不到楊大班長的聯(lián)系方式,百度一下,我才知道:

??????????????????????????????????????????????????????????????????????----友盡----

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。
禁止轉(zhuǎn)載,如需轉(zhuǎn)載請通過簡信或評論聯(lián)系作者。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容