Python 多線程爬蟲自動Killed問題

關(guān)鍵詞:linux服務(wù)器? 多線程? 爬蟲技術(shù)

代碼大意:自動獲取某網(wǎng)站的大量信息,包括id,評價,粉絲等數(shù)量的信息。網(wǎng)頁大概有70W個網(wǎng)頁。

問題:每次大概數(shù)據(jù)采集訪問到5000個網(wǎng)頁的時候就出現(xiàn)killed,如何解決?

查了一下網(wǎng)上公開的資料:使用的內(nèi)存過多被OOM了,killed

措施:轉(zhuǎn)移到本地計算機(jī)運行;補充服務(wù)器內(nèi)存;改變存儲方式(以前是寫入exl里面,結(jié)果發(fā)現(xiàn)有內(nèi)存泄露,最終導(dǎo)致killed。解決方案將其儲存在文本文檔中.txt文件,很好的解決了這一問題)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,789評論 25 709
  • 所有的人都經(jīng)歷同樣的年輪,但不同的情感經(jīng)歷織就了不同的人生。 人生,本就一幅畫,不同的人給它涂上不同的色彩。于是有...
    jscfc閱讀 427評論 2 5
  • 神奇的珠子 笑笑虎開完生日派對后,本來想去找將軍貓老師來懲罰這五只偷吃雞的老鼠,可是笑笑虎忽然生病了。它身上長了一...
    戎梁閱讀 596評論 1 5

友情鏈接更多精彩內(nèi)容