selenium-chromedriver多進程(selenium)

很多人可能都沒想過用selenium能做多線程爬蟲
其實實現(xiàn)起來都是一樣的簡單


導入相關庫
from selenium import webdriver
from multiprocessing.dummy import Pool
訪問
def spider(url):
    driver = webdriver.Chrome('chromedriver')
    driver.get(url)
    html = driver.page_source
    print(html)
    driver.close()
    driver.quit()
控制
def run(x):
    url = 'https://www.baidu.com/s?wd=今天有哪些美女&pn={}'
    pages = []
    for i in range(0, x * 10, 10):
        page = url.format(i)
        pages.append(page)
    print(pages)
    pool = Pool(5)
    result = pool.map(spider, pages)
    pool.close()
    pool.join()
    return result

試一下

if __name__ == '__main__':
    run(10)
最后編輯于
?著作權歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,941評論 25 709
  • Selenium入門 歡迎閱讀Selenium入門講義,本講義將會重點介紹Selenium的入門知識以及Selen...
    厲鉚兄閱讀 12,092評論 3 68
  • 定義 將“請求”封裝成對象,以便使用不同的請求、隊列或者日志來參數(shù)化其他對象。命令模式也支持可撤銷的操作。 典型使...
    狐尼克朱迪閱讀 246評論 0 0
  • 戴爾克·施特略夫真是個可悲的人。我搞不清楚這種人到底是抱著什么樣的生活態(tài)度活著,他似乎一點自尊心也沒有,情商也極低...
    去非閱讀 199評論 0 0
  • ajax本來就是異步請求自然不保證執(zhí)行順序
    輝格食品閱讀 224評論 0 0

友情鏈接更多精彩內(nèi)容