Python 多進(jìn)程 協(xié)程爬蟲例子(multiprocessing gevent)

import gevent
from gevent import monkey
monkey.patch_all()
import requests
from multiprocessing import Process,Queue
from gevent.pool import Pool
import datetime



def produce_url(q):
    for i in range(20):
        list = []
        for i in range(100):
            url = "http://www.baidu.com"
            list.append(url)
        q.put(list)


def spider(url):
    res = requests.get(url)
    print(res.status_code)

def consume_url(q,):
    pool = Pool(16)
    while True:
        if not q.empty():
            url_list = q.get()
            tasks = []
            for url in url_list:
                tasks.append(pool.spawn(spider,url))
            gevent.joinall(tasks)
        else:
            break

def main():
    queue = Queue()
    process_list = []
    produce_url(queue)
    for i in range(4):
        p = Process(target=consume_url,args=(queue,))
        p.start()
        process_list.append(p)
    for p in process_list:
        p.join()


if __name__ == '__main__':
    start_time = datetime.datetime.now().strftime("%c")
    main()
    end_time = datetime.datetime.now().strftime("%c")
    print("開始時(shí)間:",start_time)
    print("結(jié)束時(shí)間:",end_time)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容