import gevent
from gevent import monkey
monkey.patch_all()
import requests
from multiprocessing import Process,Queue
from gevent.pool import Pool
import datetime
def produce_url(q):
for i in range(20):
list = []
for i in range(100):
url = "http://www.baidu.com"
list.append(url)
q.put(list)
def spider(url):
res = requests.get(url)
print(res.status_code)
def consume_url(q,):
pool = Pool(16)
while True:
if not q.empty():
url_list = q.get()
tasks = []
for url in url_list:
tasks.append(pool.spawn(spider,url))
gevent.joinall(tasks)
else:
break
def main():
queue = Queue()
process_list = []
produce_url(queue)
for i in range(4):
p = Process(target=consume_url,args=(queue,))
p.start()
process_list.append(p)
for p in process_list:
p.join()
if __name__ == '__main__':
start_time = datetime.datetime.now().strftime("%c")
main()
end_time = datetime.datetime.now().strftime("%c")
print("開始時(shí)間:",start_time)
print("結(jié)束時(shí)間:",end_time)
Python 多進(jìn)程 協(xié)程爬蟲例子(multiprocessing gevent)
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。
相關(guān)閱讀更多精彩內(nèi)容
- 1.笨栗子就是對(duì)多進(jìn)程中調(diào)用協(xié)程,pool.apply_async(asyncio.get_event_loop(...
- 多進(jìn)程 關(guān)于多進(jìn)程爬蟲和多進(jìn)程方面的知識(shí)可以參考崔慶才的博客和python文檔 協(xié)程 關(guān)于協(xié)程的介紹,強(qiáng)烈推薦大家...
- 目錄 只用request爬取 用多線程爬取 用多進(jìn)程爬取 用協(xié)程爬取 用協(xié)程+多進(jìn)程爬取 1. 只用request...
- 從計(jì)算機(jī)硬件角度: 計(jì)算機(jī)的核心是CPU,承擔(dān)了所有的計(jì)算任務(wù)。一個(gè)CPU,在一個(gè)時(shí)間切片里只能運(yùn)行一個(gè)程序。 從...
- 對(duì)于操作系統(tǒng)來說,一個(gè)任務(wù)就是一個(gè)進(jìn)程(Process),比如打開一個(gè)瀏覽器就是啟動(dòng)一個(gè)瀏覽器進(jìn)程,打開一個(gè)記事本...