python檢查URL是否能正常訪問
今天,項目經(jīng)理問我一個問題,問我這里有2000個URL要檢查是否能正常打開,其實(shí)我是拒絕的,我知道因?yàn)橐獙懘a了,正好學(xué)了點(diǎn)python,一想,python處理起來容易,就選了python,開始把思路想好:
1.首先2000個URL。可以放在一個txt文本內(nèi)
2.通過python把內(nèi)容內(nèi)的URL一條一條放進(jìn)數(shù)組內(nèi)
3.打開一個模擬的瀏覽器,進(jìn)行訪問。
4.如果正常訪問就輸出正常,錯誤就輸出錯誤
直接簡單粗暴甩代碼。因?yàn)樯婕暗诫[私,圖片打了碼
01
import urllib.request
02
import time
03
04
opener = urllib.request.build_opener()
05
opener.addheaders = [('User-agent','Mozilla/49.0.2')]
06
#這個是你放網(wǎng)址的文件名,改過來就可以了
07
file = open('test.txt')
08
lines = file.readlines()
09
aa=[]
10
forlineinlines:
11
temp=line.replace('\n','')
12
aa.append(temp)
13
print(aa)
14
15
print('開始檢查:')
16
forainaa:
17
tempUrl = a
18
try:
19
opener.open(tempUrl)
20
print(tempUrl+'沒問題')
21
except urllib.error.HTTPError:
22
print(tempUrl+'=訪問頁面出錯')
23
time.sleep(2)
24
except urllib.error.URLError:
25
print(tempUrl+'=訪問頁面出錯')
26
time.sleep(2)
27
time.sleep(0.1)