爬蟲游戲第一關(guān)

發(fā)現(xiàn)個爬蟲闖關(guān)游戲網(wǎng)站,挺有意思,點擊跳轉(zhuǎn)
進入首頁,發(fā)現(xiàn)內(nèi)容很簡單,如圖

第一關(guān)首頁

提示在網(wǎng)址后面輸入數(shù)字14901,按照要求做,訪問http://www.heibanke.com/lesson/crawler_ex00/14901,
得到如下內(nèi)容
image.png

看到這里就明白了,第一關(guān)內(nèi)容就是不斷在網(wǎng)址后面添加當前頁面返回的那串數(shù)字,直到得到最后一串數(shù)字就算過關(guān),很簡單,提取那串數(shù)字添加到網(wǎng)址后面訪問,循環(huán)這個步驟,直到過關(guān)。
分析html結(jié)構(gòu),就是h3那一句就行了
html結(jié)構(gòu)

爬蟲代碼

from urllib import request
from bs4 import BeautifulSoup
import re
def get_page(url):
    print('get url %s' % url)
    headers = {
        'User-Agent': r'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) '
                    r'Chrome/45.0.2454.85 Safari/537.36 115Browser/6.0.3',
        'Connection': 'keep-alive'
    }
    req = request.Request(url, headers=headers)
    page = request.urlopen(req).read()
    page = page.decode('utf-8')
    return page
count = 1
numResult = ' '
# 判斷numResult是否為空,為空則代表闖關(guān)成功
while numResult:
    print('第%d次請求' % count)
    url = "http://www.heibanke.com/lesson/crawler_ex00/" + numResult
    result = get_page(url)
    soup = BeautifulSoup(result, "html.parser")
    # 解析h3元素
    h3 = soup.find_all("h3")[0]
    result = soup.find_all("h3")[0].text
    # 解析出數(shù)字
    numResult = re.sub("\D", "", result)
    print('數(shù)字: %s' % numResult)
    count += 1
print('成功闖關(guān),url:%s' % url)

結(jié)果:

結(jié)果

訪問http://www.heibanke.com/lesson/crawler_ex00/30366/,果然成功
成功闖關(guān)

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,789評論 25 709
  • 社交紅利閱讀筆記 書名:社交紅利(修訂升級版) 作者:徐志斌 出版社:中信出版社 正文前筆記: 推薦序1摘要 社交...
    鳧水閱讀 9,342評論 4 26
  • 端午前日,6棟樓下 世事是禁不住設(shè)想的。你設(shè)想突然出現(xiàn)和你的她過節(jié),無論驚喜or驚嚇,你們會在一起,什...
    一月一封閱讀 337評論 0 1
  • 我漫游在花海叢中 仿佛一切眾生皆虛妄 駐足了一會兒 單車帶走了芬芳 你不了解你的心思 你所看見的 只是陽光映射的倒...
    陳列園子閱讀 176評論 0 1
  • (1) 最近一段時間都在研究技術(shù)分析,從技術(shù)分析捕捉到股票上漲的信息,跟隨莊家做波段,之前學習多,總結(jié)少,今天開始...
    從小白到精通閱讀 1,314評論 0 4

友情鏈接更多精彩內(nèi)容