2018-11-19

from urllib import request
import time
from lxml import etree

def autoBlog():
    url = 'http://www.itdecent.cn/p/0b4c9e9931f5'
    headers = {
        "Referer": "http://www.itdecent.cn/",
        "User-Agent": "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/68.0.3440.106 Safari/537.36"
    }
    req = request.Request(url=url,headers=headers)
    response = request.urlopen(req)
    content = response.read().decode()
    #復制html中的文本的XPath
    ##/html/body/div[1]/div[2]/div[1]/h1
    # print(content)
    xpath_content = etree.HTML(content)
    new_content = xpath_content.xpath('/html/body/div[1]/div[2]/div[1]/h1/text()')
    #print(new_content)
    with open('3.txt','w+',encoding='utf-8') as f:
        for i in new_content:
            f.writelines(i)
i=0
while i<100:
    autoBlog()
    i=i+1
    print(i)
最后編輯于
?著作權歸作者所有,轉載或內容合作請聯(lián)系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內容

  • 隨著白天的慢慢變長,六月很快就到了,一年一度的高考就要來了。蘭德中學每年都會被設為高考的考場,今年也不例外,為方便...
    藍天航空幼兒園閱讀 311評論 0 2
  • 今天是星期五,上午我開心地過完,下午我們要科學、品社都抽測(也就是期未考試) 時間就像在飛逝,轉眼間到...
    李妙柯媽媽閱讀 122評論 0 0
  • 出于本能,人的恐懼,最接于莫過來源于生命受到威脅。 要么,是自己的。 二戰(zhàn)前的太平洋海面上,漂浮著一只救生艇,上面...
    三世織閱讀 220評論 0 0

友情鏈接更多精彩內容