讀《沒網(wǎng)?—>照樣看簡書文章||python (初學(xué))》后用自己方法的實(shí)現(xiàn)

涉及到我自己是2.7.11,故選擇用自己的理解和知識寫了一段程序,沒用到def,因?yàn)槌鯇W(xué),不大會。在此@采蝶袖?作者,看了帖子很受啟發(fā)??赡芷渲袑懙谋容^繁瑣,還望作者指正,謝謝。


運(yùn)行結(jié)果

附上源碼:

# -*- coding: utf-8 -*-

#title:抓取某網(wǎng)頁的所有鏈接并將鏈接編碼后放入各個文件夾內(nèi)

import re

import requests

import sys

import urllib2

from bs4 import Beautiful Soup

#定義頁面鏈接,并抓取此頁面的網(wǎng)頁代碼

reload(sys)

sys.setdefaultencoding('utf-8')

r = urllib2.Request("http://www.itdecent.cn/")

content = urllib2.urlopen(r).read()

#print content

soup = BeautifulSoup(content,'html.parser')

link_list =re.findall(r'class="title" target="_blank" href="(/p.+?.{12})',content)

#開始循環(huán)

d =0

for i in link_list:

d = d +1

ii =str(d)

url ='http://www.itdecent.cn'+i

r = requests.get(url)

data = r.text

soup_b = BeautifulSoup(data,'html.parser')

for x in soup_b.find_all('h1',class_="title"):

thistitle = x.text

f =file('d:/pythonWorkSpace/Python27PygamePy2exe-master/Python27PygamePy2exe-master/a/'+ ii +'.'+ thistitle +'.txt',"w")

for i in soup_b.find_all('div',class_='show-content'):

thisdata = i.text

f.write(thisdata)

break

f.close()

現(xiàn)在趕緊去學(xué)習(xí)def的寫法。不喜勿噴。。。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容