Python 簡單爬去簡書文章列表

運行環(huán)境:python3.5.1 , 庫:bs4
爬取一位大神的簡書文章列表
直接代碼:

# coding=utf-8

from urllib.request import urlopen
from urllib.error import URLError
from bs4 import BeautifulSoup


def getName(url):
    try:
        html = urlopen(url)
    except URLError as e:
        print(e)
        return None

    try:
        bsObj = BeautifulSoup(html, "html.parser")
        namelist = bsObj.select('h4 > a[target="_blank"]')
    except AttributeError as e:
        print(e)
        return None
    for name in namelist:
        print(name.string)


for index in range(1, 10):
    getName(
        "http://www.itdecent.cn/users/c98451170fd6/latest_articles?page=%d" % index)

如果你是使用subl IDE 利用插件直接在subl 中運行的話,可能會在subl控制臺中發(fā)現(xiàn)中文都是亂碼,這個問題我也一直找不到解決辦法。為了得到正確的運行結(jié)果請在終端下用命令進行運行。
運行結(jié)果:

weiwangdeMacBook-Pro:Desktop wangwei$ python findName.py 
百詞斬PK詞匯重點整理(2016.6)
簡明Python教程筆記(附代碼)
Python input和raw_input的區(qū)別
Python算法100題--034
linux硬鏈接和軟鏈接
Linux用戶及文件權(quán)限管理
Linux概念和基礎操作
Linux系統(tǒng)介紹
操作系統(tǒng)知識總結(jié)
Linux常用命令
PyCharm教程
Python算法100題--033
Python算法100題--032
時間管理的七句話---阮一峰
請分別列出HTML、JavaScript、CSS、Java、php、python的注釋代碼形式。
TCP/IP常問問題
常見網(wǎng)絡協(xié)議及對應端口號
TCP/UDP區(qū)別
網(wǎng)絡架構(gòu)模型
常見正則表達式
常見網(wǎng)絡操作命令
進制的計算
開源版本討論
Python算法100題--031
臉譜化過去的你
HTML 李炎恢筆記
IP地址分類
Python算法100題--030
...
...
...
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • Android 自定義View的各種姿勢1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 178,893評論 25 709
  • Spring Boot 參考指南 介紹 轉(zhuǎn)載自:https://www.gitbook.com/book/qbgb...
    毛宇鵬閱讀 47,261評論 6 342
  • 文|Summerie_墨 很小的時候看過一篇故事,故事里的爺爺去世了。臨走前跟孫子說,不要說再見,說一聲“你好”吧...
    Summerie_墨閱讀 859評論 1 1
  • 下了一場雨。 屋檐上浮起一層薄霧。 我撐傘佇立,聽不見世界的聲音。 噓,噓。 喧嘩不絕于耳,始終不入于心。 我轉(zhuǎn)身...
    涼涼的小指甲閱讀 264評論 0 0
  • 正月十五一過,這個年就算過完了,萬象更新萬物重新走上正軌。新的開始要討個好彩頭,今天我們就來講常勝將軍趙子龍,祝大...
    阿拉蕾蕾的世界閱讀 918評論 0 0

友情鏈接更多精彩內(nèi)容