PhantomJS PhantomJS 是一個基于Webkit的“無界面”(headless)瀏覽器,它會把網(wǎng)站加載到內(nèi)存并執(zhí)行頁面上的 Jav...
Selenium是一個Web的自動化測試工具,最初是為網(wǎng)站自動化測試而開發(fā)的,類型像我們玩游戲用的按鍵精靈,可以按指定的命令自動操作,不同是Se...
協(xié)程 協(xié)程,又稱微線程,纖程。英文名Coroutine。 1.協(xié)程是什么? 協(xié)程是python個中另外一種實現(xiàn)多任務(wù)的方式,只不過比線程更小占用...
迭代器 迭代是訪問集合元素的一種方式。迭代器是一個可以記住遍歷的位置的對象。迭代器對象從集合的第一個元素開始訪問,直到所有的元素被訪問完結(jié)束。迭...
官方文檔:http://docs.python.org/library/json.htmlJson在線解析網(wǎng)站:http://www.bejso...
官方文檔:https://pythonhosted.org/pyquery/index.html# 中文教程:http://www.geoinf...
爬取圖片并保存本地
CSS 選擇器:BeautifulSoup4 官方文檔:http://beautifulsoup.readthedocs.io/zh_CN/v4...
使用XPath簡單爬取起點網(wǎng)并將數(shù)據(jù)存入MySQL數(shù)據(jù)庫