Python爬蟲(chóng) - Selenium初探

環(huán)境配置

1、selenium安裝:
sudo pip install selenium

2、瀏覽器驅(qū)動(dòng)安裝(我用的是chrome瀏覽器)
brew install chromedriver

3、以我的簡(jiǎn)書(shū)首頁(yè)網(wǎng)址為例:http://www.itdecent.cn/u/5b771dd604fd
腳本示例:

from time import sleep
from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as EC
from selenium.webdriver.support.wait import WebDriverWait

driver = webdriver.Chrome()
driver.implicitly_wait(10)
driver.maximize_window()
driver.get("http://www.itdecent.cn/u/5b771dd604fd")

firstTitle = driver.find_element_by_xpath('//*[@id="note-9068615"]/div/a')
print firstTitle.text

輸出結(jié)果如下:

選取第一篇文章標(biāo)題
若想獲取當(dāng)前頁(yè)所有文章的標(biāo)題:
titles = driver.find_elements(By.XPATH, '//a[@class="title"]')
for title in titles:
    print title.text
當(dāng)前展示頁(yè)
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容