第五章 爬蟲進(jìn)階(十六) 2020-02-02

十六、 selenium和chromedriver基本使用


Selenium+chromedrive介紹


Selenium相當(dāng)于是一個(gè)機(jī)器人。可以模擬人類在瀏覽器上的一些行為,自動(dòng)處理瀏覽器商店一些行為,比如點(diǎn)擊,填充數(shù)據(jù),刪除cookie等。Chromedriver是一個(gè)驅(qū)動(dòng)chrome瀏覽器的驅(qū)動(dòng)程序,使用他才可以驅(qū)動(dòng)瀏覽器。當(dāng)然針對(duì)不同的瀏覽器有不同的driver。以下列出了不同瀏覽器及其對(duì)應(yīng)的driver:

1、Chrome:https://site.google.com/a/chromium.org/chromedriver/downloads

2、Firefox:https://github.com/mozilla/geckodriver/releases

3、Edge:https://developer.microsoft.com/en-us/microsoft-edge/tools/webdriver/

4、Safari:https://webkit.org/blog/6900/webdriver-support-in-safari-10/


Selenium的官方網(wǎng)址:https://selenium-python.readthedocs.io/


安裝selenium和webdriver


1、安裝selenium:selenium有很多語言的版本,有java、ruby、python等。我們下載python版本就可以了。


cmd指令:pip install selenium


2、安裝chromedriver:下載完成后,放到不需要權(quán)限的純英文目錄下就可以了。


3、Chromedriver的驅(qū)動(dòng):


https://site.google.com/a/chromium.org/chromedriver/downloads


Selenium的基本使用


現(xiàn)在以一個(gè)簡(jiǎn)單的獲取百度首頁(yè)的例子來講下selenium和chromedriver如何快速入門:


示例代碼:

?

from selenium import webdriver

?

# chromedriver的絕對(duì)路徑

driver_path = r'E:\python\chromedriver\chromedriver.exe'

?

# 初始化一個(gè)driver,并且指定chromedriver的路徑

driver = webdriver.Chrome(executable_path=driver_path)

# 請(qǐng)求網(wǎng)頁(yè)

driver.get("https://www.baidu.com")

# 通過page_source獲取網(wǎng)頁(yè)源代碼

print(driver.page_source)


Selenium的基本使用- 關(guān)閉


1、driver.close():關(guān)閉當(dāng)前頁(yè)面。

2、driver.quit():退出整個(gè)瀏覽器。



上一篇文章 第五章 爬蟲進(jìn)階(十五) 2020-02-01 地址:

http://www.itdecent.cn/p/ca48fa8c11ce

?下一篇文章 第五章 爬蟲進(jìn)階(十七) 2020-02-03 地址:

?http://www.itdecent.cn/p/76c033f8b17c



以上資料內(nèi)容來源網(wǎng)絡(luò),僅供學(xué)習(xí)交流,侵刪請(qǐng)私信我,謝謝。

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容