
Selenium學(xué)習(xí)筆記目錄
Selenium 選擇、操作web元素01
Selenium 自動化主要就是:
- 選擇界面元素
依靠selenium庫難點 - 操作界面元素
依靠selenium庫- 輸入操作:點擊、輸入文字、拖拽等
- 輸出操作:獲取元素的各種屬性
- 根據(jù)界面上獲取的數(shù)據(jù)進行分析和處理
依靠編程語言,例如Python等難點
選擇元素
- WebDriver:操作整個瀏覽器和當(dāng)前整個頁面
- 當(dāng)前頁面上的選擇符合查找條件的對象
- 打開網(wǎng)址,回退,前進,刷新網(wǎng)頁
- 獲取、改變?yōu)g覽器窗口大小,關(guān)閉瀏覽器,截屏
- 獲取、設(shè)置cookies
- WebElement:操作和對應(yīng)web元素
- 當(dāng)前web元素的所有子元素里面符合查找條件的對象
- 操作該web元素,比如
- 點擊元素
- 輸入字符
- 獲取元素坐標(biāo)、尺寸、文本內(nèi)容、其他的屬性信息
通過id選擇元素
- id是DOM中唯一標(biāo)志這個元素的屬性
- 查找效率高
- 寫法一:
element = driver.find_element_by_id("kw") - 寫法二:
from selenium.webdriver.common.by import By element = driver.find_element(by=By.ID,value="kw") - 沒有找到id時將報錯
selenium.common.exceptions.NoSuchElementException - 沒有id時,可以通過根據(jù)上層的id,然后獲取內(nèi)部的源代碼,然后找到相關(guān)信息(str)
當(dāng)開發(fā)做一定的變動時,此方法就失效了
- 沒有id時,使用BeautifulSoup4
詳見后續(xù)內(nèi)容
獲取元素信息
- text屬性
顯示該元素在web頁面顯示出來的文本內(nèi)容 - get_attribute方法
非界面值- 某個屬性的值
ele.get_attribute('href') - 該元素對應(yīng)的html源代碼
ele.get_attribute('outerHTML')
出現(xiàn)問題時,將相關(guān)源代碼打印到日志里,以便快速定位問題
- 該元素的內(nèi)部部分的html源代碼ele.get_attribute('innerHTML') - 某個屬性的值
Selenium 選擇、操作web元素02
選擇元素的方法
通過name選擇元素 id是唯一的,name不一定是唯一的
<input name='cheese' type='text'/>
- 返回第一個找到的元素
如果找不到,拋出異常
# 方法一:
cheese = driver.find_element_by_name('cheese')
# 方法二:
from selenium.webdriver.common.by import By
cheeses = driver.find_emement(By.NAME,'cheese')
# 示例
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:/Python/tmp/own/test.html')
button = driver.find_element_by_name('button')
print(button.text)
# 執(zhí)行結(jié)果
按鈕01
#找不到時
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:/Python/tmp/own/test.html')
try:
button = driver.find_element_by_name('button4')
print(button.text)
except:
print('未找到')
# 執(zhí)行結(jié)果
未找到
- 返回所有的元素(list)
如果找不到,返回空列表,不拋出異常
# 方法一:
cheese = driver.find_elements_by_name('cheese')
# 方法二:
from selenium.webdriver.common.by import By
cheeses = driver.find_emements(By.NAME,'cheese')
# 示例
from selenium import webdriver
driver = webdriver.Chrome()
driver.get(r'file:///E:/Python/tmp/own/test.html')
button = driver.find_elements_by_name('button')
for a in button:
print(a.text)
# 執(zhí)行結(jié)果
按鈕01
按鈕02
按鈕03
通過class選擇元素非唯一值,通常用來選擇多個元素
- 返回所有的元素(list)
cheeses = driver.find_elements_by_class_name('cheese')
通過tag名選擇元素
- 如果tag名是唯一的,可以根據(jù)tag名定位
- 如果tag名不是唯一的,返回到是第一個
frame = driver.find_element_by_tag_name('iframe')
通過鏈接文本選擇元素
- 對于鏈接,可以通過其鏈接文本的內(nèi)容
<a >轉(zhuǎn)到百度</a>
ele = driver.find.element_by_link_text("轉(zhuǎn)到百度")
- 只通過部分文本去找到該鏈接元素
適用于文本內(nèi)容過長時
ele = driver.find.element_by_partial_link_text(u"百度") # 此處可以不寫u,python2中此處的“u”必寫
頁面操作(補充)
查找時間
- 每半秒查找一次,直到10秒后
driver.implicitly_wait((10)) - 強制睡眠10秒
import time
time.sleep(10)
模擬回車鍵enter的操作
- 使用
\n方法
from selenium.webdriver.common.keys import Keys
driver.find_element_by_id('toStationText').send_keys('杭州東\n')
- 使用enter方法
from selenium.webdriver.common.keys import Keys
driver.find_element_by_id('toStationText').send_keys('杭州東')
driver.find_element_by_id('toStationText').send_keys(Keys.ENTER) # 模擬鍵盤enter
頁面交互
WebDriver提供了各種方法來尋找元素。例如下面有一個表單輸入框。
<input type="text" name="passwd" id="passwd-id" />
element = driver.find_element_by_id("passwd-id")
element = driver.find_element_by_name("passwd")
element = driver.find_elements_by_tag_name("input")
element = driver.find_element_by_xpath("http://input[@id='passwd-id']")
獲取了元素之后,下一步當(dāng)然就是向文本輸入內(nèi)容了,可以利用下面的方法
element.send_keys("some text")
同樣你還可以利用 Keys 這個類來模擬點擊某個按鍵
element.send_keys("and some", Keys.ARROW_DOWN)
可以用下面的方法來清除輸入文本的內(nèi)容。
element.clear()