XML
XML指可擴(kuò)展標(biāo)記語(yǔ)言(EXtensible Markup Language)
XML和HTTP的區(qū)別

區(qū)別.jpg
Xpath
Xpath(XML Path Language)是一門(mén)在XML文檔中查找信息的語(yǔ)言,可用來(lái)在XML文檔中對(duì)元素和屬性進(jìn)行遍歷
- / :從根節(jié)點(diǎn)選取
- // :從匹配選擇的當(dāng)前節(jié)點(diǎn)選擇文檔中的節(jié)點(diǎn),而不考慮它們的位置
- . :選取當(dāng)前節(jié)點(diǎn)
- .. :選取當(dāng)前節(jié)點(diǎn)的父節(jié)點(diǎn)
- @:選取屬性
Xpath的使用
1、安裝lxml
pip install lxml
lxml 是一個(gè)HTML/XML的解析器,主要的功能是如何解析和提取HTML/XML數(shù)據(jù)
2、使用
from lxml import etree
html = etree.HTML(text)
content = html.xpath('xpath表達(dá)式')