requests:??
安裝方式:? ?pip3 install requests
Requests?繼承了urllib的所有特性。Requests支持HTTP連接保持和連接池,支持使用cookie保持會(huì)話,支持文件上傳,支持自動(dòng)確定響應(yīng)內(nèi)容的編碼,支持國(guó)際化的URL和 POST 數(shù)據(jù)自動(dòng)編碼。
re正則:
則表達(dá)式概述
正則表達(dá)式,又稱正規(guī)表示式、正規(guī)表示法、正規(guī)表達(dá)式、規(guī)則表達(dá)式、常規(guī)表示法(英語(yǔ):Regular Expression,在代碼中常簡(jiǎn)寫為regex、regexp或RE),是計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式使用單個(gè)字符串來(lái)描述、匹配一系列匹配某個(gè)句法規(guī)則的字符串。在很多文本編輯器里,正則表達(dá)式通常被用來(lái)檢索、替換那些匹配某個(gè)模式的文本。
Regular Expression的“Regular”一般被譯為“正則”、“正規(guī)”、“常規(guī)”。此處的“Regular”即是“規(guī)則”、“規(guī)律”的意思,Regular Expression即“描述某種規(guī)則的表達(dá)式”之意。
目的?給定一個(gè)正則表達(dá)式和另一個(gè)字符串,我們可以達(dá)到如下的目的:給定的字符串是否符合正則表達(dá)式的過(guò)濾邏輯(稱作“匹配”):可以通過(guò)正則表達(dá)式,從字符串中獲取我們想要的特定部分。
compile 函數(shù):
match 方法:從起始位置開(kāi)始查找,一次匹配
search 方法:從任何位置開(kāi)始查找,一次匹配
findall 方法:全部匹配,返回列表
finditer 方法:全部匹配,返回迭代器
split 方法:分割字符串,返回列表
sub 方法:替換
firstdesc字符功能.匹配任意1個(gè)字符(除了\n)[ ]匹配[ ]中列舉的字符\d匹配數(shù)字,即0-9\D匹配非數(shù)字,即不是數(shù)字\s匹配空白,即 空格,tab鍵\S匹配非空白\w匹配單詞字符,即a-z、A-Z、0-9、_\W匹配非單詞字符
firstdesc
字符功能
*匹配前一個(gè)字符出現(xiàn)0次或者無(wú)限次,即可有可無(wú)
+匹配前一個(gè)字符出現(xiàn)1次或者無(wú)限次,即至少有1次
?匹配前一個(gè)字符出現(xiàn)1次或者0次,即要么有1次,要么沒(méi)有
{m}匹配前一個(gè)字符出現(xiàn)m次
{m,n}匹配前一個(gè)字符出現(xiàn)從m到n次
xpath:
什么是XPath?
XPath (XML Path Language) 是一門在 XML 文檔中查找信息的語(yǔ)言,可用來(lái)在 XML 文檔中對(duì)元素和屬性進(jìn)行遍歷。
什么是XML?
XML 指可擴(kuò)展標(biāo)記語(yǔ)言(EXtensible Markup Language)
XML 是一種標(biāo)記語(yǔ)言,很類似 HTML
XML 的設(shè)計(jì)宗旨是傳輸數(shù)據(jù),而非顯示數(shù)據(jù)
XML 的標(biāo)簽需要我們自行定義。
XML 被設(shè)計(jì)為具有自我描述性。
XML 是 W3C 的推薦標(biāo)準(zhǔn)
路徑表達(dá)式:
nodename選取此節(jié)點(diǎn)的所有子節(jié)點(diǎn)。
/從根節(jié)點(diǎn)選取。
//從匹配選擇的當(dāng)前節(jié)點(diǎn)選擇文檔中的節(jié)點(diǎn),而不考慮它們的位置。
.選取當(dāng)前節(jié)點(diǎn)。
..選取當(dāng)前節(jié)點(diǎn)的父節(jié)點(diǎn)。
@選取屬性
則表達(dá)式概述
正則表達(dá)式,又稱正規(guī)表示式、正規(guī)表示法、正規(guī)表達(dá)式、規(guī)則表達(dá)式、常規(guī)表示法(英語(yǔ):Regular Expression,在代碼中常簡(jiǎn)寫為regex、regexp或RE),是計(jì)算機(jī)科學(xué)的一個(gè)概念。正則表達(dá)式使用單個(gè)字符串來(lái)描述、匹配一系列匹配某個(gè)句法規(guī)則的字符串。在很多文本編輯器里,正則表達(dá)式通常被用來(lái)檢索、替換那些匹配某個(gè)模式的文本。
Regular Expression的“Regular”一般被譯為“正則”、“正規(guī)”、“常規(guī)”。此處的“Regular”即是“規(guī)則”、“規(guī)律”的意思,Regular Expression即“描述某種規(guī)則的表達(dá)式”之意。
多線程:
Queue(隊(duì)列對(duì)象)?Queue是python中的標(biāo)準(zhǔn)庫(kù),可以直接import Queue引用;
隊(duì)列是線程間最常用的交換數(shù)據(jù)的形式
包中的常用方法:
Queue.qsize()?返回隊(duì)列的大小
Queue.empty()?如果隊(duì)列為空,返回True,反之False
Queue.full()?如果隊(duì)列滿了,返回True,反之False
Queue.full?與?maxsize?大小對(duì)應(yīng)
**Queue.get(block,timeout)**獲取隊(duì)列,timeout等待時(shí)間
創(chuàng)建一個(gè)“隊(duì)列”對(duì)象