爬蟲(1)

Python進度條tqdm的使用

對于可以迭代的對象都可以使用下面這種方式

from tqdm import tqdm
import time
 
for i in tqdm(range(100)):
  time.sleep(0.1)
  pass

GET 和 POST 到底有什么區(qū)別?

get是從服務器上獲取數據,post是向服務器傳送數據
1.GET請求的數據會附在URL之后,以?分割URL和傳輸數據,參數之間以&相連,POST把提交的數據則放置在是HTTP包的包體中。
2.GET的長度受限于url的長度,而url的長度限制是特定的瀏覽器和服務器設置的,理論上GET的長度可以無限長。
3.POST是沒有大小限制的,HTTP協議規(guī)范也沒有進行大小限制,起限制作用的是服務器的處理程序的處理能力
4.在ASP中,服務端獲取GET請求參數用Request.QueryString,獲取POST請求參數用Request.Form。
5.POST的安全性要比GET的安全性高application json 與form表單的區(qū)別?

瀏覽器默認的提交方式就是表單。首先,Content-Type 被指定為 application/x-www-form-urlencoded,jQuery的Ajax請求默認方式,其次,
數據以鍵值對形式?key1=value1&key2=value2的方式發(fā)送到服務器

post和get的選擇?
私密性的信息請求使用post。查詢信息和可以想要通過url分享的信息使用get。

BeautifulSoup 用法 標簽屬性值不確定時用法

對于Python中的BeautifulSoup,之前用其去查找

<div aria-lable="xxx">

之類的標簽,xxx的內容未知(可變)的前提下想要查找到對應的此div標簽,之前不知道如何實現。因為如果寫成:

sopu.findAll("div", attrs={"aria-lable": "xxx"});

則xxx必須寫出來,如果不寫出來屬性值,也就沒法用上attrs了,就沒法實現此處查找特性屬性值的標簽了。

解決:
可以通過:

soup.findAll("div", attrs={"aria-lable": True});

去查找到屬性包含aria-lable的div標簽的。所以,對于上面的,之前不知道如何處理--用BeautifulSoup查找未知屬性值,但是已知屬性的名字的標簽

最后編輯于
?著作權歸作者所有,轉載或內容合作請聯系作者
【社區(qū)內容提示】社區(qū)部分內容疑似由AI輔助生成,瀏覽時請結合常識與多方信息審慎甄別。
平臺聲明:文章內容(如有圖片或視頻亦包括在內)由作者上傳并發(fā)布,文章內容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

友情鏈接更多精彩內容