mongodb中基本的概念是 文檔(字段)、集合(表)、數據庫 1.查看當前數據庫 2.查看所有數據庫 3.切換數據庫 4.刪除當前數據庫(注意:先切換到要刪除的數據庫) 5...
mongodb中基本的概念是 文檔(字段)、集合(表)、數據庫 1.查看當前數據庫 2.查看所有數據庫 3.切換數據庫 4.刪除當前數據庫(注意:先切換到要刪除的數據庫) 5...
一、drf的序列化組件: 1.作用: 把python中的對象,轉成json格式字符串 使用步驟1: 寫一個類繼承Serializer或者ModelSerializer舉例(類...
一、django 1、中間件 中間件一般做認證或批量請求處理,django中的中間件,其實是一個類,在請求和結束后,django會根據自己的規(guī)則在合適的時機執(zhí)行中間件中相應的...
restful(表者征狀態(tài)轉移,面向資源編程)------------------------------------------->約定從資源的角度審視整個網絡,將分布在網...
TTP狀態(tài)碼(HTTP Status Code)一些常見的狀態(tài)碼為: 200 - 服務器成功返回網頁 404 - 請求的網頁不存在 503 - 服務不可用所有狀態(tài)解釋: 1x...
文/如風 先講個小故事: 當謝麗爾.桑德伯格加入Facebook前,他和馬克、扎克伯格商談自己的報酬時,他提出了讓謝麗爾覺得很公平的條件。有超過一個半月的時間里,他們每周都會...
pyspider簡介 官方文檔:http://docs.pyspider.org/ 中文網址:http://www.pyspider.cn/book/pyspider/ 最新...
CrawlSpider它是Spider的派生類,Spider類的設計原則是只爬取start_url列表中的網頁,而CrawlSpider類定義了一些規(guī)則Rule來提供跟進鏈接...
Scrapy是用純python實現一個為了爬取網站數據、提取結構性數據而編寫的應用框架,用途非常廣泛 Scrapy架構圖(綠線是數據流向):Image.png Scrapy ...
什么是進程? 一個程序運行起來后,代碼+用到的資源 稱之為進程,它是操作系統(tǒng)分配資源的基本單元。 進程的創(chuàng)建-multiprocessing multiprocessing模...
PyQuery簡介 pyquery相當于jQuery的python實現,可以用于解析HTML網頁等 初始化 有 4 種方法可以進行初始化: 可以通過傳入 字符串、lxml、文...
什么是XPath? XPath (XML Path Language) 是一門在 XML 文檔中查找信息的語言,可用來在 XML 文檔中對元素和屬性進行遍歷 什么是XML? ...
HTTP請求方式中get和post的區(qū)別 表單提交中get和post方式的區(qū)別有5點 1.get是從服務器上獲取數據,post是向服務器傳送數據。 2.get是把參數數據隊列...
mongodb中基本的概念是 文檔(字段)、集合(表)、數據庫 1.查看當前數據庫 2.查看所有數據庫 3.切換數據庫 4.刪除當前數據庫(注意:先切換到要刪除的數據庫) 5...
正則:正規(guī)表達式 用來處理字符串 單字符匹配 . 除換行之外的任意字符\d 表示數字\D 匹配非數字\w 匹配單詞字符[a-z,A-Z,0-9]\W 匹配非單詞字符\s 匹...
parse 可以對url 拆分、組合、編碼、解碼、拼接 parse.urlencode():將字典類型的參數轉為url編碼格式 get請求直接使用urlencode將參數轉為...
爬蟲背景知識:大數據的時代?數據怎么來的呢? 企業(yè)產生的數據:大的公司會根據用戶的行為記錄數據,數據會被大公司利用,可以用來做數據的分析 數據平臺的數據: 政府和機構的數據:...
什么是爬蟲? 網絡爬蟲(又被稱為網頁蜘蛛,網絡機器人), 是一種按照一定的規(guī)則,自動地抓取萬維網信息的程序或者腳本。 爬蟲的用途 搜索引擎 咨詢新聞網站 購物助手(慧慧購物)...