Python庫的安裝使用方法

python庫安裝方法:


方法一:setpu.py


1.下載庫壓縮包,解壓,記錄下路徑:*:/**/……/


2.運行cmd,切換到*:/**/……/目錄下


3.運行setup.py build


4.然后輸入python,進入python模塊,驗證是否安裝成功


方法二:


1.Win + R 打開運行窗口,輸入cmd回車


2.找到pip安裝路徑——x:\Python xx\Scripts


3. 在命令行中切換至該目錄cd x:\Python xx\Scripts


4.輸入 pip install ***(庫名稱)



常用庫大全:


1.os——通過python實現(xiàn)操作系統(tǒng)中的功能:新建文件夾、指定路徑等


2.爬取網(wǎng)頁


2.1 urllib——爬取網(wǎng)頁


  urllib.request


2.2 bs4——對網(wǎng)頁按照標簽提取信息(需下載)


2.3 re——(Regular Expression 正則表達式)


2.4 Requests 庫——擅長處理那些復(fù)雜的HTTP 請求、cookie、header(響應(yīng)頭和請求頭)等內(nèi)容的Python 第三方庫(https://github.com/kennethreitz/requests/tarball/master) 


2.5 smtplib——收發(fā)郵件


2.6 Selenium 庫是一個在WebDriver 上調(diào)用的API。WebDriver 有點兒像可以加載網(wǎng)站的瀏覽器,但是它也可以像BeautifulSoup 對象一樣用來查找頁面元素,與頁面上的元素進行交互


(發(fā)送文本、點擊等),以及執(zhí)行其他動作來運行網(wǎng)絡(luò)爬蟲。


2.7 collections ——數(shù)據(jù)結(jié)構(gòu)


2.8 import random



PhantomJS 是一個“無頭”(headless)瀏覽器。它會把網(wǎng)站加載到內(nèi)存并執(zhí)行頁面上的JavaScript,但是它不會向用戶展示網(wǎng)頁的圖形界面。把Selenium 和PhantomJS 結(jié)合在一


起,就可以運行一個非常強大的網(wǎng)絡(luò)爬蟲了,可以處理cookie、JavaScrip、header,以及任何你需要做的事情。



3.數(shù)據(jù)存儲


3.1 pymysql——python存儲數(shù)據(jù)至mysql數(shù)據(jù)庫


3.2 xlrd,xlwt——將數(shù)據(jù)寫入excel的操作



4.文件讀取


4.1 PDFMiner3K——取PDF 文件? https://pypi.python.org/pypi/pdfminer3k


4.2 ython-docx 庫——持創(chuàng)建新文檔和讀取一些基本的文件數(shù)據(jù),如文件大小和文件標題,不支持正文讀取。



5.算法


5.1 NLTK——自然語言處理? ? www.nltk.org? 統(tǒng)計分析、詞義分析——書籍:Natural Language Processing with Python


5.2 Pillow 和Tesseract——圖像識別與文字處理


 ?。╤ttp://pillow.readthedocs.org/)


  Tesseract 是目前公認最優(yōu)秀、最精確的開源OCR 系統(tǒng)。Tesseract 是一個Python 的命令行工具,不是通過import語句導(dǎo)入的庫。安裝之后,要用tesseract 命令在Python 的外面運行。在Windows 系統(tǒng)上,下載方便的可執(zhí)行安裝文件(https://code.google.com/p/tesseract-ocr/downloads/list)安裝即可。Tesseract 最大的缺點是對漸變背景色的處理。


  創(chuàng)建圖片定位文件:每個字符是什么,以及每個字符的具體位置——在線工具Tesseract OCR Chopper(http://pp19dd.com/tesseract-ocr-chopper/),因為它不需要安裝,也沒有其他依賴,只要有瀏覽器就可以運行,而且用法很簡單:上傳圖片,如果要增加新矩形就單擊“add”按鈕,還可以根據(jù)需要調(diào)整矩形的尺寸,最后把新生成的矩形定位文件復(fù)制到一個新文件里就可以了。


  如果你對Tesseract 的其他訓練方法感興趣,甚至打算建立自己的驗證碼訓練文件庫,或者想和全世界的Tesseract 愛好者分享自己對一種新字體的識別成果,那么我推薦你仔細閱讀Tesseract的文檔(https://github.com/tesseract-ocr/tesseract/wiki)。


5.3 NumPy——因為NumPy 可以用數(shù)學方法把圖片表示成巨大的像素數(shù)組,所以它可以流暢地配合Tesseract 完成任務(wù)。




6.JavaScript庫


6.1 jQuery


6.2 Google Analytics



7.GUI庫


7.1 tkinter——python3

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • # Python 資源大全中文版 我想很多程序員應(yīng)該記得 GitHub 上有一個 Awesome - XXX 系列...
    小邁克閱讀 3,129評論 1 3
  • 本教程翻譯自PyImageSearch英文原文 上周的博客內(nèi)容,我們學習了如何安裝Tesseract去做OCR識別...
    TimBao閱讀 34,318評論 0 14
  • 胡衛(wèi)平 焦點網(wǎng)絡(luò)九期 西平 堅持分享第129天.2018.07.03. 今天本來計劃進行這一周的第一次約練,...
    風花留雪閱讀 57評論 0 0
  • 冬日午后的陽光,懶洋洋地透過教室大大的深綠色邊框的玻璃窗,撫在我的頭發(fā)上,背上,手上,桌子上。那般溫柔。映著...
    三三念閱讀 413評論 0 2

友情鏈接更多精彩內(nèi)容