Python學(xué)習(xí)那些被低估的Python庫

前言

在這篇文章中,我們想展示一些不同于流行的東西。這些都是深夜瀏覽GitHub的感悟,以及同事們分享的壓箱底東西。這些軟件包中的一些是非常獨(dú)特的,使用起來很有趣的Python包。

混合派

1.Knock Knock:從Python發(fā)送通知到移動(dòng)設(shè)備、桌面或電子郵件。

2.tqdm:可擴(kuò)展的Python和CLI進(jìn)度條,內(nèi)置對pandas的支持。

3.Colorama:簡單的跨平臺(tái)彩色終端文本。

4.pandas -log:提供熊貓基本操作的反饋。非常適合調(diào)試長管道鏈。

5.Pandas-flavor:擴(kuò)展pandas DataFrame/Series的簡單方法。

6.More-Itertools:增加了類似于itertools的額外功能。

7.streamlit:為機(jī)器學(xué)習(xí)項(xiàng)目創(chuàng)建應(yīng)用程序的簡單方法。

數(shù)據(jù)清理和操作

1.ftfy:修復(fù)mojibake和Unicode文本中的其他故障。

2.janitor:有很多很酷的功能來清理數(shù)據(jù)。

3.Optimus:另一個(gè)數(shù)據(jù)清理包。

4.Great-experctations:一個(gè)檢查數(shù)據(jù)是否符合預(yù)期的好工具。

數(shù)據(jù)探索和建模

1.Pandas-profile:創(chuàng)建一個(gè)包含來自pandas DataFrame的統(tǒng)計(jì)數(shù)據(jù)的HTML報(bào)告。

2.dabl:允許使用可視化和預(yù)處理進(jìn)行數(shù)據(jù)探索。

3.pydqc:允許比較兩個(gè)數(shù)據(jù)集之間的統(tǒng)計(jì)數(shù)據(jù)。

4.pandas-summary:對panda DataFrames描述功能的擴(kuò)展。

5.pivottable-js:pands在jupyter notebook的拖放功能。

數(shù)據(jù)結(jié)構(gòu)

1.Bounter:有效的計(jì)數(shù)器,使用有限(有界)的數(shù)量的內(nèi)存,無論數(shù)據(jù)大小。

2.Python -bloomfilter:可擴(kuò)展的Bloom Filter,使用Python實(shí)現(xiàn)。

3.datasketch:提供概率數(shù)據(jù)結(jié)構(gòu),如LSH、加權(quán)MinHash、HyperLogLog等。

4.ranges:Python的連續(xù)范圍、范圍集和范圍令數(shù)據(jù)結(jié)構(gòu)

Python作為一門不斷發(fā)展與普及的語言,還在不斷更新中。在學(xué)習(xí)時(shí),建議找一些學(xué)習(xí)伙伴一起來學(xué)習(xí)和討論,效果更佳。如果想學(xué)習(xí)Python,歡迎加入Python學(xué)習(xí)交流群(627012464),一起督促,一起學(xué)習(xí)。里面有開發(fā)工具,很多干貨和技術(shù)資料分享!

性能檢查和優(yōu)化

1.Py-spy: Python程序的采樣分析器。

2.pyperf:用于運(yùn)行Python基準(zhǔn)測試的工具箱。

3.snakeviz:一個(gè)瀏覽器內(nèi)的Python配置文件查看器,對jupyter notebook有很大的支持。

4.Cachier: Python函數(shù)的持久、無延遲、本地和跨機(jī)緩存。

5.Faiss:用于高效的相似性搜索和密集向量聚類的庫。

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

友情鏈接更多精彩內(nèi)容