Python實現(xiàn)數(shù)據(jù)分析1

Python-數(shù)據(jù)分析常用庫

1)Numpy

2)? Pandas

3)? Matplotlib

Numpy

基于數(shù)組運算,效率高。擁有許多高級函數(shù),可以對數(shù)據(jù)進行高效處理??梢赃M行線性代數(shù)相關(guān)運算。

Pandas

用于數(shù)據(jù)處理和分析,有很多復(fù)雜函數(shù),使用起來簡單高效,廣泛用于金融、電商、高校科研。

?Matplotlib

類似 Matlab,用于生成繪圖,直方圖,功率譜,條形圖,錯誤圖,散點圖等

1、常用統(tǒng)計量

均值、標(biāo)準(zhǔn)差、中位數(shù)、分位數(shù)、眾數(shù)

ps:分位數(shù)的理解:https://www.zhihu.com/question/67763556

2、反應(yīng)數(shù)據(jù)某些趨勢

表示數(shù)據(jù)的離散程度:極差、四分位差、方差、變異系數(shù)


附:Python實現(xiàn)

代碼示例


結(jié)果示例:


ps:分位數(shù)的Python理解:

https://www.cnblogs.com/brightyuxl/p/9815780.html


點估計

是最直接的一種估計方式,用樣本統(tǒng)計量去估計總體參數(shù),例如假設(shè)中國人的平均身高為168厘米,經(jīng)過抽樣計算出樣本的平均值為168,通過點估計,推斷出中國人平均身高為168厘米。

區(qū)間估計

提供待估計的參數(shù)置信區(qū)間和保證程度(置信度),區(qū)間估計用一個包括有真實值的區(qū)間范圍來估計參數(shù)的取值范圍,得到的結(jié)果為置信區(qū)間,區(qū)間估計的可信程度為置信度或置信水平,用1-\alpha 表示。

比如:有95%的可能性可以確定總體增長率在區(qū)間4.5%-6%之間,其中4.5%-6%是置信區(qū)間,95%是置信度。

ps:案例輔助理解?https://blog.csdn.net/yinjieer379/article/details/107715146




附:Python實現(xiàn)代碼示例

結(jié)果示例:

中心極限定理

樣本均值近似正態(tài)分布

多次抽樣,產(chǎn)生的多個樣本均值服從正態(tài)分布

若樣本數(shù)量足夠大,產(chǎn)生的均值是近似符合正態(tài)分布的。

如果實際進行了一次抽樣,并計算得到均值s,如果進行一次抽樣,均值有可能還是s,或大于/小于s,但是離s越近的可能性越高。因為知道了樣本均值服從正態(tài)分布,利用正態(tài)分布性質(zhì),可以推斷出樣本均值出現(xiàn)在某區(qū)間范圍的概率。理論上就可以計算樣本均值有多大概率(置信度)可能出現(xiàn)的區(qū)間范圍,而總體均值就有大概率落在范圍內(nèi)。




附:Python安裝教程

1、https://zhuanlan.zhihu.com/p/75717350

2、https://blog.csdn.net/qq_18424081/article/details/85856713

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

友情鏈接更多精彩內(nèi)容