【分析篇】:python基本統(tǒng)計特征函數(shù)解釋

# 基本統(tǒng)計特征函數(shù),data 為DataFrame 或者 Series
        
        # sum()
        # mean()
        # var() 樣本方差
        # std() 計算數(shù)據(jù)樣本的標準差
        # corr() Spearman(Person,kenall) 相關(guān)系數(shù)矩陣
            # S1.corr(S2,method = 'pearson') --> S1 和 S2 均為Series

D = pd.DataFrame([range(1,8),range(2,9)]) 
# 第一行為1~7,第二行為2~8
D.corr(method = 'pearson')
S1 = D.loc[0] # 提取第一行
S2 = D.loc[1] # 提取第二行
S1.corr(S2,method = 'pearson')

        # cov() 協(xié)方差矩陣 計算兩個Series之間的協(xié)方差

import numpy as np
D = pd.DataFrame(np.random.randn(6.5)) # 產(chǎn)生6*5 隨機矩陣
D.cov() #計算協(xié)方差矩陣

D[0].cov(D[1]) #計算第一列和第二類的協(xié)方差

        # describe(percentiles = [0.2,0.4,0.6,0.8]) 計算 0.2 0.4 。。。分位數(shù)

    # 拓展統(tǒng)計特征函數(shù) Pandas

    # 累積計算
        # cumsum() 依次給出1,2,...,n個數(shù)的和
        # cumprod()  依次給出1,2,...,n個數(shù)的積
        # cummax()  依次給出1,2,...,n個數(shù)的最大值
        # cummin()  依次給出1,2,...,n個數(shù)的最小值
            # D 為DataFrame 或者 Series ,D.cumsum()
    # 滾動計算
        # rolling_sum() 計算樣本數(shù)據(jù)量的總和(按列計算)
        # rolling_mean() 數(shù)據(jù)樣本的均值
        # rolling_var() 計算數(shù)據(jù)樣本的方差
        # rolling_std() 計算數(shù)據(jù)樣本的標準差
        # rolling_corr() 計算數(shù)據(jù)樣本的相關(guān)系數(shù)矩陣
        # rolling_cov() 計算協(xié)方差矩陣
            # 不是 D 為DataFrame 或者 Series 對象的方法
                #使用方法為 pd.rolling_mean(D,k) -->意思是每K列計算一次均值

D = pd.Series(range(0,20)) # 構(gòu)造Series
D.sort(ascending = True)
D.cumsum()

pd.rolling_sum(D,2) #依次對相鄰兩項求和

參考資料:《Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)》

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容