學習PHP中統(tǒng)計擴展函數(shù)的使用

做統(tǒng)計相關系統(tǒng)的朋友一定都會學習過什么正態(tài)分布、方差、標準差之類的概念,在 PHP 中,也有相應的擴展函數(shù)是專門為這些統(tǒng)計相關的功能所開發(fā)的。我們今天要學習的 stats 擴展函數(shù)庫就是這類操作函數(shù)。當然,本身我并沒有做過什么類似的系統(tǒng),對這些概念也是一知半解,所以今天學習的內(nèi)容也只是基于個人的理解以及原來稍微接觸過的一些內(nèi)容。不過據(jù)說 Python 在這方面就相對來說會更加強大一些,畢竟是萬能膠水語言,而且也是在統(tǒng)計領域獲得成功之后才慢慢被大眾接受的一門語言,有興趣的同學可以自己研究一下。

stats 擴展的安裝也非常地簡單,直接使用正常的擴展安裝方式就可以了。而且它不需要額外的其他系統(tǒng)中組件的支持,非常方便。

0-1之間的隨機數(shù)

首先我們來看一個和統(tǒng)計關系不大的函數(shù)。

var_dump(stats_rand_ranf()); // float(0.32371053099632)

普通的 rand() 和 mt_rand() 函數(shù)都是返回從 0 到 getrandmax() 之間的整數(shù)。而這個 stats_rand_ranf() 返回的則是 0 到 1 之間的小數(shù)。除了這個函數(shù)之外,還有 stats_rand_ 開頭的其它一些函數(shù),是用于返回正態(tài)分布之類的隨機值的,大家有對統(tǒng)計學了解的可以自行查閱文檔。

方差、標準差

方差和標準差這兩個概念應該相對來說更簡單和普遍一些。像我真正的專業(yè)是心理學,在心理統(tǒng)計中,就有方差的和標準差的計算,而且也是考試的必考內(nèi)容。不過這塊的內(nèi)容也非常簡單,我們在使用函數(shù)后也會使用自己計算的代碼來展示方差和標準差的計算公式。

// 1,3,9,12
// 平均數(shù):(1+3+9+12)/4 = 6.25

// 方差
var_dump(stats_variance([1,3,9,12])); // float(19.6875)
// 方差公式:(1-6.25)^2+(3-6.25)^2+(9-6.25)^2+(12-6.25)^2)/4
var_dump((pow(1-6.25, 2)+pow(3-6.25, 2)+pow(9-6.25,2)+pow(12-6.25,2))/4); // float(19.6875)

平均數(shù)對于很多統(tǒng)計計算都很有用,是很多算法的基本數(shù)據(jù)之一。所以我們先準備好一個平均數(shù),主要是為了我們后面的手動計算使用。其實,方差和標準差也是很多其它計算的基礎數(shù)據(jù)。

stats_variance() 函數(shù)就是用于計算一組數(shù)據(jù)的方差。它接收的是一個數(shù)組參數(shù),計算的內(nèi)容也就是數(shù)據(jù)里面數(shù)據(jù)的值。關于方差的公式其實就是每一個數(shù)據(jù)減去平均數(shù)以后平方,然后全部加起來之后再除以數(shù)據(jù)的數(shù)量。

可以看到計算的結(jié)果和我們直接調(diào)用 stats_variance() 函數(shù)的結(jié)果是一樣的。

// 標準差
var_dump(stats_standard_deviation([1,3,9,12])); // float(4.4370598373247)
var_dump(stats_standard_deviation([1,3,9,12], true)); // float(5.1234753829798)
// 標準差:開方((1-6.25)^2+(3-6.25)^2+(9-6.25)^2+(12-6.25)^2)/4)
// 樣本標準差:開方((1-6.25)^2+(3-6.25)^2+(9-6.25)^2+(12-6.25)^2)/(4-1))

var_dump(sqrt((pow(1-6.25, 2)+pow(3-6.25, 2)+pow(9-6.25,2)+pow(12-6.25,2))/4)); // float(4.4370598373247)
var_dump(sqrt((pow(1-6.25, 2)+pow(3-6.25, 2)+pow(9-6.25,2)+pow(12-6.25,2))/3)); // float(5.1234753829798)

標準差的計算其實就是對于方差結(jié)果開方后再除以數(shù)據(jù)的數(shù)量。它有兩種形式,一種是直接除以數(shù)量,一種是除以數(shù)量減一,分別就叫做 標準差 和 樣本標準差 ??梢钥吹街苯邮褂?stats_standard_deviation() ,并且指定它的第二個參數(shù)就可以方便地切換這兩種標準差的計算結(jié)果。并且比自己手寫的計算也方便很多。

平均偏差、調(diào)和平均數(shù)、階乘

平均偏差一般指的是數(shù)列中各項數(shù)值與其算術平均數(shù)的離差絕對值的算術平均數(shù)。我的天啊,這概念都讀得好繞口,學統(tǒng)計的小伙伴們你們過得還好嗎?當然,在 stats 擴展中一個函數(shù)就搞定了。

// 平均偏差
var_dump(stats_absolute_deviation([1,3, 9, 12])); // 4.25

// ((6.25-1)+(6.25-3)+(9-6.25)+(12-6.25))/4
//(5.25+3.25+2.75+5.75)/4 = 4.25

stats_absolute_deviation() 函數(shù)用于計算平均偏差,其實上面的概念就是我在注釋中寫的公式。每個數(shù)據(jù)減平均數(shù)之后的絕對值再除以數(shù)據(jù)數(shù)量就可以了,直接看公式是不是比上面的概念要清晰很多。同樣,我們再看下調(diào)和平均數(shù)。

// 調(diào)和平均數(shù)
var_dump(stats_harmonic_mean([1, 3, 9, 12])); // float(2.6181818181818)
// 4/(1/1+1/3+1/9+1/12) = 2.6181818181818

stats_harmonic_mean() 用于計算一組數(shù)據(jù)的調(diào)和平均數(shù)。從下面注釋的計算公式中可以看出來嗎?調(diào)和平均數(shù)就是每個數(shù)據(jù)倒數(shù)相加之后再使用數(shù)據(jù)數(shù)量除以倒數(shù)和得到的結(jié)果。

最后就來個輕松一點的,一個可以直接計算階乘結(jié)果的函數(shù)。

var_dump(stats_stat_factorial(6)); // float(720)
// 1*2*3*4*5*6 = 720

這個函數(shù)相信不用多解釋了吧。

峰度、偏度、累積正態(tài)分布函數(shù)、概率密度

這些概念其實我也沒有接觸過了。不過就是測試了一下函數(shù)代碼可以使用而已。相關的函數(shù)還有很多,比如我們這里只是與正態(tài)分布相關的一些函數(shù),還有 F分布 、t分布 、柯西分布、卡方分布 等等相關的計算函數(shù)。我承認我只聽說過一兩個的名字,還有很多甚至連名字都沒聽說過。

// 峰度
var_dump(stats_kurtosis([1, 3, 9, 12])); // float(-1.6960846560847)

// 偏度
var_dump(stats_skew([1, 3, 9, 12])); // float(0.091222998923078)


// 返回正態(tài)分布的累積分布函數(shù)、其逆函數(shù)或其參數(shù)之一
var_dump(stats_cdf_normal(14,5,10, 1));
// 返回第一個參數(shù)的概率密度
var_dump(stats_dens_normal(14, 5, 10));

其它的各種分布相關計算的函數(shù)大家有需要的可以查閱相關的文檔,這里我就不強行上車了,上車了估計也得開溝里去。

總結(jié)

在沒有刷官方文檔前確實不知道我們 PHP 中都已經(jīng)有這樣的擴展存在了,還在想如果真的要做類似的統(tǒng)計系統(tǒng)使用 PHP 一定很會麻煩,所以大家才會去選擇其它語言。其實這些擴展早就存在了。好不好用不說,但使用 PHP 來做這類統(tǒng)計系統(tǒng)的例子確實并不是太多,有需要的東西還是要自己多研究研究。而且這類計算其實都是各種公式的混合,相信在 Composer 中也有不少好用的框架可以供我們使用而不需要再到系統(tǒng)中單獨安裝擴展。

測試代碼:

https://github.com/zhangyue0503/dev-blog/blob/master/php/202012/source/10.學習PHP中統(tǒng)計擴展函數(shù)的使用.php

參考文檔:

https://www.php.net/manual/zh/book.stats.php

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容