學習PHP中統計擴展函數的使用

做統計相關系統的朋友一定都會學習過什么正態分布、方差、標準差之類的概念,在 PHP 中,也有相應的擴展函數是專門為這些統計相關的功能所開發的。我們今天要學習的 stats 擴展函數庫就是這類操作函數。當然,本身我并沒有做過什么類似的系統,對這些概念也是一知半解,所以今天學習的內容也只是基于個人的理解以及原來稍微接觸過的一些內容。不過據說 Python 在這方面就相對來說會更加強大一些,畢竟是萬能膠水語言,而且也是在統計領域獲得成功之后才慢慢被大眾接受的一門語言,有興趣的同學可以自己研究一下。

stats 擴展的安裝也非常地簡單,直接使用正常的擴展安裝方式就可以了。而且它不需要額外的其他系統中組件的支持,非常方便。

0-1之間的隨機數

首先我們來看一個和統計關系不大的函數。

var_dump(stats_rand_ranf()); // float(0.32371053099632)

普通的 rand() 和 mt_rand() 函數都是返回從 0 到 getrandmax() 之間的整數。而這個 stats_rand_ranf() 返回的則是 0 到 1 之間的小數。除了這個函數之外,還有 stats_rand_ 開頭的其它一些函數,是用于返回正態分布之類的隨機值的,大家有對統計學了解的可以自行查閱文檔。

方差、標準差

方差和標準差這兩個概念應該相對來說更簡單和普遍一些。像我真正的專業是心理學,在心理統計中,就有方差的和標準差的計算,而且也是考試的必考內容。不過這塊的內容也非常簡單,我們在使用函數后也會使用自己計算的代碼來展示方差和標準差的計算公式。

// 1,3,9,12
// 平均數:(1+3+9+12)/4 = 6.25

// 方差
var_dump(stats_variance([1,3,9,12])); // float(19.6875)
// 方差公式:(1-6.25)^2+(3-6.25)^2+(9-6.25)^2+(12-6.25)^2)/4
var_dump((pow(1-6.25, 2)+pow(3-6.25, 2)+pow(9-6.25,2)+pow(12-6.25,2))/4); // float(19.6875)

平均數對于很多統計計算都很有用,是很多算法的基本數據之一。所以我們先準備好一個平均數,主要是為了我們后面的手動計算使用。其實,方差和標準差也是很多其它計算的基礎數據。

stats_variance() 函數就是用于計算一組數據的方差。它接收的是一個數組參數,計算的內容也就是數據里面數據的值。關于方差的公式其實就是每一個數據減去平均數以后平方,然后全部加起來之后再除以數據的數量。

可以看到計算的結果和我們直接調用 stats_variance() 函數的結果是一樣的。

// 標準差
var_dump(stats_standard_deviation([1,3,9,12])); // float(4.4370598373247)
var_dump(stats_standard_deviation([1,3,9,12], true)); // float(5.1234753829798)
// 標準差:開方((1-6.25)^2+(3-6.25)^2+(9-6.25)^2+(12-6.25)^2)/4)
// 樣本標準差:開方((1-6.25)^2+(3-6.25)^2+(9-6.25)^2+(12-6.25)^2)/(4-1))

var_dump(sqrt((pow(1-6.25, 2)+pow(3-6.25, 2)+pow(9-6.25,2)+pow(12-6.25,2))/4)); // float(4.4370598373247)
var_dump(sqrt((pow(1-6.25, 2)+pow(3-6.25, 2)+pow(9-6.25,2)+pow(12-6.25,2))/3)); // float(5.1234753829798)

標準差的計算其實就是對于方差結果開方后再除以數據的數量。它有兩種形式,一種是直接除以數量,一種是除以數量減一,分別就叫做 標準差 和 樣本標準差 。可以看到直接使用 stats_standard_deviation() ,并且指定它的第二個參數就可以方便地切換這兩種標準差的計算結果。并且比自己手寫的計算也方便很多。

平均偏差、調和平均數、階乘

平均偏差一般指的是數列中各項數值與其算術平均數的離差絕對值的算術平均數。我的天啊,這概念都讀得好繞口,學統計的小伙伴們你們過得還好嗎?當然,在 stats 擴展中一個函數就搞定了。

// 平均偏差
var_dump(stats_absolute_deviation([1,3, 9, 12])); // 4.25

// ((6.25-1)+(6.25-3)+(9-6.25)+(12-6.25))/4
//(5.25+3.25+2.75+5.75)/4 = 4.25

stats_absolute_deviation() 函數用于計算平均偏差,其實上面的概念就是我在注釋中寫的公式。每個數據減平均數之后的絕對值再除以數據數量就可以了,直接看公式是不是比上面的概念要清晰很多。同樣,我們再看下調和平均數。

// 調和平均數
var_dump(stats_harmonic_mean([1, 3, 9, 12])); // float(2.6181818181818)
// 4/(1/1+1/3+1/9+1/12) = 2.6181818181818

stats_harmonic_mean() 用于計算一組數據的調和平均數。從下面注釋的計算公式中可以看出來嗎?調和平均數就是每個數據倒數相加之后再使用數據數量除以倒數和得到的結果。

最后就來個輕松一點的,一個可以直接計算階乘結果的函數。

var_dump(stats_stat_factorial(6)); // float(720)
// 1*2*3*4*5*6 = 720

這個函數相信不用多解釋了吧。

峰度、偏度、累積正態分布函數、概率密度

這些概念其實我也沒有接觸過了。不過就是測試了一下函數代碼可以使用而已。相關的函數還有很多,比如我們這里只是與正態分布相關的一些函數,還有 F分布 、t分布 、柯西分布、卡方分布 等等相關的計算函數。我承認我只聽說過一兩個的名字,還有很多甚至連名字都沒聽說過。

// 峰度
var_dump(stats_kurtosis([1, 3, 9, 12])); // float(-1.6960846560847)

// 偏度
var_dump(stats_skew([1, 3, 9, 12])); // float(0.091222998923078)


// 返回正態分布的累積分布函數、其逆函數或其參數之一
var_dump(stats_cdf_normal(14,5,10, 1));
// 返回第一個參數的概率密度
var_dump(stats_dens_normal(14, 5, 10));

其它的各種分布相關計算的函數大家有需要的可以查閱相關的文檔,這里我就不強行上車了,上車了估計也得開溝里去。

總結

在沒有刷官方文檔前確實不知道我們 PHP 中都已經有這樣的擴展存在了,還在想如果真的要做類似的統計系統使用 PHP 一定很會麻煩,所以大家才會去選擇其它語言。其實這些擴展早就存在了。好不好用不說,但使用 PHP 來做這類統計系統的例子確實并不是太多,有需要的東西還是要自己多研究研究。而且這類計算其實都是各種公式的混合,相信在 Composer 中也有不少好用的框架可以供我們使用而不需要再到系統中單獨安裝擴展。

測試代碼:

https://github.com/zhangyue0503/dev-blog/blob/master/php/202012/source/10.學習PHP中統計擴展函數的使用.php

參考文檔:

https://www.php.net/manual/zh/book.stats.php

?著作權歸作者所有,轉載或內容合作請聯系作者
  • 序言:七十年代末,一起剝皮案震驚了整個濱河市,隨后出現的幾起案子,更是在濱河造成了極大的恐慌,老刑警劉巖,帶你破解...
    沈念sama閱讀 227,283評論 6 530
  • 序言:濱河連續發生了三起死亡事件,死亡現場離奇詭異,居然都是意外死亡,警方通過查閱死者的電腦和手機,發現死者居然都...
    沈念sama閱讀 97,947評論 3 413
  • 文/潘曉璐 我一進店門,熙熙樓的掌柜王于貴愁眉苦臉地迎上來,“玉大人,你說我怎么就攤上這事。” “怎么了?”我有些...
    開封第一講書人閱讀 175,094評論 0 373
  • 文/不壞的土叔 我叫張陵,是天一觀的道長。 經常有香客問我,道長,這世上最難降的妖魔是什么? 我笑而不...
    開封第一講書人閱讀 62,485評論 1 308
  • 正文 為了忘掉前任,我火速辦了婚禮,結果婚禮上,老公的妹妹穿的比我還像新娘。我一直安慰自己,他們只是感情好,可當我...
    茶點故事閱讀 71,268評論 6 405
  • 文/花漫 我一把揭開白布。 她就那樣靜靜地躺著,像睡著了一般。 火紅的嫁衣襯著肌膚如雪。 梳的紋絲不亂的頭發上,一...
    開封第一講書人閱讀 54,817評論 1 321
  • 那天,我揣著相機與錄音,去河邊找鬼。 笑死,一個胖子當著我的面吹牛,可吹牛的內容都是我干的。 我是一名探鬼主播,決...
    沈念sama閱讀 42,906評論 3 440
  • 文/蒼蘭香墨 我猛地睜開眼,長吁一口氣:“原來是場噩夢啊……” “哼!你這毒婦竟也來了?” 一聲冷哼從身側響起,我...
    開封第一講書人閱讀 42,039評論 0 285
  • 序言:老撾萬榮一對情侶失蹤,失蹤者是張志新(化名)和其女友劉穎,沒想到半個月后,有當地人在樹林里發現了一具尸體,經...
    沈念sama閱讀 48,551評論 1 331
  • 正文 獨居荒郊野嶺守林人離奇死亡,尸身上長有42處帶血的膿包…… 初始之章·張勛 以下內容為張勛視角 年9月15日...
    茶點故事閱讀 40,502評論 3 354
  • 正文 我和宋清朗相戀三年,在試婚紗的時候發現自己被綠了。 大學時的朋友給我發了我未婚夫和他白月光在一起吃飯的照片。...
    茶點故事閱讀 42,662評論 1 366
  • 序言:一個原本活蹦亂跳的男人離奇死亡,死狀恐怖,靈堂內的尸體忽然破棺而出,到底是詐尸還是另有隱情,我是刑警寧澤,帶...
    沈念sama閱讀 38,188評論 5 356
  • 正文 年R本政府宣布,位于F島的核電站,受9級特大地震影響,放射性物質發生泄漏。R本人自食惡果不足惜,卻給世界環境...
    茶點故事閱讀 43,907評論 3 345
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望。 院中可真熱鬧,春花似錦、人聲如沸。這莊子的主人今日做“春日...
    開封第一講書人閱讀 34,304評論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽。三九已至,卻和暖如春,著一層夾襖步出監牢的瞬間,已是汗流浹背。 一陣腳步聲響...
    開封第一講書人閱讀 35,563評論 1 281
  • 我被黑心中介騙來泰國打工, 沒想到剛下飛機就差點兒被人妖公主榨干…… 1. 我叫王不留,地道東北人。 一個月前我還...
    沈念sama閱讀 51,255評論 3 389
  • 正文 我出身青樓,卻偏偏與公主長得像,于是被迫代替她去往敵國和親。 傳聞我的和親對象是個殘疾皇子,可洞房花燭夜當晚...
    茶點故事閱讀 47,637評論 2 370

推薦閱讀更多精彩內容