箱形圖五要素
(1)中位數
中位數,即二分之一分位數。所以計算的方法就是將一組數據(此處中位數,特別指是從大到小排列的有序序列)按從小到大的順序,取中間這個數。
如果原始序列長度n是奇數,那么中位數所在位置是(n+1)/2;
如果原始序列長度n是偶數,那么中位數所在位置是n/2,n/2+1,中位數的值等于這兩個位置的數的算數平均數。
2)上四分位數Q1?
確定四分位數的位置。Qi所在位置=i(n+1)/4,其中i=1,2,3。n表示序列中包含的項數。
舉個例子,有有序序列一個test = c(1,2,3,4,5,6,7,8),通過summary(test)來獲取test這個序列的中位數,上四分位數,下四分位數以及算數平均值。
這個Q1=2.75是怎么計算出來的呢?首先序列長度n=8,(1+n)/4=2.25,這是什么意思呢?說明上四分位數在第2.25個位置數,實際上這個數是不存在的,但我們知道這個位置是在第2個數與第3個數之間的。
(3)下四分位數Q3
這個下四分位數所在位置計算方法同上,只不過是(1+n)/4*3=6.75,這個是個介于第六個位置與第七個位置之間的地方。對應的具體的值是0.75*6+0.25*7=6.25。
4、上限
上限是非異常范圍內的最大值。
首先要知道什么是四分位距如何計算的?
四分位距IQR=Q3-Q1,那么上限=Q3+1.5IQR
5、下限
下限是非異常范圍內的最小值。
下限=Q1-1.5IQR
目前我們文章中看到的這兩個T形的盒須就是內限。上面的T形線段所延伸到的極遠處,是Q3+1.5IQR(其中,IQR=Q3-Q1)與剔除異常值后的極大值兩者取最小,下面的T形線段所延伸到的極遠處,是Q1-1.5IQR與剔除異常值后的極小值兩者取最大。
外限與內限的計算方法相同,唯一的區別就在與:上面的T形線段所延伸到的極遠處,是Q3+3IQR(其中,IQR=Q3-Q1)與剔除異常值后的極大值兩者取最小,下面的T形線段所延伸到的極遠處,是Q1-3IQR與剔除異常值后的極小值兩者取最大。