1、極差
極差是描述變異的最簡單形式。極差等于最大值減去最小值:
極差=最大值-最小值
在早晨準備時間中,使用與時間有關的數據:
極差=最大值-最小值
極差=52-29=23(分鐘)
這一數值意味著兩天里在早晨準備時間差上最大是23分鐘。
在表1、圖1里訂單的完成時間數據中,極差是54.3分鐘。也就是說在兩個訂單的完成時間上最大的差值是54.3分鐘。
表1 使用Minitab計算完成時間的描述性統計
圖1 使用JMP計算完成時間的描述性統計量
2、方差和標準差
盡管極差可以衡量總的離散程度,但是極差并沒有考慮變量值是如何圍繞均值分布的。兩個常用的衡量所有變量值是如何繞均值分布的方法是方差和標準差。這兩個統計變量能衡量變量值是如何繞均值波動的。
一個簡單的對均值考察的方式是考慮每個值與均值的差異,然后把這些差異加起來。但是,如果我們這樣做的話會發現,因為均值是一系列數據的平衡點,對任何一個系列數據而言如果把這些差異加起來它們的和為零。一種衡量變異的方式是將每個值與均值的差值進行平方,再將平方和相加。在統計上這個數據叫做平方和,這一平方和除以變量個數減一(對樣本數據)就可以得到樣本方差。樣本方差的平方根就是樣本標準差(S)。這一統計方法是對于變異的最常用衡量方法。計算樣本方差和樣本標準差的步驟如下。
計算樣本均值S2步驟如下:
1、計算每個值與均值之間的差值;
2、對每個差值進行平方;
3、將差值的平方進行相加;
4、將所得的和除以n-1。
取樣本方差的平方根就是樣本標準差。
表2介紹了計算樣本方差和標準差的步驟,使用這一步驟計算早上準備時間數據(見表2)。我們可以發現個體值和均值間差值的總和是零。
表2 早上準備時間
計算樣本方差S2可以通過差值平方和(412.4)除以樣本個數(10)減1:
樣本方差(S2)=412.4/9=45.82
因為差值是以平方的形式,計算樣本標準差可以用樣本方差的平方根,因此:
對于表1和圖1中的訂單完成時間數據,標準差是10.411分鐘。怎樣去理解這個值呢?標準差可以幫助我們去知道一組數據是如何分布在均值周圍的。對于幾乎所有系列數據都有一個簡單的模型。大多數數據在均值的加減3標準差區間里面。因此知道均值和標準差通常可以幫助我們定義極差。對于訂單的完成時間數據,認為大多數完成時間在69.637±(3)×10.411或者38.404分鐘和100.87分鐘。
我們可以對極差、方差、標準差的性質做如下表述:
1、數據分布越分散,極差、方差、標準差的值越大;
2、數據分布越集中,極差、方差、標準差的值越小;
3、如果數據值相同(數據間沒有方差),數據分布越分散,極差、方差、標準差的值都為零;
4、極差、方差、標準差都會大于或者等于零。
上一篇:測量分析中四分位數的應用介紹
下一篇:什么是數據分布的形狀