隨著樣本量的增加,無(wú)論個(gè)體值組成的總體的分布形狀如何,均值的抽樣分布都可以用正態(tài)分布來(lái)表示。
圖1顯示了三個(gè)不同群體平均值的抽樣分布。對(duì)于每個(gè)群體,樣本量有三種可能性:3、5和30。樣本平均值的樣本分布如圖所示:
圖l 對(duì)不同總體的均值的抽樣分布
在圖1中,描述了正態(tài)分布平均值的樣本分布。當(dāng)總體為正態(tài)分布時(shí),樣本均值的抽樣分布是正態(tài)的,與樣本大小無(wú)關(guān)。隨著樣本量的增加,樣本間的均值差會(huì)變小。原因是隨著樣本量的增加,異常個(gè)體值對(duì)單個(gè)樣本平均值的影響變小。
第1b部分描述了均勻分布類(lèi)型的總體抽樣分布。當(dāng)樣本量n為2時(shí),分布存在峰值或中心趨勢(shì),中心附近樣本平均值較多。當(dāng)樣本量n為5時(shí),抽樣分布呈鐘形,接近正態(tài)分布。當(dāng)樣本量n為30時(shí),抽樣分布將非常接近正態(tài)分布。一般來(lái)說(shuō),樣本空間越大,抽樣分布越接近正態(tài)分布。與上面的例子一樣,每個(gè)樣本分布的平均值等于整個(gè)總體的平均值,并且隨著樣本空間的增加,差異將變得更小。
圖1c描繪了右偏斜指數(shù)分布的采樣分布。當(dāng)n等于2時(shí),抽樣分布仍明顯向右偏斜,但偏斜度小于總體分布。當(dāng)n等于5時(shí),采樣分布幾乎對(duì)稱(chēng),只有輕微的右偏。當(dāng)n等于30時(shí),抽樣分布接近正態(tài)分布。抽樣分布的均值等于總體均值,變異程度隨著樣本空間的增大而減小。
這些統(tǒng)計(jì)分布中呈現(xiàn)的結(jié)果使天行健管理咨詢(xún)公司能夠得出圖2中列出的結(jié)論:
圖2 均值的抽樣分布
2.比例抽樣分布
最簡(jiǎn)單的質(zhì)量數(shù)據(jù)是數(shù)據(jù)中的任何變量都可以分為兩類(lèi)的數(shù)據(jù)。例如,每一種發(fā)生的概率都服從二項(xiàng)分布。然而,當(dāng)平均事件數(shù)和平均不發(fā)生事件數(shù)分別至少為5時(shí),我們可以用正態(tài)分布來(lái)估計(jì)二項(xiàng)式分布。在大多數(shù)情況下,當(dāng)我們從樣本中推斷群體的特征時(shí),樣本的大小通常不足以滿足正態(tài)分布估計(jì)。
上一篇:什么是抽樣分布
下一篇:置信區(qū)間的基本概念