參數(shù)估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的兩個(gè)重要方面。參數(shù)估計(jì)以“數(shù)”為輸出結(jié)果,假設(shè)檢驗(yàn)以“判斷”為輸出結(jié)果。以下描述了假設(shè)檢驗(yàn)步驟。
1.建立一個(gè)假設(shè)。
假設(shè)檢驗(yàn)的第一步是建立假設(shè),這通常需要兩個(gè)假設(shè):原始假設(shè)Ho和替代假設(shè)H1。
2.選擇檢驗(yàn)統(tǒng)計(jì)以確定被拒絕域的形式。
如果測(cè)試總休息的平均值,那么我們將使用樣本平均值來(lái)導(dǎo)出測(cè)試統(tǒng)計(jì)量;如果正態(tài)總體的方差被檢驗(yàn),我們將從樣本方差中導(dǎo)出檢驗(yàn)統(tǒng)計(jì)量。
根據(jù)統(tǒng)計(jì)量的值,將整個(gè)樣本空間分為拒絕域W和非拒絕域a兩部分,當(dāng)樣本統(tǒng)計(jì)量的值落在拒絕域時(shí),原假設(shè)將被拒絕,否則不能拒絕原假設(shè)。因此,在假設(shè)檢驗(yàn),我們必須找出被拒絕的域。
根據(jù)不同的替代假設(shè);拒絕域可以是雙邊的或單邊的。在確定了拒絕域的類型之后,也確定了臨界值。這要根據(jù)犯錯(cuò)誤的允許概率來(lái)確定。
3.在測(cè)試中給出顯著性水平A。
在判斷原假設(shè)是否成立時(shí),由于樣本的隨機(jī)性,可能會(huì)出現(xiàn)兩種錯(cuò)誤。第一種錯(cuò)誤是當(dāng)原假設(shè)為真時(shí),由于樣本的隨機(jī)性,樣本的觀測(cè)值落入拒絕域W,從而做出拒絕原假設(shè)的決策。這種誤差稱為第一種誤差,也稱為誤拒概率。
第二種錯(cuò)誤的解釋:如果鋼筋的平均抗拉強(qiáng)度真的比原來(lái)高,那么鋼筋的平均抗拉強(qiáng)度就不再是原來(lái)的2000公斤了,但是我們并沒有拒絕把Ho誤認(rèn)為沒有提高,也就是把“提高了”誤認(rèn)為“沒有提高”。一般來(lái)說(shuō),何鴻燊失敗的時(shí)候,我們沒有拒絕何鴻燊,這是第二種錯(cuò)誤。
4.給出臨界值,確定拒絕域。
有了顯著性水平A,我們就可以根據(jù)給定的測(cè)試統(tǒng)計(jì)量分布,查表得到臨界值,從而確定具體的拒絕域。在不同的替代假設(shè)下,拒絕域、臨界值和顯著性水平A之間的關(guān)系是不同的。其含義見下圖。
5.根據(jù)樣品的觀察值,計(jì)算檢驗(yàn)統(tǒng)計(jì)值。
根據(jù)樣品的觀察值,計(jì)算檢驗(yàn)統(tǒng)計(jì)值;收集樣本數(shù)據(jù)并計(jì)算檢驗(yàn)統(tǒng)計(jì)值。
6.根據(jù)檢驗(yàn)統(tǒng)計(jì)值是否屬于拒收字段進(jìn)行判斷。
①將檢驗(yàn)統(tǒng)計(jì)量的值與拒絕域的臨界值進(jìn)行比較,當(dāng)原假設(shè)落在拒絕域時(shí),作出拒絕原假設(shè)的結(jié)論,否則,作出不能拒絕原假設(shè)的結(jié)論。
②用檢驗(yàn)統(tǒng)計(jì)量計(jì)算P值。所謂P值,就是原假設(shè)成立時(shí)的當(dāng)前情況的概率(嚴(yán)格來(lái)說(shuō),當(dāng)前情況或更不利于原假設(shè)的情況,即更有利于替代假設(shè)的情況的概率)。當(dāng)這個(gè)概率很小時(shí)(例如小于0.05),在原假設(shè)成立的情況下,這個(gè)結(jié)果不應(yīng)該出現(xiàn)在實(shí)驗(yàn)中;但現(xiàn)在它確實(shí)出現(xiàn)了,所以我們有理由認(rèn)為“原假設(shè)為真”的前提是錯(cuò)誤的,所以我們應(yīng)該拒絕原假設(shè),接受替代假設(shè)。所以可以有一個(gè)普遍規(guī)律:如果p
③根據(jù)樣本的觀測(cè)值可以得到總體參數(shù)的置信區(qū)間。如果原假設(shè)的參數(shù)值不落入該置信區(qū)間,則作出拒絕原假設(shè)的結(jié)論,否則作出不能拒絕原假設(shè)的結(jié)論。目前大多數(shù)統(tǒng)計(jì)軟件都提供了相應(yīng)的置信區(qū)間,不需要自己計(jì)算,所以用這種方法判斷也很方便。