假說檢定

假說檢定（英語：hypothesis testing）是推論統計中用於檢定現有數據是否足以支持特定假設的方法。^[1]一旦能估計未知母數，就會希望根據結果對未知的真正母數值做出適當的推論。

欲檢定統計上假設的正確性的為虛無假說（Null hypothesis，記為 $H_{0}$ ），虛無假說通常由研究者決定，反映研究者對未知母數的看法。相對於虛無假說的其他有關母數之論述是對立假說（Alternative hypothesis，記為 $H_{a}$ 或 $H_{1}$ ），它通常反應了執行檢定的研究者對母數可能數值的另一種（對立的）看法（換句話說，對立假說通常才是研究者最想證明的）。

假說檢定的種類包括：t檢定，Z檢定，卡方檢定，F檢定等等。

說明

假說檢定的過程，可以用法庭的審理來說明。先想像現在法庭上有一名被告，假設該被告是清白的，而檢察官必須要提出足夠的證據去證明被告的確有罪。

在證明被告有罪前，被告是被假設為清白的。

假設被告清白的假設，就相當於虛無假說。
假設被告有罪的假設，則是對立假說。

而檢察官提出的證據，是否足以確定該被告有罪，則要經過檢定。這樣子的檢定過程就相當於用T檢定或Z檢定去檢視研究者所搜集到的統計資料。

檢定過程

在統計學的文獻中，假說檢定發揮了重要作用。假說檢定大致有如下步驟：

最初研究假設為真相不明。
提出相關的虛無假說和對立假說。
考慮檢定中對樣本做出的統計假設；例如，關於母體資料的分布形式或關於獨立性的假設。無效的假設將意味此檢定的結果是無效的。
選擇一個顯著水準（ $α$ ），若低於這個機率閾值，就拒絕虛無假說。最常用的是5%和1%。
選擇適合的檢定統計量（Test statistic）T。
在設定虛無假說為真下推導檢定統計量的分布。在標準情況下應該會得出一個熟知的結果。比如檢定統計量可能會符合常態分布或司徒頓t分布。
根據在虛無假說成立時的檢定統計量T分布，找到機率為顯著水準 (α)的區域，此區域稱為「拒絕域」(記作RR或CR)，即在虛無假說成立的前提下，落在拒絕域的機率只有α。
針對檢定統計量T，根據樣本計算其估計值t_obs。
若估計值t_obs未落在拒絕域，則「不拒絕」虛無假說（do no reject $H_{0}$ ）。若估計值t_obs落在拒絕域，則拒絕虛無假說，接受對立假說。

要注意的是一般不會將檢定結果稱作「接受」虛無假說，而是因沒有顯著證據證明虛無假說為非，所以「不拒絕」虛無假說。

例子

女士品茶是一個有關假說檢定的著名例子^[2]。統計學家費雪的一個女同事，也是藻類學家的繆麗·布里斯托（英語：Muriel Bristol），她聲稱可以判斷在奶茶中是先加入茶還是先加入牛奶。費雪提議給她八杯奶茶。繆麗已知其中四杯先加茶，四杯先加牛奶，但隨機排列，而她要說出這八杯奶茶中，哪些先加牛奶，哪些先加茶，檢定統計量（英語：Test statistic）是確認正確的次數。虛無假說是她無法判斷奶茶中的茶先加入還是牛奶先加入，對立假說為她有此能力。

若單純以機率考慮（即繆麗沒有判斷的能力）下，八杯都正確的機率為1/70（因為8選4的組合數是70），約1.43%，因此「拒絕域」為八杯的結果都正確。而測試結果為繆麗八杯的結果都正確^[3]，在統計上是相當顯著的的結果。也就是說，幾乎可以排除她只是恰好猜對結果的可能。

參考文獻

^ Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model (Edward Arnold) §20.2.
^ Fisher, Sir Ronald A. Mathematics of a Lady Tasting Tea. James Roy Newman (編). The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. 1956 [1935]. ISBN 978-0-486-41151-4. Originally from Fisher's book Design of Experiments.
^ Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.

[1] Stuart A., Ord K., Arnold S. (1999), Kendall's Advanced Theory of Statistics: Volume 2A—Classical Inference & the Linear Model (Edward Arnold) §20.2.

[fisher-2] Fisher, Sir Ronald A. Mathematics of a Lady Tasting Tea. James Roy Newman (編). The World of Mathematics, volume 3 [Design of Experiments]. Courier Dover Publications. 1956 [1935]. ISBN 978-0-486-41151-4. Originally from Fisher's book Design of Experiments.

[3] Box, Joan Fisher. R.A. Fisher, The Life of a Scientist. New York: Wiley. 1978: 134. ISBN 0-471-09300-9.

[1]

[2]

[3]

說明

檢定過程

例子

相關條目

參考文獻