2022-03-20 11:45:50解讀統計與研究譯者

為何執行一個ANOVA所發生的多重檢定不校正顯著水準?

一份研究或一系列研究會有多個統計檢定 為了避免誇大的第一類型錯誤機率 會使用邦弗朗尼校正來校正顯著水準 但是讀者有沒有發現 像是變異數分析(ANOVA)之流所發生的多個檢定 都是默然地使用了0.05的顯著水準 這是什麼道理? 讓我們看一下筆者譯作"一位耶魯大學教授的統計箴言"裡的一段話:

在另一個極端方面,最寬鬆自由的策略是建立每100檢定tests)有5次錯誤的機率,這允許了眾多的可能錯誤宣告。任一種極端策略都不特別吸引人;最佳辯護論據都在依靠另一個極端的愚蠢性。

    對於這種策略的兩難並沒有統一的答案,而不同的常規作法緊跟著不同類型的分析。在設計去檢定兩個或更多主要效果,以及一些交互作用的多向變異數分析裡,標準作法是應用相同的顯著水準,通常是0.05,於每一個效果,忽略檢定的增生。這種極端自由的作法與其他案例裡較為保守的實務並不一致,但大多數研究者想都沒想就遵循這個常規。如果真的要為這種策略提出辯護,大概有兩個重點:第一,多向設計通常只在先前研究建立了需要研究的現象之後才執行;因此,總體無真實效果的虛無假設危機會比它通常情況下要來得小。第二,研究者通常只對一小搓特定的效果感興趣;如果變異數分析表格呈現許多線條時,四散的效果加上感興趣的效果,可能很容易就擊敗0.05的顯著水準,但研究者不應該竭盡全力去詮釋它們。在執行研究之前,建立清楚的分析焦點,可以削弱多重性議題的怪異。

看了以上的陳述之後 希望讀者都能安心睡好覺了

上一篇:顯著水準一二