2010-06-07 13:52:39知識終結者

﹝市場調查018﹞量化分析,為何樣本數要大於等於30?



圖/文:邱高生 2010/06/07  

這是一個相當令人困惑的問題,為何在量化分析之時,樣本數一定要至少30個,當然是越多越好,但越多所增加的分析效益是不是也會隨之成正比地增加,似乎也未必如此,而是隨之遞減吧!到底是誰規定這至少30個樣本的量化分析法則?為什麼不是40個,還是說20個,就一定是30,這其中總要有一番說得通的道理,當然在統計的書上應該會有所論,但複雜而高深的統計推導過程及那公式,若非訓練有素的數理能力,恐怕也不一定會看得懂,筆者在研究多年此一問題之後,發現我們可如此簡單易懂地解釋之,如圖一所示,找到的f(n)=1/n這個函數,n為自然數,也就是說橫軸是樣本數n,相對應於縱軸則為橫軸n的倒數1/n,就這樣可畫出如圖一f(n)=1/n函數的示意圖,所謂示意圖,其意在於表達其中的意義之要點,並不是將此一函數圖的原貌畫出,也就是意思到就好了之意思也。

在圖一我們可以這樣看,當我們在作量化分析的時候,若樣本數為最極端的1個,這時這一個受訪者的反應,以樣本數為分母,將使得統計的結果,不是0%就是100%,所以資料的跳動相當大,不是0%就是100%,就測量的信度(Reliability)而論之,這種資料的穩定度相當低,非常非常不穩定,所以,當我們用n=2為分母,也就是樣本數為2,這時統計的結果會比1個樣本的狀況好很多,資料的穩定度會在0%和50%之間跳動,也就是說這2個樣本中任何一個影響統計結果是在0%或是50%,此雖然比之n=1有大幅改善,但也是相當令人不滿意,到n=10之時,一個樣本的影響資料統計的穩定度最大則為10%,n=20,則為5%,到了n=30,則為3.3%,之後在n=40,則為2.5%,n=50則為2.0%,n=100則為1.0%,當n=1000則為0.1%,當n=2000則為0.05%,以此類推,我們就可以發現隨著樣本數由1一個一個地增加,1個樣本會影響統計資料跳動的力量,剛開始會很大,後來會漸漸地變小,到了n=30的3.3%,應該最為適當,再來每增加1個樣本,其讓資料越穩定的貢獻力也就越小,例如n=40,比之n=30多了10個樣本,其增加的分析之穩定效益也才0.5%,再看n=1000和2000的比較則更為清楚,多增加1000個樣本,對資料穩定度的貢獻也才增加0.05%,所以,在量化研究分析資料的時候,樣本數n通常會以30為一個標準,因為之後即使再多增加樣本其對資料分析結果的穩定度之貢獻也會越來越小,在實務實際的統計運用上,一定會有人力財力物力和時間的限制,不可能只為增加0.01%的效益而花費太大,而在統計分析時,我們也常看到這樣的說法,「在95%的信賴水準之下,抽樣誤差不大於3.0%」,這3.0%與n=30的3.3%相當接近,故,我們在量化分析的時候,或者說在作非參數統計分析之時,以樣本數為分母應該至少為n=30,再多一些如40或50還是60也都ok,但沒有必要只為求分析資料的穩定度而刻意做很大很的樣本。

有了這樣的概念,在實務上的運用,有時收集的樣本能有20個,甚至於10個,那是不是就不能用了,當然不是,在市場調查實務運用上,有時能收集到10或20個樣本,由於樣本特殊,也算是是難能可貴,例如在一個2000份的市場調查中只收集到飲用嘉士伯啤酒10個樣本,真的是很難收集到的樣本,當然要分析之,但在分析之時就是要有這樣概念放在心中,一個樣本的影響將有10%的跳動,也就是資料統計的穩定度並不高,另外,在量化分析時會遇到n=30不足的問題,乃在多層交叉分析之時,在一個2000份全省大調查後的資料分析,當我們取住台北市的女生有在喝某種飲料的USER,萬一那種飲料在市場上的佔有率很小,這時三層的交叉分析就會遇到樣本數n小於30的問題,所以一個量化的市場調查,當我們要分析更細的交叉,若有此必要的話,因市場區隔越來越細,調查樣本增加至3000乃有可能,甚至於更多也不一定,但此時並不是考慮整個調查之抽樣誤差能比1068下降多少,而是考慮在多層交叉分析時,樣本數n會不會小於30。

Allen 2018-03-22 11:04:44

通常我們在做社會科學研究老師也都跟我們說一組(一個版本)的問卷最少要收30個
但是有比較外行的老師會質疑說最小樣本數的估算明明是384個(可參考這個最小樣本數公式: http://finalfrank.pixnet.net/blog/post/32062797-%5B%E7%B5%B1%E8%A8%88%E5%AD%B8%5D-%E8%B3%87%E6%96%99%E8%A6%81%E8%92%90%E9%9B%86%E5%88%B0%E4%BB%80%E9%BA%BC%E6%99%82%E5%80%99----%E6%89%80%E9%9C%80%E6%A8%A3%E6%9C%AC),這到底要怎麼跟他們解釋才是?謝謝回答!

版主回應
Allen你好,
不好意思,
看你留言日期押在20180322
顯然我已經快一年沒上來這裡看了
你所提的事可嘗試用信度和效度的觀點說說看
這樣本數只是處理調查研究的信度而已
並未涉及效度
雖然沒有信度就一定沒有效度
有了信度也不一定有效度
2019-02-17 02:23:59