2010-06-17 13:19:41知識終結者

﹝市場調查025﹞市場調查實務,交叉表分析的陷阱。



圖/文:邱高生 2010/06/17  

在市場調查的實務中,若是資料收集沒有問題,在量化的情況之下,資料的統計分析最簡單的就是百分比計算,也就是說在100個受訪者中會有多少比例勾選此一選項,不過,雖然如此簡單,也不需用到什麼高深的統計分析手法,卻也暗藏著相當多的陷阱,不可不慎而分析之,在此就舉圖一之例說明之,在圖一中的數據皆為假想之數據也,並非實際調查之結果,在圖一中的橫軸為年齡層,分為13-19、20-29、30-39、40-49、50-59、60-69共6個年齡層,每個年齡層的樣本數皆為100,一般在實際的市場調查中會有各種情況,包括樣本數小於30,或是各年齡層調查樣本數乃按個年齡層的人口比例分配之,在圖一的縱軸則為是否在過去三個月內吃過口香糖,應該有「吃過」和「沒吃過」,在此為了說明方便起見,我們只列出「吃過」這個選項的人數,同時也計算縱百分比 (Column Percentage)、橫百分比(Row Percentage),和總百分比(Total Percentage),也就是說在一個交叉表,我們通常都可以計算出這三種百分比,各有其不同的解釋意義,不可不慎察之。

縱的百分比,就圖一的數據我們要怎麼看,各年齡層都有個縱百分比,當然是要比較各年齡層間的比例大小,也就是那一個年齡層吃口香糖的比例最高,那一個年齡層的比例最小,是不是縱的百分比有隨著年齡層歲數增加而增加或是減少,若有這樣的結果出現,那就是一個很重要的發現,就以圖一為例,似乎沒有這種現象,並不是年紀越大就是吃口香糖的比例越高或越低,而是隨年齡的增加吃口香糖的比例會上升,到了30-39歲這一年齡層的90%最高,然後就隨著年齡層的再增加而下降,至60-69歲吃口香糖的比例就只剩下40%,看了這樣的資料,也許我們還可以這樣推想,若有70-79歲的數據,其比例應該會比40%小,主觀估計大約在30%,而8-12歲的小學生呢?吃口香糖的比例可能就是50%或60%這樣推想。這就是縱的百分比可用以看出的數據之意義,看縱的百分比,除了要注意那樣本數不可小於30之外,當然樣本數是越大越好,像圖一各年齡層都有100個樣本,遠大於30就相當好,若小於30的話,也不是說這數據就不可用,而是要更謹慎注意其穩定度就是了,在此也要注意,若橫軸是如職業別這種類別變項,就不可能如年齡層分析出現這種隨著年齡層增加上升或下降的現象。另外要特別注意的是,這種縱的百分比在組間之比較,就如圖一這樣年齡層之間(組間)的比較,基本上這是一種相對「強度」的比較,在圖一中我們也只能這樣下結論各年齡層吃口香糖的比例如何又如何,我們不可下這種結語,30-39歲這個年齡層吃口香糖的人最多,這就誤解讀了此一比例的數據,若30-49的人口有100萬人,而40-49歲的人口有200萬人,結果就是吃口香糖的人口在30-39歲會有90萬的人口,40-49歲會有160萬人,所以,我們不能光看縱的百分比之大小就下這種結語「30-39歲這個年齡層吃口香糖的人最多」,要下這種結語一定要反推回去看其背後所代表的母體數會有多大,方可下斷言。

更直接地說,縱的百分比就是一個比例,只能看出市場的強度,不能看出市場的大小,想知道市場的大小,就是要麻煩一點,反推算一下,就有可能會發現,市場的強度和市場的大小會一樣,也有可能會不一樣,這兩者並沒有必然的關係。以上所論這種現象,也意味著縱的百分比可以用以推算市場的大小,而用縱的百分比看市場的強度和市場的大小,其實也是很簡單的道理,再舉一例說明之,在富有高所得的人口中開雙B的比例,可能會高於一般中產階層開TOYOTA的比例,但比人口數,開TOYOTA的人口一定比開雙B來得多。再論那圖一的縱百分比,最左邊的總計那一欄,6個年齡層總樣本數為600,「在過去三個月內吃過口香糖」的人數有410,其比例為68.3%,這個數據一般也可以當作平均數,各年齡層的比例大小也可以看看是高於此一數據,或是低於此一數據,也可以這樣轉換,就13-19歲的70.0%論之,將70.0%除以68.3%再乘以100,即可得102.5,也就是當68.3%為100時,70.0%會是102.5,這樣就比較容易看出離平均數68.3%會有多遠,當然此一轉換也可用以進一步的不同變項間的比較分析。

以上大約是縱的百分比最常用到的分析,很簡單,但不將其中的道理釐清,也是會掉入其陷阱,至於說圖一那橫向的百分比,一般在看交叉表大部份都看縱的百分比,若縱的百分比能看得清楚,大概也就OK了,這是因為,橫的百分比在處理上會比較麻煩,就以圖一來說,各年齡層橫的百分比相加會等於100.0%,當然這也是因為各年齡層吃口香糖的人數除以總人數410所得之必然結果,像這種組內的百分比大小,在下結語時不能光看百分比大小就說什麼,如果說圖一各年齡層的訪問樣本數是按人口比例分配,而不是如現在都是100,那這個橫的百分比就會有意義,在這種情況下我們就可以比較組內的百分比大小,而且就是各年齡層所佔的市場之大小比例,所以,在圖一中橫的百分比就要重新調整,首先先將各100的樣本數按人口比例計算,就以13-19為基準,13-19歲假如是有100萬人口,我們訪問100人有70人吃口香糖,假如20-29歲有200萬人口,所以理論上而言我們要訪問200人,就以訪問100人就會有80人吃口香糖,那訪問200人應該會有160人,就用這樣的方法調整出各年齡層吃口香糖的人數,假如是70、160、180、150、120、90,然後再重新算各年齡層橫的百分比,為9.1%、20.8%、23.4%、19.5%、15.6%、11.7%,所以當各年齡層的調查樣本數是按人口比例分配之,就不用這樣調整,而圖一的橫百分比經這樣調整後就會變得有意義,同時也可以說是各年齡層吃口香糖佔市場的大小,故橫百分比這種組內的比較,若已調整「正確」,也可以說是絕對值,而那縱的百分比是不用調整,但為市場強度的相對值就是了。

最後就是那個總的百分比,在實務上相較於縱百分比和橫百分比就更少分析之,當然是可用以分析整個市場結構,還是其他可能之分析,亦不可忽略也。在圖一中若各年齡層訪問的樣本是按人口比例分配,而不是現在的均一為100,那各年齡層這個總的吃口香糖的比例,我們就可以這樣說,13-19歲吃口香糖的人佔全體13-69人口的多少比例,但圖一各年齡層的訪問樣本並不是按人口比例分配,那就要如橫百分比那樣調整,然後再重新計算,跟橫的百分比一樣很麻煩,但「正確」總的百分比,我們至少可以用整體為基準(不論有沒有吃口香糖),那個年齡層吃口香糖佔比為多少。總之,一個交叉表,雖然很簡單,但也有一些分析的道理,若不弄清楚,分析的陷阱還是蠻多的,不可不慎也!