2010-06-11 10:32:31知識終結者

﹝市場調查022﹞雅虎奇摩民調中心,有精彩調查數據。

撰文:邱高生 2010/06/11  

看倌,筆者在此絕非在推銷雅虎奇摩這個民調中心,而是最近剛好有這樣的發現,在雅虎奇摩這個民調中心,確實有很多的精彩調查資料,雖然名為「民調中心」,卻是有很多很多跟消費生活有關的調查訪問,雅虎奇摩也算是有市場老大哥的風範,竟然可如此免費提供這樣的調查數據,讓網友們想怎麼看就怎麼看,一點兒也不吝嗇,從以前每次的調查結果都可查得到,包括每次調查的結果統計和交叉分析,以及投票者分析,而且還分類有時事投票、財經投票、影劇投票、運動投票、生活投票、網友建議投票等六大類,目前已累積有相當龐大的資料,而以其每天這樣累積的速度,資料應該可相當豐富,各領域可參考者應該相當多,就看如何運用與解讀了,尤其是在市場行銷的研究上,更是可用以分析之,雖然這是以「民調中心」為名,但這也有好處,消費者可在不經意的情況下,表達其消費行為和消費態度,甚至於是生活價值觀。

當然,一定有人會問,這樣的調查資料到底準不準,可用不可用,若是有人存心搗蛋,故意上來很多次亂填,那又該如何處理呢?筆者猜測雅虎奇摩應該會有處理這樣的問題,運用IP的偵測方法,也許同一個IP就只能投票一次,有人若亂投企圖想影響結果,大概不是那麼容易吧!或有人會這樣想,上雅虎奇摩的網友為什麼會那麼無聊,就這樣平白無故地投票,很難想像ㄋㄟ,而且這些願意上來投票的網友是不是具有某種特質,譬如說比較活躍外向關心很多事情,阿這樣會不會讓上來投票的樣本變成不滿足抽樣的隨機法則,也就是說上來投票的網友並沒有代表性(Representative),這就好比那媒體常公佈的民調,只做眷村的樣本,當然會有特定的結果,會不會這樣呢?諸如此類問題的思考,基本上是相當好的想法,凡具有市場調查素養者,在看任何的一份資料數據,一定會本能地Check這樣的資料是怎麼調查訪問「做」出來,筆者的看法是這樣,因雅虎奇摩這個入口網站相當大,每天幾乎住在台灣的網友都會上來逛逛,所以,其流量每天應該會有幾百萬,甚至於上千萬也不一定,可推想其會員應該有好幾百萬,所以這樣的民調題目只要PO上去,在這麼多會員網友中,只要看了有興趣,應該就會去填答,還可以隨時看結果,很容易就可以獲得很大的樣本,而也真的會有很多網友上來填答,從實際的數字論之,都會有好幾千個,算是極大的樣本,而根據統計的中央極限定理(Central Limit Theorem) ,只要隨機抽取的樣本足夠大,一般的說法是大於30的樣本,其抽樣分配(Sampling Distribution),不論原來母體的分配為何,這個抽樣分配都會是趨近於常態分配(Normal Distribution),這個意思也就是說,只要樣本足夠大,而且隨機產生,很多影響抽樣誤差的因素都可被排除掉,資料就會很穩定,但是否可解決調查樣本數代表性的問題呢?

中央極限定理當然有更為嚴謹的陳述,在此引用之也只是一種運用,實際上我們也可以用雅虎奇摩的調查驗證之,在2010年06月10日剛好有「請問你認同「一白遮三醜」嗎?」一道訪問題目PO上,在填答樣本數等於237時,認同的百分比為71.3%,在樣本數增至3339時,認同的百分比為73.1%,4243則為72.5%,4848為72.3%,統計機率的運用真的很奇妙,就如中央極限定理所論,當樣本數越大之時,抽樣分配會漸趨於穩定,但此一調查樣本雖然樣本數如此龐大,是不是有代表性,意即是否可用以推論母體,這可用那「投票者分析」的各基本變項的比例分佈與母體的相同變項做個檢定(Test),適合度檢定(Test Of Goodness)可也。從這個「一白遮三醜」的調查資料,就看整個母體是要設定在全國,或是全部網友,還是說對「一白遮三醜」關心度高的網友,若是母體設定在全國,或是全部網友,就有推論母體的事情要處理,若是針對「一白遮三醜」關心度高的網友,設為目標對象者,則可視為非參數統計之調查結果。所以,面對雅虎奇摩有這麼多豐富精彩的資料,要如何運用,當有運用的一番思考。