星期六, 2月 21, 2015

新年時輕鬆淺談



近年智能電話當道,即時通訊軟件如WhatsAppLineWeChat…已取代大部分的通電話功能,現在最常收到的來電不是廣告電話就是統計調查。統計中的一個環節是取樣,講求方法和數量。取樣方法有很多種,電話調查屬隨機抽樣。隨機抽樣簡單來說可分為四類:簡單隨機抽樣、機械隨機抽樣、分層隨機抽樣和整群隨機抽樣。簡單隨機(simple random sampling)抽樣即不規則地亂抽。系統隨機抽樣(systematic random sampling)即有規律地抽出樣本。分層隨機抽樣(stratified random sampling)即先將所有樣本分組,然後隨機抽出。整群隨機抽樣(cluster random sampling)即先將所有樣本分組,然後隨機抽出一組作為樣本。另外,取樣數量亦是重點,究竟要有多少樣本才算準確呢﹖基於人口數目非常大,估算值可視為正態分佈(normal distribution),樣本大小以其方程式計算。
 
Z值:信心程度的參數
信心區間:由樣本資料定義一段數值區間,宣稱有多少信心以估計母體的參數包含於此區間內。

例如:
信心程度 = 95% 即Z值:1.96
信心區間 = 3%
整體比率 = 0.5
樣本大小為1,067個

現在看一看一個實例:
香港研究協會2015129日至29日進行的《市民對利是錢及新年消費的意見調查(2015)》裡,有效問卷數目為1,085份。從有限資料中,我們可以推算出這個調查在誤差值3%下的可信程度達95%。那麼,調查的結論是否正確呢﹖且細看調查內容。是次調查目的乃比較近年結果以收集香港市民對利是錢及新年消費的意見及其變化,並了解經濟環境對市民新年消費行為的影響。調查結果分三個層面:利是錢數目、新年期間消費意慾及市民對加薪的預期。第一個層面(利是錢數目),新聞稿表示「市民今年派利是較為『手鬆』,惟增幅不及去年。」。不過,調查結果中表二數據的比較,各項的相差也不超過3%。若本年該問題的真實值與結果出現誤差,上年跟今年或者會是相同結果,即調查結果不能說明市民今年派利是較為「手鬆」。第二個層面(新年期間消費意慾),香港研究協會預計今年本地農曆新年消費增長將不及去年。新聞稿圖二中有三條曲線,簡單將今年的數字與上年比較,消費意慾差不多及減少不變,而增加的則下調三個巴仙。同樣地,調查結果未必能反映消費意慾的變化。第三個層面(市民對加薪的預期),據調查結果的表十二,35%受訪者認為今年會加薪,上升2%34%受訪者認為今年不會加薪,下調2%﹔無意見的佔31%,沒有改變。市民對加薪的預期的變化不能準確預測。
利用誤差值來檢視後,我們又試用樣本比例來看。該次調查之對象為15歲或以上香港市民,人數大約3,922,200個(以香港統計處20151月勞動人口數字作準),調查取樣數目乃整體勞動人口中的0.0277%。如果從這個比率來說,受訪的一小撮人又是否代表全部人呢﹖
當然,統計學是一門大學問,方法亦眾多。加上電話調查的限制很多,我也不是專家,解讀會有錯。
最後,新年期間,各位不如放下電話,拜年時與親戚好友交談和耍樂。即使拿起電話,也是交換電話或合照幾幀吧!

參考來源:
1. 香港研究協會網頁 http://www.rahk.org/
2.《市民對利是錢及新年消費的意見調查(2015)》結果 
3.《市民對利是錢及新年消費的意見調查(2015)》新聞稿 
4. 香港政府統計處勞動人口資料 http://www.censtatd.gov.hk/hkstat/sub/so200_tc.jsp