各种抽样方法之选择、步骤跟优劣比较
各種抽樣方法之選擇、步驟及優劣
比較
一、簡介
調查之目的即在蒐集資料,由資料中獲得訊息,以對未知狀況或現象,加以瞭解,提供決策參據。調查方式可採普查或抽樣調查。普查:即對欲研究對象(母體)中每一份子均加以調查。抽樣調查:由所欲研究對象(母體)中抽取一部分份子(樣本),加以調查蒐集資料。
普查之優缺點與必要性:
1.普查優點:
(1)包羅母體中每一份子,最能陳示母體狀況。
(2)可做各細分特性之統計分析。
(3)不致產生抽樣誤差。
2.普查缺點:
(1)耗費大量人力,物力,財力。
(2)整理時間過長,統計結果常有過期之憾。
(3)調查問卷不易深入。
(4)易導致非抽樣誤差。
3.普查必要性:
(1)基本國勢之陳示。
(2)各種抽樣調查之母體。
(3)細分特性之陳示。
(4)各種抽樣調查估計之權數。
抽樣調查係自調查對象之母體中抽取一部份個體,加以觀察,然後再推估母體之現象。抽樣調查成為科學的調查方法,乃是由於推測統計理論的發展,加上近年來統計的重要性倍增,依據調查資料與現存事實進行之交叉分析結果頗獲各方關心,主要原因須歸功於統計在經濟發展中所發揮的功能,所以統計學中的抽樣調查不僅是一門學問,業已成為研究社會問題與經濟現象的主要工具之一。
1.抽樣之基本觀念
(1) 抽樣不過是一個方法、手段、其最終目標仍在推論。
(2) 對於各種抽樣方法,建立直覺的瞭解,以及探求其優點及
限制。
(3) 注意各種抽樣方法之觀念及使用時機。
(4) 不要見樹而不見林。(注意樣本之代表性)
2.抽樣之基本原則
(1) 所抽樣本能以代表母體。(代表性)
(2) 以樣本訊息估計母體之特性,要儘可能精確,並且可測度
其可信度(精確性)。
(3) 取樣成本要儘量少。(成本低)
(4) 配合不同之母體狀況及行政限制下,採取適宜方法(即考量
實務問題)。亦即如何達到快速、準確、具代表性而又能配合實務。(可行性)
→
→→→
4.抽樣調查優點
(1) 抽樣調查可節省人力與財力。
(2) 抽查可縮短調查與整理時間。
(3) 抽查所抽出之樣本可做更詳細之調查。
(4) 抽查可迅速獲得調查結果。
(5) 可配合研究特性與機動性之行政措施。
本章的概述最主要目的是作為導讀之用,期望讀者在念完本章節後對抽樣調查有些許初步的認識與興趣,並在往後各章內容中均有非常詳細的介紹。現在,就讓我們一同進入抽樣調查的世界裡,一探抽調的神奇之美。
二、抽樣方法之分類
抽樣方法分類:可粗分為非機率抽樣與機率抽樣。
(一)非機率抽樣:亦即樣本不按照其機率予以抽出,而是由抽
樣者之主觀抽出或自願樣本。
◆優點:在某些調查時,有其必要性。
◆缺點:(1)難以評斷樣本之代表性。
(2)無法估計精確度。
(3)樣本偏差往往較大。
◆非機率抽樣之種類:
1.便利樣本(偶然樣本)
事先不預定樣本,碰到即問或自動回答者。如街頭訪問或主動打電話回答問題者。缺點:注意樣本之偏激性及兩極化。
2.立意樣本(判斷樣本)
由抽樣者立意抽取之樣本。如民間代表、意見領袖、學者、專家或代表性之樣本。
3.滾式樣本(輻射樣本)
利用樣本尋找樣本,亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時機:可用於當樣本不易取得時,或針對特殊族群之調查。
4.配額樣本:
按母體某些特性予以配置樣本,但取樣時卻由調查員任意抽取。非機率抽樣有時雖然可予使用,惟在其結果之引用上,要特別注意,亦即其結果之參考性大於其實際之代表性。
(二)機率抽樣:抽取之樣本是按照樣本之機率隨機抽出。
◆優點:
1.樣本較具代表性。
2.可計算估計之精確度。
3.可隨不同之抽樣設計採取不同之抽樣方法。
4.隨之不同之抽樣方法,採取相互配合之估計方法。
◆機率抽樣之種類:
1.簡單隨機抽樣
不對母體加以任何修飾或分割,而使每一樣本均有相同之被抽中機率。
2.分層隨機抽樣
將母體按照某些特性,分成數個不重疊的組群,這些組群即稱為層,而再由各層分別抽取樣本。
3.系統抽樣
將母體之元素按順序編號後,有系統的每隔一定間隔抽取一個樣本之方法。
4.集體抽樣
將母體中相鄰近之個體排成為一集體,而以集體為抽樣單位,即每一抽樣單位為一集體之抽樣單位。
5.兩段集體抽樣
首先抽出一些樣本集體,再由樣本集體內抽出部分基本個體。
6.分層集體抽樣
將母體內之集體予以分層後,再由各層抽取樣本。
三、各種抽樣方法之適用時機、步驟及
估計量
(一)影響抽樣調查結果準確度的因素
為使抽樣估計值能達到估計全事物的目的,需考慮影響其準確的各種因素:
?原始資料的變異程度
?樣本數的大小
?抽樣方法
?分層抽樣法抽樣的不同
(二)估計值準確度構成的條件
?不偏性(unbiased ness)
? 有效性(efficiency) ? 充分性(sufficiency) ? 一致性(consistency)
1. 不偏性(unbiased ness)
定義E ()
,其中E 表示期望值。本定義即說明,統計量的期望值等於參數,這種性質叫做不偏性。舉例來說,假設某母體大小為N ,且母體平均為 ,今從母體內抽取出一組樣本n ,求得平均為Y ,若E Y () ,則Y 稱為 的不偏估計值。
2. 有效性(efficiency)
定義 2
12
2()()
;此定義的意思是說,若同時有二個統計
量(
1及
2),其中一個統計量的變異數較另一個統計量的變異數為小,則變異數小的那個統計量便具有「有效性」。舉例來說,假設母體平均值為 ,而估計 的統計量有中位數(median)及算術平均數(arithmetic mean),但因為前者的變異數大於後者的變異數,則算術平均數具「有效性」。
3. 充分性(sufficiency)
定義 (,,,)(,)(,,)Y Y h g Y Y n n 11
;此定義的意思是說,假設母體參數為 ,但若樣本統計量
可直接由樣本觀測值去估計,而與 無關,則叫
具有充份性。
4. 一致性(consistency)
定義lim n
;此定義的意思是說,當樣本大小n 趨近於無窮大( )時,統計量即等於參數,這種性質叫做符合一致性。例如,當n 增大為N 時,則所求得的Y 趨近於 ,亦即lim n Y
,故可知Y
具有一致性。
(三)估計的方法
在某些情況下,如所需的原始資料不易得到,或得到的資料所要花費的金錢、時間較多時,可用輔助變數(auxiliary variable or concomitant variable)y
i
,此類變數值的取得代價較低。舉例來說,目測值花費時間、金錢較評估估計值所費均少,估計得較
準確的估計值X,每個抽樣單位有兩個變數值(,)
x y
i i ,x
i
與y
i
之
間有相關(correlation)存在,母體總合Y必須已知。另外,估計值估計的方法有下列二種:(1)比率估計法(ratio estimation),和(2)迴歸估計法(regression estimation)。
(四)母體與參數及樣本與統計量
1. 母體與參數
同類個體的全部記錄集合一起,使組合成一個全體(aggregate),這個全體稱為母體(population),母體種類很多,表示其特徵的方法有「圖表法」、「常數法」等。利用常數法研究母體即由母體中計算出若干穩定常數,此等常數有介紹母體特性的作用稱為參數(parameters)包括有四類:
(1)測定母體趨中性:主要有算術平均、型量、中位數等。
(2)測定分散度:主要有變異數、均方、標準偏差。標準偏差()
愈大,則母體中所有個體間的變異愈大。
(3)測定偏歪度:主要有Fisher氏的
1
係數,E. S. Pearson氏
的b
1
係數。
(4)測定頻度分布的曲線峰度:常用有Fisher氏的
2
係數,及
Geary氏的W
n
係數。