各种抽样方法之选择、步骤跟优劣比较

各種抽樣方法之選擇、步驟及優劣

比較

一、簡介

調查之目的即在蒐集資料，由資料中獲得訊息，以對未知狀況或現象，加以瞭解，提供決策參據。調查方式可採普查或抽樣調查。普查：即對欲研究對象(母體)中每一份子均加以調查。抽樣調查：由所欲研究對象(母體)中抽取一部分份子(樣本)，加以調查蒐集資料。

普查之優缺點與必要性：

1.普查優點：

(1)包羅母體中每一份子，最能陳示母體狀況。

(2)可做各細分特性之統計分析。

(3)不致產生抽樣誤差。

2.普查缺點：

(1)耗費大量人力，物力，財力。

(2)整理時間過長，統計結果常有過期之憾。

(3)調查問卷不易深入。

(4)易導致非抽樣誤差。

3.普查必要性：

(1)基本國勢之陳示。

(2)各種抽樣調查之母體。

(3)細分特性之陳示。

(4)各種抽樣調查估計之權數。

抽樣調查係自調查對象之母體中抽取一部份個體，加以觀察，然後再推估母體之現象。抽樣調查成為科學的調查方法，乃是由於推測統計理論的發展，加上近年來統計的重要性倍增，依據調查資料與現存事實進行之交叉分析結果頗獲各方關心，主要原因須歸功於統計在經濟發展中所發揮的功能，所以統計學中的抽樣調查不僅是一門學問，業已成為研究社會問題與經濟現象的主要工具之一。

1.抽樣之基本觀念

(1) 抽樣不過是一個方法、手段、其最終目標仍在推論。

(2) 對於各種抽樣方法，建立直覺的瞭解，以及探求其優點及

限制。

(3) 注意各種抽樣方法之觀念及使用時機。

(4) 不要見樹而不見林。(注意樣本之代表性)

2.抽樣之基本原則

(1) 所抽樣本能以代表母體。(代表性)

(2) 以樣本訊息估計母體之特性，要儘可能精確，並且可測度

其可信度(精確性)。

(3) 取樣成本要儘量少。(成本低)

(4) 配合不同之母體狀況及行政限制下，採取適宜方法(即考量

實務問題)。亦即如何達到快速、準確、具代表性而又能配合實務。(可行性)

→

→→→

4.抽樣調查優點

(1) 抽樣調查可節省人力與財力。

(2) 抽查可縮短調查與整理時間。

(3) 抽查所抽出之樣本可做更詳細之調查。

(4) 抽查可迅速獲得調查結果。

(5) 可配合研究特性與機動性之行政措施。

本章的概述最主要目的是作為導讀之用，期望讀者在念完本章節後對抽樣調查有些許初步的認識與興趣，並在往後各章內容中均有非常詳細的介紹。現在，就讓我們一同進入抽樣調查的世界裡，一探抽調的神奇之美。

二、抽樣方法之分類

抽樣方法分類：可粗分為非機率抽樣與機率抽樣。

(一)非機率抽樣：亦即樣本不按照其機率予以抽出，而是由抽

樣者之主觀抽出或自願樣本。

◆優點：在某些調查時，有其必要性。

◆缺點：(1)難以評斷樣本之代表性。

(2)無法估計精確度。

(3)樣本偏差往往較大。

◆非機率抽樣之種類：

1.便利樣本(偶然樣本)

事先不預定樣本，碰到即問或自動回答者。如街頭訪問或主動打電話回答問題者。缺點：注意樣本之偏激性及兩極化。

2.立意樣本(判斷樣本)

由抽樣者立意抽取之樣本。如民間代表、意見領袖、學者、專家或代表性之樣本。

3.滾式樣本(輻射樣本)

利用樣本尋找樣本，亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時機：可用於當樣本不易取得時，或針對特殊族群之調查。

4.配額樣本：

按母體某些特性予以配置樣本，但取樣時卻由調查員任意抽取。非機率抽樣有時雖然可予使用，惟在其結果之引用上，要特別注意，亦即其結果之參考性大於其實際之代表性。

(二)機率抽樣：抽取之樣本是按照樣本之機率隨機抽出。

◆優點：

1.樣本較具代表性。

2.可計算估計之精確度。

3.可隨不同之抽樣設計採取不同之抽樣方法。

4.隨之不同之抽樣方法，採取相互配合之估計方法。

◆機率抽樣之種類：

1.簡單隨機抽樣

不對母體加以任何修飾或分割，而使每一樣本均有相同之被抽中機率。

2.分層隨機抽樣

將母體按照某些特性，分成數個不重疊的組群，這些組群即稱為層，而再由各層分別抽取樣本。

3.系統抽樣

將母體之元素按順序編號後，有系統的每隔一定間隔抽取一個樣本之方法。

4.集體抽樣

將母體中相鄰近之個體排成為一集體，而以集體為抽樣單位，即每一抽樣單位為一集體之抽樣單位。

5.兩段集體抽樣

首先抽出一些樣本集體，再由樣本集體內抽出部分基本個體。

6.分層集體抽樣

將母體內之集體予以分層後，再由各層抽取樣本。

三、各種抽樣方法之適用時機、步驟及

估計量

(一)影響抽樣調查結果準確度的因素

為使抽樣估計值能達到估計全事物的目的，需考慮影響其準確的各種因素：

?原始資料的變異程度

?樣本數的大小

?抽樣方法

?分層抽樣法抽樣的不同

(二)估計值準確度構成的條件

?不偏性(unbiased ness)

? 有效性(efficiency) ? 充分性(sufficiency) ? 一致性(consistency)

1. 不偏性(unbiased ness)

定義E ()

，其中E 表示期望值。本定義即說明，統計量的期望值等於參數，這種性質叫做不偏性。舉例來說，假設某母體大小為N ，且母體平均為，今從母體內抽取出一組樣本n ，求得平均為Y ，若E Y () ，則Y 稱為的不偏估計值。

2. 有效性(efficiency)

定義 2

2()()

；此定義的意思是說，若同時有二個統計

量(

1及

2)，其中一個統計量的變異數較另一個統計量的變異數為小，則變異數小的那個統計量便具有「有效性」。舉例來說，假設母體平均值為，而估計的統計量有中位數(median)及算術平均數(arithmetic mean)，但因為前者的變異數大於後者的變異數，則算術平均數具「有效性」。

3. 充分性(sufficiency)

定義 (,,,)(,)(,,)Y Y h g Y Y n n 11

；此定義的意思是說，假設母體參數為，但若樣本統計量

可直接由樣本觀測值去估計，而與無關，則叫

具有充份性。

4. 一致性(consistency)

定義lim n

；此定義的意思是說，當樣本大小n 趨近於無窮大( )時，統計量即等於參數，這種性質叫做符合一致性。例如，當n 增大為N 時，則所求得的Y 趨近於，亦即lim n Y

，故可知Y

具有一致性。

(三)估計的方法

在某些情況下，如所需的原始資料不易得到，或得到的資料所要花費的金錢、時間較多時，可用輔助變數(auxiliary variable or concomitant variable)y

，此類變數值的取得代價較低。舉例來說，目測值花費時間、金錢較評估估計值所費均少，估計得較

準確的估計值X，每個抽樣單位有兩個變數值(,)

x y

i i ，x

與y

之

間有相關(correlation)存在，母體總合Y必須已知。另外，估計值估計的方法有下列二種：(1)比率估計法(ratio estimation)，和(2)迴歸估計法(regression estimation)。

(四)母體與參數及樣本與統計量

1. 母體與參數

同類個體的全部記錄集合一起，使組合成一個全體(aggregate)，這個全體稱為母體(population)，母體種類很多，表示其特徵的方法有「圖表法」、「常數法」等。利用常數法研究母體即由母體中計算出若干穩定常數，此等常數有介紹母體特性的作用稱為參數(parameters)包括有四類：

(1)測定母體趨中性：主要有算術平均、型量、中位數等。

(2)測定分散度：主要有變異數、均方、標準偏差。標準偏差()

愈大，則母體中所有個體間的變異愈大。

(3)測定偏歪度：主要有Fisher氏的

係數，E. S. Pearson氏

的b

係數。

(4)測定頻度分布的曲線峰度：常用有Fisher氏的

係數，及

Geary氏的W

係數。