各种抽样方法之选择、步骤跟优劣比较

各种抽样方法之选择、步骤跟优劣比较
各种抽样方法之选择、步骤跟优劣比较

各種抽樣方法之選擇、步驟及優劣

比較

一、簡介

調查之目的即在蒐集資料,由資料中獲得訊息,以對未知狀況或現象,加以瞭解,提供決策參據。調查方式可採普查或抽樣調查。普查:即對欲研究對象(母體)中每一份子均加以調查。抽樣調查:由所欲研究對象(母體)中抽取一部分份子(樣本),加以調查蒐集資料。

普查之優缺點與必要性:

1.普查優點:

(1)包羅母體中每一份子,最能陳示母體狀況。

(2)可做各細分特性之統計分析。

(3)不致產生抽樣誤差。

2.普查缺點:

(1)耗費大量人力,物力,財力。

(2)整理時間過長,統計結果常有過期之憾。

(3)調查問卷不易深入。

(4)易導致非抽樣誤差。

3.普查必要性:

(1)基本國勢之陳示。

(2)各種抽樣調查之母體。

(3)細分特性之陳示。

(4)各種抽樣調查估計之權數。

抽樣調查係自調查對象之母體中抽取一部份個體,加以觀察,然後再推估母體之現象。抽樣調查成為科學的調查方法,乃是由於推測統計理論的發展,加上近年來統計的重要性倍增,依據調查資料與現存事實進行之交叉分析結果頗獲各方關心,主要原因須歸功於統計在經濟發展中所發揮的功能,所以統計學中的抽樣調查不僅是一門學問,業已成為研究社會問題與經濟現象的主要工具之一。

1.抽樣之基本觀念

(1) 抽樣不過是一個方法、手段、其最終目標仍在推論。

(2) 對於各種抽樣方法,建立直覺的瞭解,以及探求其優點及

限制。

(3) 注意各種抽樣方法之觀念及使用時機。

(4) 不要見樹而不見林。(注意樣本之代表性)

2.抽樣之基本原則

(1) 所抽樣本能以代表母體。(代表性)

(2) 以樣本訊息估計母體之特性,要儘可能精確,並且可測度

其可信度(精確性)。

(3) 取樣成本要儘量少。(成本低)

(4) 配合不同之母體狀況及行政限制下,採取適宜方法(即考量

實務問題)。亦即如何達到快速、準確、具代表性而又能配合實務。(可行性)

→→→

4.抽樣調查優點

(1) 抽樣調查可節省人力與財力。

(2) 抽查可縮短調查與整理時間。

(3) 抽查所抽出之樣本可做更詳細之調查。

(4) 抽查可迅速獲得調查結果。

(5) 可配合研究特性與機動性之行政措施。

本章的概述最主要目的是作為導讀之用,期望讀者在念完本章節後對抽樣調查有些許初步的認識與興趣,並在往後各章內容中均有非常詳細的介紹。現在,就讓我們一同進入抽樣調查的世界裡,一探抽調的神奇之美。

二、抽樣方法之分類

抽樣方法分類:可粗分為非機率抽樣與機率抽樣。

(一)非機率抽樣:亦即樣本不按照其機率予以抽出,而是由抽

樣者之主觀抽出或自願樣本。

◆優點:在某些調查時,有其必要性。

◆缺點:(1)難以評斷樣本之代表性。

(2)無法估計精確度。

(3)樣本偏差往往較大。

◆非機率抽樣之種類:

1.便利樣本(偶然樣本)

事先不預定樣本,碰到即問或自動回答者。如街頭訪問或主動打電話回答問題者。缺點:注意樣本之偏激性及兩極化。

2.立意樣本(判斷樣本)

由抽樣者立意抽取之樣本。如民間代表、意見領袖、學者、專家或代表性之樣本。

3.滾式樣本(輻射樣本)

利用樣本尋找樣本,亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時機:可用於當樣本不易取得時,或針對特殊族群之調查。

4.配額樣本:

按母體某些特性予以配置樣本,但取樣時卻由調查員任意抽取。非機率抽樣有時雖然可予使用,惟在其結果之引用上,要特別注意,亦即其結果之參考性大於其實際之代表性。

(二)機率抽樣:抽取之樣本是按照樣本之機率隨機抽出。

◆優點:

1.樣本較具代表性。

2.可計算估計之精確度。

3.可隨不同之抽樣設計採取不同之抽樣方法。

4.隨之不同之抽樣方法,採取相互配合之估計方法。

◆機率抽樣之種類:

1.簡單隨機抽樣

不對母體加以任何修飾或分割,而使每一樣本均有相同之被抽中機率。

2.分層隨機抽樣

將母體按照某些特性,分成數個不重疊的組群,這些組群即稱為層,而再由各層分別抽取樣本。

3.系統抽樣

將母體之元素按順序編號後,有系統的每隔一定間隔抽取一個樣本之方法。

4.集體抽樣

將母體中相鄰近之個體排成為一集體,而以集體為抽樣單位,即每一抽樣單位為一集體之抽樣單位。

5.兩段集體抽樣

首先抽出一些樣本集體,再由樣本集體內抽出部分基本個體。

6.分層集體抽樣

將母體內之集體予以分層後,再由各層抽取樣本。

三、各種抽樣方法之適用時機、步驟及

估計量

(一)影響抽樣調查結果準確度的因素

為使抽樣估計值能達到估計全事物的目的,需考慮影響其準確的各種因素:

?原始資料的變異程度

?樣本數的大小

?抽樣方法

?分層抽樣法抽樣的不同

(二)估計值準確度構成的條件

?不偏性(unbiased ness)

? 有效性(efficiency) ? 充分性(sufficiency) ? 一致性(consistency)

1. 不偏性(unbiased ness)

定義E ()

,其中E 表示期望值。本定義即說明,統計量的期望值等於參數,這種性質叫做不偏性。舉例來說,假設某母體大小為N ,且母體平均為 ,今從母體內抽取出一組樣本n ,求得平均為Y ,若E Y () ,則Y 稱為 的不偏估計值。

2. 有效性(efficiency)

定義 2

12

2()()

;此定義的意思是說,若同時有二個統計

量(

1及

2),其中一個統計量的變異數較另一個統計量的變異數為小,則變異數小的那個統計量便具有「有效性」。舉例來說,假設母體平均值為 ,而估計 的統計量有中位數(median)及算術平均數(arithmetic mean),但因為前者的變異數大於後者的變異數,則算術平均數具「有效性」。

3. 充分性(sufficiency)

定義 (,,,)(,)(,,)Y Y h g Y Y n n 11

;此定義的意思是說,假設母體參數為 ,但若樣本統計量

可直接由樣本觀測值去估計,而與 無關,則叫

具有充份性。

4. 一致性(consistency)

定義lim n

;此定義的意思是說,當樣本大小n 趨近於無窮大( )時,統計量即等於參數,這種性質叫做符合一致性。例如,當n 增大為N 時,則所求得的Y 趨近於 ,亦即lim n Y

,故可知Y

具有一致性。

(三)估計的方法

在某些情況下,如所需的原始資料不易得到,或得到的資料所要花費的金錢、時間較多時,可用輔助變數(auxiliary variable or concomitant variable)y

i

,此類變數值的取得代價較低。舉例來說,目測值花費時間、金錢較評估估計值所費均少,估計得較

準確的估計值X,每個抽樣單位有兩個變數值(,)

x y

i i ,x

i

與y

i

間有相關(correlation)存在,母體總合Y必須已知。另外,估計值估計的方法有下列二種:(1)比率估計法(ratio estimation),和(2)迴歸估計法(regression estimation)。

(四)母體與參數及樣本與統計量

1. 母體與參數

同類個體的全部記錄集合一起,使組合成一個全體(aggregate),這個全體稱為母體(population),母體種類很多,表示其特徵的方法有「圖表法」、「常數法」等。利用常數法研究母體即由母體中計算出若干穩定常數,此等常數有介紹母體特性的作用稱為參數(parameters)包括有四類:

(1)測定母體趨中性:主要有算術平均、型量、中位數等。

(2)測定分散度:主要有變異數、均方、標準偏差。標準偏差()

愈大,則母體中所有個體間的變異愈大。

(3)測定偏歪度:主要有Fisher氏的

1

係數,E. S. Pearson氏

的b

1

係數。

(4)測定頻度分布的曲線峰度:常用有Fisher氏的

2

係數,及

Geary氏的W

n

係數。

相关文档
最新文档