各种抽样方法之选择、步骤及优劣比较

各种抽样方法之选择、步骤及优劣比较
各种抽样方法之选择、步骤及优劣比较

各種抽樣方法之選擇、步驟及優劣

比較

一、簡介

調查之目的即在蒐集資料,由資料中獲得訊息,以對未知狀況或現象,加以瞭解,提供決策參據。調查方式可採普查或抽樣調查。普查:即對欲研究對象(母體)中每一份子均加以調查。抽樣調查:由所欲研究對象(母體)中抽取一部分份子(樣本),加以調查蒐集資料。

普查之優缺點與必要性:

1. 普查優點:

(1)包羅母體中每一份子,最能陳示母體狀況。

(2)可做各細分特性之統計分析。

(3)不致產生抽樣誤差。

2. 普查缺點:

(1)耗費大量人力,物力,財力。

(2)整理時間過長,統計結果常有過期之憾。

(3)調查問卷不易深入。

(4)易導致非抽樣誤差。

3. 普查必要性:

(1)基本國勢之陳示。

(2)各種抽樣調查之母體。

(3)細分特性之陳示。

(4)各種抽樣調查估計之權數。

1/ 51

抽樣調查:

抽樣調查係自調查對象之母體中抽取一部份個體,加以觀察,然後再推估母體之現象。抽樣調查成為科學的調查方法,乃是由於推測統計理論的發展,加上近年來統計的重要性倍增,依據調查資料與現存事實進行之交叉分析結果頗獲各方關心,主要原因須歸功於統計在經濟發展中所發揮的功能,所以統計學中的抽樣調查不僅是一門學問,業已成為研究社會問題與經濟現象的主要工具之一。

1. 抽樣之基本觀念

(1) 抽樣不過是一個方法、手段、其最終目標仍在

推論。

(2) 對於各種抽樣方法,建立直覺的瞭解,以及探

求其優點及限制。

(3) 注意各種抽樣方法之觀念及使用時機。

(4) 不要見樹而不見林。(注意樣本之代表性)

2. 抽樣之基本原則

(1) 所抽樣本能以代表母體。(代表性)

(2) 以樣本訊息估計母體之特性,要儘可能精確,

並且可測度其可信度(精確性)。

(3) 取樣成本要儘量少。(成本低)

(4) 配合不同之母體狀況及行政限制下,採取適宜

方法(即考量實務問題)。亦即如何達到快速、準確、具

代表性而又能配合實務。(可行性)

3/ 51

→→

→→

4. 抽樣調查優點

(1) 抽樣調查可節省人力與財力。 (2) 抽查可縮短調查與整理時間。

(3) 抽查所抽出之樣本可做更詳細之調查。 (4) 抽查可迅速獲得調查結果。

(5) 可配合研究特性與機動性之行政措施。

本章的概述最主要目的是作為導讀之用,期望讀者在念完本章節後對抽樣調查有些許初步的認識與興趣,並在往後各章內容中均有非常詳細的介紹。現在,就讓我們一同進入抽樣調查的世界裡,一探抽調的神奇之美。

二、抽樣方法之分類

抽樣方法分類:可粗分為非機率抽樣與機率抽樣。

(一)非機率抽樣:亦即樣本不按照其機率予以抽出,而是由抽樣者之主觀抽出或自願樣本。

◆優點:在某些調查時,有其必要性。

◆缺點:(1)難以評斷樣本之代表性。

(2)無法估計精確度。

(3)樣本偏差往往較大。

◆非機率抽樣之種類:

1. 便利樣本(偶然樣本)

事先不預定樣本,碰到即問或自動回答者。如街頭訪問或主動打電話回答問題者。缺點:注意樣本之偏激性及兩極化。

2. 立意樣本(判斷樣本)

由抽樣者立意抽取之樣本。如民間代表、意見領袖、學者、專家或代表性之樣本。

3. 滾式樣本(輻射樣本)

利用樣本尋找樣本,亦即利用樣本之滾雪球方式或輻射力抽取樣本。如都市中之原住民抽樣。使用時機:可用於當樣本不易取得時,或針對特殊族群之調查。

4. 配額樣本:

按母體某些特性予以配置樣本,但取樣時卻由調查員任意抽取。非機率抽樣有時雖然可予使用,惟在其結果之引用上,要特別注意,亦即其結果之參考性大於其實際之代表性。

(二)機率抽樣:抽取之樣本是按照樣本

之機率隨機抽出。

5/ 51

◆優點:

1. 樣本較具代表性。

2. 可計算估計之精確度。

3. 可隨不同之抽樣設計採取不同之抽樣方法。

4. 隨之不同之抽樣方法,採取相互配合之估計方法。

◆機率抽樣之種類:

1. 簡單隨機抽樣

不對母體加以任何修飾或分割,而使每一樣本均有相同之被抽中機率。

2. 分層隨機抽樣

將母體按照某些特性,分成數個不重疊的組群,這些組群即稱為層,而再由各層分別抽取樣本。

3. 系統抽樣

將母體之元素按順序編號後,有系統的每隔一定間隔抽取一個樣本之方法。

4. 集體抽樣

將母體中相鄰近之個體排成為一集體,而以集體為抽樣單位,即每一抽樣單位為一集體之抽樣單位。

5. 兩段集體抽樣

首先抽出一些樣本集體,再由樣本集體內抽出部分基本個體。

6. 分層集體抽樣

將母體內之集體予以分層後,再由各層抽取樣本。

7 / 51

三、各種抽樣方法之適用時機、步驟及估計量

(一)影響抽樣調查結果準確度的因素

為使抽樣估計值能達到估計全事物的目的,需考慮影響其準確的各種因素:

? 原始資料的變異程度 ? 樣本數的大小 ? 抽樣方法

?

分層抽樣法抽樣的不同

(二)估計值準確度構成的條件

? 不偏性(unbiased ness) ? 有效性(efficiency) ? 充分性(sufficiency) ?

一致性(consistency)

1. 不偏性(unbiased ness)

E 表示期望值。本定義即說明,統計量的期望值等於參數,這種性質叫做不偏性。舉例來說,假設某母體大小為N

組樣本n

計值。

2. 有效性(efficiency)

統計量,其中一個統計量的變異數較另一個統計量的變異數為小,則變異數小的那個統計量便具有「有效性」。

數(median)及算術平均數(arithmetic mean),但因為前者的變異數大於後者的變異數,則算術平均數具「有效性」。

3. 充分性(sufficiency)

4. 一致性(consistency)

n趨近於無窮大時,統計量即等於參數,這種性質叫做符合

一致性。例如,當

n增大為N

(三)估計的方法

在某些情況下,如所需的原始資料不易得到,或得到的資料所要花費的金錢、時間較多時,可用輔助變數

變數值的取得代價較低。舉例來說,目測值花費時間、金錢較評估估計值所費均少,估計得較準確的估計值X,每個抽

9 / 51

(correlation)

存在,母體總合Y 必須已知。另外,估計值估計的方法有下列二種:(1)比率估計法(ratio estimation),和(2)迴歸估計法(regression estimation)。

(四)母體與參數及樣本與統計量

1. 母體與參數

同類個體的全部記錄集合一起,使組合成一個全體(aggregate),這個全體稱為母體(population),母體種類很多,表示其特徵的方法有「圖表法」、「常數法」等。利用常數法研究母體即由母體中計算出若干穩定常數,此等常數有介紹母體特性的作用稱為參數(parameters)包括有四類:

(1)測定母體趨中性:主要有算術平均、型量、

中位數等。 (2)測定分散度:主要有變異數、均方、標準偏差。標

(3)測定偏歪度:主要有Fisher

E. S. Pearson

(4)測定頻度分布的曲線峰度:常用有Fisher

係數,及Geary

2. 樣本與統計量

母體涵蓋範圍很大,資料經統計分析後,所得結論的適當範圍必很大;所須顧慮者,乃在於母體範圍過大時,蒐集、計數、度量及統計工作隨著浩大,所費時間、金錢往往無法

許可,故只好由樣本資料來推斷母體的特性。

來自同樣個體的全部N個個體中只抽出n個單位進行計數,度量而得n個單位的記錄(N>n)集結此n個單位記錄在一起,便構成一個樣本(sample),再由樣本資料求得某一統計值來估計參數,此估計值稱為統計量(statistic)。因樣本有抽樣變異,故統計量亦有抽樣變異,如把母體中可能發生的樣本全部取出,然後求得各樣本的某種統計量,再求統計量的總平均值,此總平均值稱為某統計量的期望值,若某統計量的估計方法適當,則該統計量即母體參數。抽樣方法的不同,及抽樣單位的不同會改變統計量的大小,改變對該母體的代表程度。

(五)各種抽樣方法之適用時機、步驟及估計量

1. 簡單隨機抽樣法(simple random sampling)

簡單隨機抽樣是一種最基礎且最簡便的抽樣方法。它的優點是(i)當母體底冊完整時,直接由母體中抽出樣本,方法簡單;和(ii)每一單位被抽中的機率均相等,參數的估計較簡單。而它的限制是(i)母體底冊不易取得,或取得很費時,費力且費錢;(ii)母體內樣本單位太多時,作業不方便;(iii)樣本分配較分散,行政作業較不易;和(iv)樣本代表性恐有不足(尤其當樣本點差異大時或重要性不同時)。因此,使用簡單隨機抽樣的最佳時機,便是當(i)母體內樣本單位不多,且有完備名冊,可茲編號時;(ii)母體內樣本單

位間的差異不大時(對研究的目的而言);和(iii)對母體資訊無法充份獲得時。簡單隨機抽樣法的準確度會受下列二因素的影響,即(i)母體本身的變異,和(ii)樣本的大小。以下以算術平均值為例來分別說明。

﹝例子﹞

(1)母體本身的變異:分別對原始母體當變異數較小和變異數較大時,計算簡單隨機抽樣法的所有可能的樣本組合,結果列在表4-1及表4-2內。

表4-1 簡單隨機抽樣法的所有可能的樣本組合

(原始母體變異數較小) 樣本順序樣本個體樣本總計樣本平均母體

1 2 3 4 5 6 7 8 9

10

11

12

13

14

15 abcde

abcdf

abcdg

abcef

abceg

abcfg

abdef

abdeg

abdfg

abfeg

acdef

acdeg

acdgf

acefg

adefg

38.4

38.7

39.1

38.9

39.3

39.6

39.3

39.7

40.0

40.2

39.6

40.0

40.3

40.5

40.9

7.68

7.74

7.82

7.78

7.86

7.92

7.86

7.94

8.00

8.04

7.92

8.00

8.06

8.10

8.18

a=6.9

b=7.4

c=7.7

d=8.1

e=8.3

f=8.6

g=9.0

N=7

n=5

T=56

11/ 51

17

18

19

20

21 bcdeg

bcdfg

bcefg

bdefg

cdefg

40.5

40.8

41.0

41.4

41.7

8.10

8.16

8.20

8.28

8.34

總計840.0

平均40.0

表4-2 簡單隨機抽樣法的所有可能的樣本組合

(原始母體變異數較大) 樣本順序樣本個體樣本總計樣本平均母體

1 2 3 4 5 6 7 8 9

10

11

12

13

14

15 abcde

abcdf

abcdg

abcef

abceg

abcfg

abdef

abdeg

abdfg

abfeg

acdef

acdeg

acdgf

acefg

adefg

26

27

29

34

36

37

36

38

39

46

38

40

41

48

50

5.2

5.4

5.8

6.8

7.2

7.4

7.2

7.6

7.8

9.2

7.6

8.0

8.2

9.6

10.0

a=1

b=2

c=4

d=6

e=13

f=14

g=16

N=7

n=5

T=56

17

18

19

20

21 bcdeg

bcdfg

bcefg

bdefg

cdefg

41

42

49

51

53

8.2

8.4

9.8

10.2

10.6

總計840.0

平均40.0

比較表4-1及表4-2,可看出同樣的抽樣方法、同樣大小的母體及樣本,在表4-1中由於原始母體的變異小,樣本平均的變異也隨著變小,而大多能代表母體平均,也就是說有較大的準確度。而在表4-2中,因為母體變數由1到16的間,大小相差甚多,結果可能的樣本組合平均值由5.2變化到10.6,故其準確度較小。

(2)樣本的大小:同樣的也分別對當樣本大小不同時,計算簡單隨機抽樣法的所有可能的樣本組合,結果列在表4-3及表4-4內。

表4-3 當n=4時簡單隨機抽樣法所有可能的樣本組合

樣本順序樣本個體樣本總計樣本平均母體

1 2 3 4 5 abcd

abce

abcf

abcg

abde

13

20

21

23

22

3.25

5.00

5.25

5.75

5.50

a=1

b=2

c=4

d=6

e=13

13/ 51

6 7 8 9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32 abdf

abdg

acde

acdf

acdg

bcde

bcdf

bcdg

abef

abeg

abfg

acef

aceg

acfg

adef

adeg

adfg

bcef

bceg

bcfg

bdef

bdeg

bdfg

cdef

cdeg

cdfg

aefg

23

25

24

25

27

25

26

28

30

31

33

32

34

35

34

36

37

33

35

36

35

37

38

37

39

40

44

5.75

6.25

6.00

6.25

6.75

6.25

6.50

7.00

7.50

8.00

8.25

8.00

8.50

8.75

8.50

9.00

9.25

8.25

8.75

9.00

8.75

9.25

9.50

9.25

9.75

10.00

11.00

f=14

g=16

N=7

n=4

T=56

15 / 51

33 34 35 defg cefg defg 45 47 49 11.25 11.75 12.25 總計 1120.0 280.00 平均

280.0

8.00

表4-4 當n =6時簡單隨機抽樣法所有可能的樣本組合

樣本順序 樣本個體 樣本總計 樣本平均

母體 1 2 3 4 5 6 7 abcdef abcdeg abcdfg abcefg abdefg acdefg bcdefg

40 42 43 50 52 54 55 6.67 7.00 7.17 8.33 8.67 9.00 9.17 a=1 b=2 c=4 d=6 e=13 f=14 g=16 N=7 n=6 T=56

總計 336.0 56.01 平均

48.0

8.00

表4-3中,當n=4時的樣本平均由3.25至12.25間便動,而在表4-4中,當n=6時的樣本平均則由6.67至9.17間變動,可見其準確度差異相當的大。我們可由這二個表而歸納出一個結論,亦即大樣本的準確度較大,而小樣本的準確度較小。

相关文档
最新文档