抽样技术期末论文分析

抽样技术期末论文分析
抽样技术期末论文分析

盐城师范学院

抽样调查技术与技能期末论文

题目: 《系统抽样与其他抽样的方法的联系,以及不同抽样方法的效果》

姓名: 崔亚楠

二级学院: 数学科学学院专业: 统计学

班级: 统计学131班学号: 13213205 成绩评定:

引言

1、申明

为处理方便起见,以下只讨论系统抽样,且总是假定N是n的整数倍,即N=nk的情形。在这一情况之下,直线和圆形等距抽样的结果一致,样本量一样,尤其关键的是这可以保证各个单元的入样概率都相等。

2、符号说明

为了方便讨论,将总体的N个单元(实际上是抽样框的N个抽样单元)排列成k行n列,如表1所示。

各符号的含义如下:

总体单元数:N

样本单元数:n

Y-+

第r行第j列的单元变量值:(1)

j k r

第r 行对应变量的总体均值 :r Y ?,r Y ?=(1)11j k r n

j Y n -+=∑

第j 列对应的变量的总体均值 :j Y ?,j Y ?=(1)1

1j k r k

r Y k -+=∑

注意表1中主区(上下左右去掉一行或者一列剩余的部分)共有k 行n 列,显然每行都是系统抽样的一个可能样本,所以系统抽样可以看做按简单随机抽样方式(由随机起点的抽法以及牵一发动全身的特性所决定)从k 行中抽取一行,每行被抽中的等概率都等于1/k 这种说法与第2章里关于简单随机抽样为从所有(等概率的)可能样本中随机抽出一个样本的第一种定义是吻合的。

如果表1中的第r 行第j 列的单元变量值改记为rj Y ,则

(1)rj j k r Y Y -+=, r=1,2,…,n; j=1,2,…,n

则表1的内容就将变成表2。

这一变换将导致一系列令人兴奋的结果:如果将每一行的单元视为群,总体由k 个群组成,每个群的大小都是n ,则系统抽样可以看成从k 个群中随机抽取

一个群的特殊整群抽样。而如果将每一列单元视为一层,则总体由n 个层组成,每个层的大小都是k ,则系统抽样可以看成从n 个层中各取一个单元的特殊分层抽样,所谓特殊是指这里的群与层更多是形式上的而不是本质上的,不是自然存在的,而是完全取决于单元的排序结果。例如由于上述系统抽样的样本单元在各层的位置相同,就和分层随机抽样中层的构成有很大不同。同时,由于系统抽样的所有可能样本对应于总体全部单元的某一排列顺序,而简单随机抽样所有可能样本则对应于总体全部单元的所有而非某一排列顺序,系统抽样的所有可能样本

的数目只有k 个,而简单随机抽样所有可能样本的数目有n N C 个,因而系统抽样

的所有可能样本属于简单随机抽样所有可能样本的一个特殊部分,故系统抽样又可以看成一种特殊的简单随机抽样。

总体均值:11

111

1rj rj

k n

k n

r j r j Y Y Y N

nk =====

=∑∑∑∑

总体方差;()

()

2

2

2

11

11

1111rj rj k n

k n

r j r j S Y Y Y Y N nk =====-=---∑∑∑∑ 总体“群”平均:r r Y Y ?=()1

11,2,,n

rj j Y r k n ===∑L

样本“群”平均:11

11n n

r rj rj r j j y y Y Y n n =====∑∑ (r=1,2,…,k )

注意:这里隐含着抽样类文献的一个普遍假设,变量值的取得过程即实地调查环节不产生任何误差。如果缺乏这一假设,根据误差公理rj rj y Y =,因而r r y Y =是根本不可能的 。

二、下面通过一个例子

1、

表3

根据表有

总体方差:28.53S =

平均群(行)内方差:2r S =1

3(9.17+9.17+9.17)=9.17

平均层(列)内方差:()21

000010

j S ?=+++=L

计算每种抽样的总体均值估计量的方差。

(1)以行为群的整体抽样或者以行为“系统样本”的系统抽样:k=3,n=10,

2

2221(1)1(1)()0wsy sy r N k n N k n V y S S S S N N N N

----=

-=-≈

(2)以列为群(系统样本)的整体抽样或者以列为“系统样本”的系统抽样:k=3,n=10,

22221(1)1(1)()8.25wsy sy j N k n N k n V y S S S S N N N N

?----=

-=-≈

(3)以行为层的分层随机抽样(每层抽一个单元):L=3,n=3,f=3/30

22

1

11() 2.75L

st h h r h f

f V y W S S n

n

=--=

=

≈∑

(4) 以列为层的分层随机抽样(每层抽一个单元):L=10,n=10,f=10/30

221

11()0j L

st h h h f

f

V y W S S n

n

?=--=

=

=∑

(5)简单随机抽样:n=10,f=10/30。

2

1()0.57f V y S n

-=

(6)简单随机抽样:n=3,f=3/30。

2

1() 2.56f V y S n

-=

≈ 2、 下面将表3中的总体单元的顺序重新排列形成表4

根据表有

总体方差:28.53S =

平均群(行)内方差:2r S =1

3(10.23+9.17+6.67)=8.69

平均层(列)内方差:()21

0.890.89000.7110

j S ?=++++=K

计算每种抽样的总体均值估计量的方差。

(1)以行为群的整体抽样或者以行为“系统样本”的系统抽样:k=3,n=10,

2

2221(1)1(1)()0.43wsy sy r N k n N k n V y S S S S N N N N

----=

-=-≈

(2)以列为群(系统样本)的整体抽样或者以列为“系统样本”的系统抽样:k=3,n=10,

22221(1)1(1)()7.6 1wsy sy j N k n N k n V y S S S S N N N N

?----=

-=-≈

(3)以行为层的分层随机抽样(每层抽一个单元):L=3,n=3,f=3/30

22

1

11() 2.61L

st h h r h f f V y W S S n

n

=--=

=

≈∑

(4) 以列为层的分层随机抽样(每层抽一个单元):L=10,n=10,f=10/30

221

11()0.05j L

st h h h f

f

V y W S S n

n

?=--=

=

=∑

(5)简单随机抽样:n=10,f=10/30。

2

1()0.57f V y S n

-=

(6)简单随机抽样:n=3,f=3/30。

2

1() 2.56f V y S n

-=

三、总结

从上述1可以看出

(1) 和整群抽样一样,系统抽样的估计精度几乎完全取决于其“系统样本”(群)内的差异与总体差异的对比。

(2)系统抽样与其他抽样方法相比优劣难以定论,可能好也可能差,这完全取决于其“系统样本”(群)内的差异与总体的差异的对比,而这个对比则取决于系统抽样中的总体单元排列顺序。另外三种方法的比较同样难定优劣,都需要具体情况具体分析。

由上述2可以看出

将结果1与结果2比较,不难发现,简单随机抽样的方差未变,说明简单随机抽样的结果与顺序无关;而系统抽样、整群抽样以及分层抽样的结果都与单元的顺序或组合结构有关。同时,结果2 相对结果1的极好与极差都有一定的距离,这提示我们在选择抽样方式时,必须多掌握有关单元的顺序或组合结构特点方面的信息,才可做出良好判断。

相关主题
相关文档
最新文档