关信平《社会研究方法》复习笔记(第五章 抽样)【圣才出品】
第五章抽样
一、抽样的概念与程序
1.概念
在社会研究中,研究者经常从一个规模很大的研究对象中,选出一部分作为研究对象,这个选取过程就是抽样。
2.抽样的有关术语
(1)总体、样本和元素
①样本。抽样是指从总体中按一定方式选取一组元素的过程,由此产生的元素集合称为样本。
②总体。全体研究对象被称为总体。
③元素。每一个具体的调查对象被称为元素。
(2)抽样框和抽样单元
①抽样框。研究者在实际抽样(特别是概率抽样)时,经常是先找到一份近似涵盖所有总体元素的名单,然后从中抽取部分元素,这份名单被称为抽样框。
②抽样单元。抽样框中的总体元素又被称为抽样单元,有时抽样单元与分析单位是相同的。
(3)参数值、统计值和抽样误差
①参数值。一般说来,总体的情况或特征是未知的,由参数值来描述。
②统计值。而样本的情况或特征则是已知的,由统计值来描述。
③抽样误差。参数值与统计值之间的差异就是抽样误差。
3.抽样的步骤
(1)设计抽样方案;
(2)抽取样本;
(3)评估样本。
二、非概率抽样
1.非概率抽样的类型
(1)方便抽样。方便抽样又称偶遇抽样,是指研究者使用对自己最为便利的方法来选取样本。这种方法很容易产生系统误差,样本代表性很差,因此,在使用时要特别小心,总体的情况越复杂,方便抽样的效果就越差。
(2)配额抽样。配额抽样首先要根据某些参数值,确定不同总体类别中的样本配额比例,然后按比例在各类别中进行方便抽样。配额抽样有以下两点先天不足:
①为了不偏离总体,配额矩阵中的数字必须十分准确,要做到这一点,就必须掌握总体的最新资料,但这并不容易做到。
②尽管配额方法是一种改进,但最后抽样仍由调查员根据方便原则执行,他们从某些特定的矩阵格子中选择样本时,有很大的随意性。
(3)判断抽样。判断抽样又称立意抽样,指研究者根据其研究的目的或专家的判断来选取样本。判断抽样经常被用于以下三种研究场景:
①研究者用判断抽样来选择特别能提供信息的独特个案;
②研究者用判断抽样来选取很难以接近的特殊人群;
③研究者用判断抽样来选取某种特殊个案类型,以便进行深入探究。
(4)雪球抽样。雪球抽样也称网络抽样,是一种根据已有研究对象的介绍,不断辨识和找出其他研究对象的累积抽样方法。
三、概率抽样
1.概率抽样的类型
(1)简单随机抽样。也称纯随机抽样,是指研究者严格按照随机原则来抽取样本。根据总体数目的大小可以分为两种方法:
①当总体数目N不大时,可以用抽签法进行简单随机抽样。
②如果总体数目N很大时,可以用随机数法进行简单随机抽样。用随机数表产生随机数,需要完成以几个步骤:
a.确定选出的随机数的位数;
b.决定从5位数组中选择哪几位数字;
c.确定在表中选择数字的顺序;
d.确定开始选择的5位数组起点;
e.处理大于总体规模或重复的随机数。
(2)系统抽样。系统抽样又称机械抽样,抽样效果与简单随机抽样相同,但操作起来却容易得多。系统抽样的样本元素是按某种确定的规则从总体中抽取的,由于等间距抽取是最常用的规则,故系统抽样经常被称为等距抽样。(需要掌握)
(3)分层抽样。分层抽样是指研究者先把总体分为若干个同质的层(次级总体),然后用简单随机或系统抽样方法,从每层中抽取样本元素。实际进行分层抽样,需要解决以下几个问题:
①怎样进行分层,或者说根据什么原则确定分层变量。
②怎样确定样本比例。在大多数情况下,分层抽样采用等比例方式进行,即要求从各层抽取元素的数量在样本中的比例,与该层在总体中的比例相等。
③确定实际分层抽取样本的方法。
(4)多段整群抽样。这里“多段”指的是按总体内的层级关系,把抽样分成几个阶段来进行。实际进行多段整群抽样,需要解决以下几个问题:
①决定是多抽群,还是多抽群中的元素;
②处理群大小不等的情况。
四、样本规模
1.影响样本规模的因素。样本规模主要取决于抽样精度和总体标准差。一般说来,抽样希望达到的精确度越高,总体的异质性程度越大,所需的样本规模就越大。
(1)抽样精度是指抽样中希望达到的精确度,其实就是能够容忍的抽样误差e,即要求的抽样精度越高,则样本规模也应该越大;反之亦然。
(2)总体标准差σ是反映总体元素之间异质性程度的指标;一般说来,在给定抽样精度后,总体异质性程度越小,所需样本规模也越小;反之亦然。
2.样本规模的估算方法
在简单随机抽样中,推论总体平均数的样本规模计算公式为:其中,t为置信度所对应的临界值;p为总体的乘数或百分比;e为抽样误差。