市场调查分析师考试《调查概论(中级)》教材讲义-第二章 调查设计【圣才出品】
第二章调查设计
第一节调查目标的确定
一、明确信息需求
调查设计的首要任务是尽量详细清楚地说明调查的信息需求。
二、数据使用者和数据的用途
确定数据应用的范围应适当控制,不宜过大,这样可以使信息需求得到具体且精确的表述。
三、确定调查指标和调查对象
调查内容是要通过指标来加以反映的。统计指标是说明客观现象数量特征的概念和数值,要有具体的统计范围和相应的计量单位。
调查对象就是我们要调查的社会经济现象的总体,也就是应收集其资料的那些单位的总体。调查单位则是指总体中的每一个基本单位。
第二节调查方法的选择
一、采用全面调查还是抽样调查
全面调查和抽样调查的区别是:在全面调查中,我们从总体的所有的单元中收集信息;而在抽样调查中我们仅仅从总体中的一部分(通常是很小的一部分)单元中收集信息。
在抽样调查和全面调查之间做抉择时,需要考虑的几个重要因素:费用、时效、总体大小、小区域(范围)的估计、属性的多寡、调查误差、特殊要求、其他因素。
二、采用何种获取资料的方式
数据收集的基本方法有:自填式、人员面访、电话访问、网络调查。
第三节抽样设计的有关问题
一、目标总体与调查总体
目标总体就是希望从中获取信息的总体。它是客户所感兴趣的所有单元的集合。根据调查的目的和性质,这些单元可以是个人、家庭、学校、工厂、企业、医院、公司、农场等。
定义目标总体有四个必不可少的因素:总体中单元的类型;单元的特征;单元的地理位置:调查的标准时点或时期)。
调查总体即实际调查所覆盖的总体。在抽样调查中称作被抽样的总体。
理想的状态下,这两个总体应该相一致。但实践中往往不一致。调查总体与目标总体之间的差别是由好多原因造成的。
二、抽样框
1.抽样框的作用
一个抽样框应该包括以下部分或全部内容:
(1)识别资料
识别资料是帮助我们识别抽样框中每个单元的项目,例如姓名、准确的地址、身份证号
码等。
(2)联系资料
联系资料是指那些在调查时用来确定总体单元所在位置的项目。
(3)辅助资料
辅助资料是指那些用来分类与维护等所需的资料。
2.抽样框的类型
有两种类型的抽样框:名录框和区域框。如果没有合适的抽样框也可以使用多重抽样框。
(1)名录框
名录框(目录框)定义为一份所有总体单元的实际的或者概念的名录清单。实际名录框可取自各种不同的来源。
一个概念名录框常常是基于调查正在进行时才存在的总体。
(2)区域框
区域框是其单元由地理区域构成的一种特殊的名录框,也称地域框,有时区域框还以地图的形式出现。调查总体是由这些地理区域组成的。
区域框适用于以下两种情况:
当调查本身就是地理性质的;或者统计机构不能获得一个适当的名录框。
当没有适当的名录框时,可以考虑借助于区域框来构造名录框。统计调查机构通过一个区域框来抽取地理区域,并列出被抽中区域内的单元清单。
多重抽样框是两个或两个以上抽样框的组合。当没有一个抽样框能够全部覆盖总体时就需要使用多重抽样框。
3.抽样框的优良性准则
理想的抽样框是,目标总体的每一个总体单元与抽样框的目录上的单元一一对应,不要
有遗漏或重复。
抽样框的优良性具体有以下一些标准:
(1)关联性
关联性是指抽样框与目标总体对应程度和据此与目标总体的单元接触难易程度的一种度量。
(2)准确性;
(3)时效性;
(4)费用;
(5)抽样框所提供的信息应该使用标准的概念、定义和方法,并使客户对这些都能理解。
4.几种有缺陷抽样框及其补救方法
(1)几种典型的缺陷
①不完全涵盖,或称不完全覆盖。它是指目标总体中的某些单位被排除在抽样框之外,也就是抽样框包括不全,遗漏了一些单位。
②过涵盖,也称过覆盖。它是指抽样框中包含了本来不属于目标总体的单元。
③重复。它是指抽样框中某个单元不止出现一次,这常常是因为在构造抽样框时使用了重复的名录。
④空白单位。即抽样框上的单位有的不属于研究的范围,这也违反了抽样框上的单元与目标总体的单元一一对应的规则。
⑤分类错误。它是指抽样框中的分类变量取值的错误。
(2)补救方法
①如果己知抽样框中的问题不严重,而改正它又比较麻烦时,可以忽略不计。
②重新定义总体,以适合抽样框。
③改正抽样框。
当不完全涵盖发生时,补救的措施可将漏列的单元编制一个单独的名单,以便分别抽样。
如果是过涵盖,当抽中的单元不属于目标总体时,就予以抛弃。
如果抽样框中有重复单元影响到抽选概率,则可以采用加权的方法,即用重复次数的倒数来加权,以抵消其由于重复而增加的抽中概率。或者对重复的单元采用一个惟一标志的识别方法。
(3)建议和准则
①在调查的计划阶段,若有几个抽样框可供选择,对它们的适用性和质量进行评估,由此确定使用哪个抽样框。
②尽量避免使用多重抽样框,只有当所有单独的抽样框都不合适时,可以考虑使用多重抽样框。
③对同一个目标总体或者同一个子总体进行多次调查时,应使用同一个抽样框,这样可以避免口径不一致的情况,同时降低与抽样框维护与评估有关的费用。
④采用各种方法消除抽样框中的重复单元,并增加新生单元,消除目标总体范围以内的单元以及任何其他变化了的抽样框信息,以改善和维护抽样框的质量。
⑤在时间上,抽样框必须及时更新,尽量利用最新的抽样框。
⑥严格地训练工作人员,强调抽样框涵盖的重要性,对与抽样框有关的活动实施有效的质量监督,使抽样框的错误减少到最低限度。
⑦如果是区域框,通过实地考察或使用其他地图对区域框进行核对,确保使用的抽样框划分清楚而没有交叉重叠。
⑧在调查的文档中记录有关目标总体、调查总体、抽样框、涵盖范围方面的内容。
第四节调查中的各种误差及其控制
调查误差可以划分成两大类,即抽样误差和非抽样误差。
一、抽样误差
抽样误差是指仅根据对总体的一部分而不是全部的调查来估计总体特征所引起的误差。
抽样误差的大小,取决于下列因素:样本量的大小;总体指标的变异程度;抽样设计;估计方法以及总体大小。
一般说来,抽样误差随着样本量的增大而减少,但是随着样本容量的增加,费用也随着增加。
二、非抽样误差
除了抽样误差以外,调查过程中还会出现各种各样的与样本抽取无关的误差,这些误差统称为非抽样误差。非抽样误差不仅出现在抽样调查中,也出现在全面调查中。非抽样误差又可以分为两类:随机的和非随机的。非随机的非抽样误差它主要有以下来源:1.抽样框误差
如果抽样框中的信息存在缺陷或者错误,就会产生误差。
2.计量误差
计量误差是指对一个问题所做的回答记录与真值不同。它可能是由于调查问卷设计、调查员、被调查者、收集数据形式或测量工具造成的。
3.无回答误差
无回答是指调查时未能从指定的被调查者处获得有效的回答。无回答有两种类型:一种