抽样理论与方法:不等概率抽样

常用抽样方法

1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或"差"的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是"同质"的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为"有代表性的样本"。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选"中型城镇"进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先"分层"(事先确定每层的样本量)再"判断"(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点:

抽样定理

实验一抽样定理实验 一、实验目的 1、了解抽样定理在通信系统中的重要性 2、掌握自然抽样及平顶抽样的实现方法 3、理解低通采样定理的原理 4、理解实际的抽样系统 5、理解低通滤波器的幅频特性对抽样信号恢复的影响 6、理解低通滤波器的相频特性对抽样信号恢复的影响 7、理解平顶抽样产生孔径失真的原理 8、理解带通采样定理的原理 二、实验内容 1、验证低通采样定理原理 2、验证低通滤波器幅频特性对抽样信号恢复的影响 3、验证低通滤波器相频特性对抽样信号恢复的影响 4、验证带通抽样定理原理 5、验证孔径失真的原理

三、实验原理 抽样定理原理:一个频带限制在(0,H f)内的时间连续信号() m t,如 果以T≤H f21 秒的间隔对它进行等间隔抽样,则() m t将被所得到的抽样值完 全确定。(具体可参考《信号与系统》) 我们这样开展抽样定理实验:信号源产生的被抽样信号和抽样脉冲经抽样/保持电路输出抽样信号,抽样信号经过滤波器之后恢复出被抽样信号。抽样定理实验的原理框图如下: 被抽样信号 抽样脉冲 抽样恢复信号 图1抽样定理实验原理框图 被抽样信号抽样恢复信号 图2实际抽样系统 为了让学生能全面观察并理解抽样定理的实质,我们应该对被抽样信号进行精心的安排和考虑。在传统的抽样定理的实验中,我们用正弦波来作为被抽样信号是有局限性的,特别是相频特性对抽样信号恢复的影响的实验现象不能很好的展现出来,因此,这种方案放弃了。 另一种方案是采用较复杂的信号,但这种信号不便于观察,如错误!未找到引用源。所示:

被抽样信号抽样恢复后的信号 图3复杂信号抽样恢复前后对比 你能分辨错误!未找到引用源。中抽样恢复后信号的失真吗因此,我们选择了一种不是很复杂,但又包含多种频谱分量的信号:“3KHz正弦波”+“1KHz正弦波”,波形及频谱如所示: 图1被抽样信号波形及频谱示意图 对抽样脉冲信号的考虑 大家都知道,理想的抽样脉冲是一个无线窄的冲激信号,这样的信号在现实系统中是不存在的,实际的抽样脉冲信号总是有一定宽度的,很显

抽样检验原理和方法

抽样检验原理和方法 一、抽样检验的基础术语 ?单位产品 ? 1.单位产品划分: ?所谓单位产品,是指构成产品总体的基本单位。如一个螺丝钉、一双鞋等;但有些连续性产品不可以自然划分,如糖、味精、汽油等,其单位产品划分有相对任意性。 ? 2.单位产品缺陷: ?单位产品不符合规定技术要求的任何一点,即构成一个缺陷,按其严重程度区分为:致命缺陷、严重缺陷、轻度缺陷、微小缺陷等。 ? 3.合格品与不合格品: ?合格品:不含有任何缺陷的单位产品; ?不合格品:有一个或一个以上缺陷的单位产品。 ? 4.单位产品的质量衡量方法: ?主要两类:计量方法和计数方法。 批量与样板 ? 1.批量:检查批所包含的单位产品数。记为N。 ? 2.样本单位:从检查批中抽取并用于检验的单位产品。 ? 3.样本:样本单位的全体。 ? 4.样本大小:样本中包含的样本单位数。记为n。 ?在具体实施抽样检查时,先根据提交检查批的批量与检查水平,查表确定样本大小字码:A、B、C……,由查出的样本大小字码、检验严格度和抽样方案的类型,查表即得此抽样方案下的样本大小n。 不合格 ? 1.单位产品的质量特征不符合规定,称为不合格。 ?其按质量特性不符合的严重程度或质量特性的重要性分为A类、B类、C类不合格。 ?A类不合格为单位产品极重要特性不符合规定或单位产品的质量特性极严重不符合规定。 ?B类不合格为单位产品重要特性不符合规定或单位产品的质量严重不符合规定。 ?C类不合格为单位产品一般质量特性不符合规定或单位产品的质量特性轻微不符合规定。 ? 2.合格判定数: ?作出批合格判断样本中所允许的最大不合格品数或不合格数,记为Ac。 ? 3.不合格判定数: ?作出批不合格判断样本中所不允许的最小不合格品数或不合格品数,记为Re。 合格质量水平 ? 1.合格质量水平: ?在抽样检查中,认为可以接受的连续提交检查批的过程平均不合格率(或每百单位缺陷数)上限值,常用AQL表示。 ?原则上,按不合格的分类分别规定不同的合格质量水平。主要由生产方和使用方协商确定:?(1)AQL(A类不合格)< AQL(B类不合格)< AQL(C类不合格); ?(2)AQL(重要检验项目)< AQL(次要检验项目) ?(3)AQL(电气性能)< AQL(机械性能)< AQL(外观质量);

(抽样检验)抽样原理+实务

第一节抽样检验的基本概念 一、基本概念 1.1 个体是可以对其进行一系列观测的一件具体的或一般的物体或可以对其进行一系列观测的一定数量的物质或一个定性或定量的观测值. 1.2批:在一致条件下生产或按规定方式汇总起来的一定数量的个体叫”批”.批中包括的个体数叫批量.一次交付的个体集叫交付批. 1.3样本:是取自总体中的一个或多个个体,用于提供关于总体的信息,并作为可能对总体(或产生总体的过程)进行某种判定的的基础.样本中所包含的个体数目叫样本量. 1.3随机抽样 从包含N个个体的总体中抽取n个个体,使包含有n个个体的所有右能的组合被抽取的概率都相等的抽样叫简单随机抽样.例如设总体包含A、B、C、D、E共五个个体.今要从其中抽取3个个体.则有10种可能. 随机抽样的方法大体有三种.一种是我国古代的抓阄,缺点是做纸团不方便;二是由计算机数学创始人冯.诺依曼最早建议,后来由其他学者发展的用计算机程序产生随机数.但由于这种随机数是程序按一定规律产生的,故叫伪随机数.第三种就是日本首倡的正20面体子. 二、抽样检验的概念 1、抽样检验的概念:是指从交验的一批产品(批量为N)中,抽取一个样本(由n个单位产品组成)进行检验,从而对批产品质量作用推断的过程。 2、抽样检验的目的:是“通过样本推断总体”,而其期望则在于“用尽量少的样本量 来尽可能准确地判定总体(批)的质量”。欲达到这一目的和期望,传统的“百分比抽样”是不科学、不合理的。通过多年来的理论研究和实践证明,只有采用“统计抽样检验”才能保证科学、合理地实现这一目的和期望。 3、抽样检验的步骤 a)抽样:需要研究的是怎样抽和抽多少的问题。 b)检验:是在统计抽样检验理论的指导下,采用具有一定测量能力的设备和正确 的方法进行检验。 c)推断:是用对样本的检验结果来推断总体(批)的质量水平。 其中抽样和推断状况构成了抽样方案,即抽多少和怎样推断。 二、统计抽样检验

常用的抽样方法总结

常用的抽样方法总结 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling) 指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。 优点: 适用于设计调查者对总体的有关特征具有一定的了解而样本数较多的情况下,实际上,配额抽样属于先“分层”(事先确定每层的样本量)再“判断”(在每层中以判断抽样的方法选取抽样个体);费用不高,易于实施,能满足总体比例的要求。 缺点: 容易掩盖不可忽略的偏差。 滚雪球抽样(Snowball sampling)

抽样原理及方法

抽样原理及方法 一、抽样的基本原则 随机化是抽样研究的基本原则。所谓随机化原则,是指在进行抽样时,总体中每一个体是否被抽取,并不由研究者主观决定,而是每一个体按照概率原理被抽取的可能性是相等的。 二、抽样的几种重要方法 抽样有两种方法;非概率抽样和概率抽样。使用哪种方法主要取决于我们是否打算对总体进行推断。非概率抽样用主观的(非随机的)方法从总体中抽取单元,它是一种快速、简易且省钱的抽样方法。但要能从样本对总体进行推算,必须假定样本对总体具有代表性,而在非概率抽样情形做这样的假设将有很大风险。 概率抽样则是基于随机的原则从总体中抽取单元。与非概率抽样相比,概率抽样较为复杂,费时,费用也较高,然而,由于单元是从总体中随机抽取出来的。而且能计算每一个单元的入样概率,因此能得到可靠的估计值及其抽样误差的估计值,并对总体进行推断。下面介绍的是概率抽样的几种重要方法。 1、简单随机抽样 它是最基本的抽样方法,适用范围广,最能体现随机化原则,原理简单。抽取时,总体中每个个体应有独立的、等概率被抽取的可能。抽取的样本满足两个基本条件:代表性和独立性,常用的具体抽取方式有抽签法和随机数字法。 有简单随机抽样得到的样本为简单随机样本。尽管在总体构成信息不同的情况下需要酌情采取不同的抽样方法,如分层抽样方法、集团抽样等,但随即抽样是各种抽样方法内含的基本要求,有四种不同的简单随机抽样方式:不重复抽样(还原抽样、放回抽样);不重复抽样(非还原抽样、无放回抽样);有序抽样(既考虑到何元素有考虑到各种元素出现的顺序);无序抽样(只考虑到哪些元素不考虑各元素出现的顺序)。 2、等距抽样 它也叫做机械抽样或系统抽样。在实施时,将已遍好号码的个体排成顺序,在计算出抽样距离,然后按抽样距离抽取样本。第一个样本采用的是简单随机抽样的办法抽取。 K(抽样距离)=N(总体规模)/n(样本规模) 一般来说,这种抽样方法比简单随机抽样简便易行,而且它比较均匀地抽到总体中各个部分的个体,样本的代表性比简单随机抽样好。另外,等距抽样同简单随机抽样一样也容易忽略已有信息。 3、分层抽样(类型抽样) 现将总体中的所有单位按照某种特征或标志(性别、年龄等)划分成若干类型或层次,然后再在各个类型或层次中采用简单随机抽样或系统抽样的方法抽出一个子样本,最后将这些子样本合起来构成总体样本。分层有两种方法:a.先以分层变量将总体划分为若干层,再按照各层在总体中的比例从各层中抽取。例如修订智力测验中国版,先把中国的区域分成东北、华北等大行政区,每个大区再按照其人口比例随机抽取一定数量的被试(不分省市)。 b.先以分层变量将总体划分成若干层,再将各层中的元素按分层的顺序整齐排列,最后用系统抽样的方法抽取样本。例如在某大学进行大学生态度调查,可以先按专业分层,再按年级分层,然后根据抽中的专业和年级全体学生的名册进行等距抽样。分层抽样是把异质性较强的总体分成一个个同质性较强的子总体,在抽取不同的子总体中的样本分别代表该子总体,所有的样本进而合在一起代表总体。 分层标准: a.以调查所要分析和研究的主要变量或相关的变量作为分层的标准。 b.以保证各层内部同质性强、各层之间异质性强、突出总体内在结构的变量作

不等概率抽样的方法的应用研究

不等概抽样方法的应用研究 99统计992137 石磊 【内容摘要】在抽样调查中,不等概抽样是一个重要的内容,如一个地区商场销售额总额的估计,由于大商场与小商场的销售额差异巨大,因此,大商场与小商场不能同等对待。这时使用不等概率抽样方法可以很好的提高估计值得精度。在整群抽样或多阶抽样中,常采用不等概抽样,在实际问题中,很少采用一种抽样方法,而常常采用是几种抽样方法有机结合,最常见的方案为多阶不等概抽样。 【关键词】不等概抽样,PPS,πPS,二阶段抽样。 【ABSTRACT】In sample investigation, sample with unequal probabilities is one important content, such as one regional market sales amount estimation of total value, Because emporium and little sales amount of market difference enormous, so, the emporium and little market can put on an equal footing . Use the sampling with unequal probabilities method can kind improvement estimate precision of deserving very at this moment. Besides, in overall to go on and when sampling, go on when sampling to a certain all residence of city to some, To have more very much the same residences in such aspects as economy different block of city this. If use one steps sample, not only trouble, but also the precision estimated is poor. 【KEY WORDS】sampling with unequal probabilities PPSπPS two-stage sampling 一、不等概抽样的理论基础 (一)不等概抽样的概念 等概抽样是指总体中的每个单元具有同样的入样概率的随机抽样。例如:分层随机抽样,层内单元是按简单随机抽样取得,各层内的所有单元的入样概率相同,因此分层随机抽样为等概随机抽样。而不等概随机抽样是指在抽样前赋予总体每个单元一个不相同的入样概率。 由于所面对的总体有可能差异不大,也有可能差异非常大,当总体单元之间差异不大时,备单元具有一定的代表性。这时使用简单随机抽样得到的估计值是精确有效的。但是当单元之间差异非常大时,使用简单随机抽样抽出的样本所估计的估计值误差极大,这时有必要考虑使用不等概随机抽样方法,即赋予各单元一个不同的入样概率,使大样本的入样概率大,小样本的入样概率小,从而提高估计量的估计精度。例如对全国各省的基础建设总额进行估计时。由于全国30多个省直辖市经济发展情况以及经济政策的互不相同。使得各省内的基础建设投资额互不相同,而且差距非常大。2003年初各省得投资历额中,最低的为吉林省0.14亿元,最高的为广东省为117.92亿元。如果抽样时将广东省和吉林省在抽样时,同等对待是不合理的。因此在抽样时对样本大的单元赋予一个较大的放样概率,推算时给予一个较小的权;对待一样要较小的单元赋予一个较小的入样概率,推算时赋予一个较小的权;对待样本较单元之间的差异,从而使估计值精确有效。 (二)不等概抽样的适用范围 实际工作中,在下列几种情况下,则可以考虑使用不等概率抽样:

常用的抽样方法总结

常用的抽样方法总结 Document serial number【UU89WT-UU98YT-UU8CB-UUUT-UUT108】

常用的抽样方法总结 1.非概率抽样(Non-probability sampling) 又称非随机抽样,指根据一定主观标准抽取样本,令总体中每个个体的被抽取不是依据其本身的机会,而是完全决定于调研者的意愿。 其特点为不具有从样本推断总体的功能,但能反映某类群体的特征,是一种快速、简易且节省的数据收集方法。当研究者对总体具有较好的了解时可以采用此方法,或是总体过于庞大、复杂,采用概率方法有困难时,可以采用非概率抽样来避免概率抽样中容易抽到实际无法实施或“差”的样本,从而避免影响对总体的代表度。 常用的非概率抽样方法有以下四类: 方便抽样(Convenience sampling) 指根据调查者的方便选取的样本,以无目标、随意的方式进行。例如:街头拦截访问(看到谁就访问谁);个别入户项目谁开门就访问谁。 优点: 适用于总体中每个个体都是“同质”的,最方便、最省钱;可以在探索性研究中使用,另外还可用于小组座谈会、预测问卷等方面的样本选取工作。 缺点: 抽样偏差较大,不适用于要做总体推断的任何民意项目,对描述性或因果性研究最好不要采用方便抽样。 判断抽样(Judgment sampling)

指由专家判断而有目的地抽取他认为“有代表性的样本”。例如:社会学家研究某国家的一般家庭情况时,常以专家判断方法挑选“中型城镇”进行;也有家庭研究专家选取某类家庭进行研究,如选三口之家(子女正在上学的);在探索性研究中,如抽取深度访问的样本时,可以使用这种方法。 优点: 适用于总体的构成单位极不相同而样本数很小,同时设计调查者对总体的有关特征具有相当的了解(明白研究的具体指向)的情况下,适合特殊类型的研究(如产品口味测试等);操作成本低,方便快捷,在商业性调研中较多用。 缺点: 该类抽样结果受研究人员的倾向性影响大,一旦主观判断偏差,则根易引起抽样偏差;不能直接对研究总体进行推断。 配额抽样(Quota sampling) 指先将总体元素按某些控制的指标或特性分类,然后按方便抽样或判断抽样选取样本元素。 相当于包括两个阶段的加限制的判断抽样。在第一阶段需要确定总体中的特性分布(控制特征),通常,样本中具备这些控制特征的元素的比例与总体中有这些特征的元素的比例是相同的,通过第一步的配额,保证了在这些特征上样本的组成与总体的组成是一致的。在第二阶段,按照配额来控制样本的抽取工作,要求所选出的元素要适合所控制的特性。例如:定点街访中的配额抽样。

第二节 几种基本的概率抽样方法

第二节几种基本的概率抽样方法 【本节知识点】 各种概率抽样方法的理解 【本节内容精讲】 【知识点一】简单随机抽样 (一)含义 1、有放回简单随机抽样 从总体中随机抽出一个样本单位,记录观测结果后,将其放回到总体中去,再抽取第二个,如此类推,一直到抽满n个单位为止。 【注】单位有被重复抽中的可能,容易造成信息重叠而影响估计的效率,较少采用。 2、不放回简单随机抽样 从包含N个单元的总体中逐个随机抽取单元并无放回,每次都在所有尚未被抽入样本的单元中等概率的抽取下一个单元,直到抽取n个单元为止。 【注】每个单位最多只能被抽中一次,不会由于样本单位被重复抽中而提供重叠信息,比放回抽样有更低的抽样误差。 (二)优缺点 1.优点:简单随机抽样是最基本的随机抽样方法,操作简单,且每个单位的入样概率相同,样本估计量形式也比较简单。 2.缺点:没有利用抽样框更多的辅助信息,用样本统计量估计总体参数的效率受到影响,样本的分布可能十分分散,增加了调查过程中的费用和时间。 (三)适用条件 1、抽样框中没有更多可以利用的辅助信息 2、调查对象分布的范围不广阔 3、个体之间的差异不是很大 【例题10:单选题】下列关于简单随机抽样的表述错误的是()。 A总体的每个单位入样概率相同B是最基本的随机抽样方法 C没有利用抽样框更多的辅助信息D适用个体之间差异较大的调查 【答案】D【解析】通过本题掌握简单随机抽样的特点。 【知识点二】分层抽样 (一)含义

先按照某种规则把总体分为不同的层,然后在不同的层内独立、随机的抽取样本,这样所得到的样本称为分层样本。如果每层中的抽样都是简单随机抽样,则称为分层随机抽样。 【例题11:单选题】在调查某部门平均工资时,先将该部门员工分为经理和普通职员两类,再采用随机原则分别在经理和普通职员中抽取样本,这种抽样方法属于()。 A.简单随机抽样 B.整群抽样 C.分层抽样 D.等距抽样 【答案】C。解析:考核分层抽样概念的理解。 (二)分层抽样样本量在各层分配的方法 【例题12:单选题】某校高中生共有2700人,其中高一年级900人,高二年级1200人,高三年级600人,现采取分层抽样法抽取容量为135的样本,那么高一、高二、高三各年级抽取的人数分别为() A.45,75,15 B.45,45,45 C.30,90,15 D.45,60,30 【答案】D【解析】样本量占总体容量的比=135/2700=5% n(高一)/900=5%,所以,n(高一)=5%×900=45人 n(高二)/1200=5%,所以,n(高二)=5%×1200=60人 n(高三)/600=5%,所以,n(高三)=5%×600=30人 (三)优缺点 优点:

如何确定抽样方法

如何确定抽样方法 在设计一个抽样调查时,我们通常需要做的工作是:定义总体及抽样单元、确定或构置抽样框、选择抽样技术、确定样本量的大小、制定实施细节并实施。这里我们着重介绍一下定量研究的抽样方法和样本量这两个技术环节。 最基本的定量研究的抽样方法分为两类,一类为非概率抽样,一类为概率抽样。 一、非概率抽样 非概率抽样是不能计算抽样误差的,因为它是靠调研者个人的判断来进行的抽样。它包括偶遇抽样或者方便抽样、判断抽样、配额抽样、雪球抽样等。 偶遇抽样(方便抽样) 常见的未经许可的街头随访或拦截式访问、邮寄式调查、杂志内问卷调查等都属于偶遇抽样的方式。偶遇抽样是所有抽样技术中花费最小的(包括经费和时间)。抽样单元是可以接近的、容易测量的、并且是合作的。但尽管有许多优点,这种形式的抽样还是有严重的局限性。许多可能的选择偏差都会存在,如被调查者的自我选择、抽样的主观性偏差等。这种抽样不能代表总体和推断总体。因此,当我们在进行街头访问或邮寄调查时,一定要谨慎对待调查结果。 判断抽样 判断抽样是基于调研者对总体的了解和经验,从总体中抽选"有代表性的""典型的"单位作为样本,例如从全体企业中抽选若干先进的、居中的、落后的企业作为样本,来考察全体企业的经营状况。如果判断准,这种方法有可能取得具有较好代表性的样本,但这种方法受主观因素影响较大。

配额抽样 配额抽样是根据总体的结构特征来给调查员分派定额,以取得一个与总体结构特征大体相似的样本,例如根据人口的性别、年龄构成来给调查员规定不同性别、年龄的调查人数。配额保证了在这些特征上样本的组成与总体的组成是一致的。一旦配额分配好了,选择样本元素的自由度就很大了。唯一的要求就是所选的元素要适合所控制的特性。这种抽样方法的目的是使样本对总体具有更好的代表性,但仍不一定能保证样本就是有代表性的。如果与问题相关联的某个特征未被考虑进配额,配额样本可能就不具有代表性,但在实施中包括太多的控制特征是十分困难的。另外,用这种方法进行选择时,往往存在调查员的选择偏好,因而也难以避免主观因素的影响。如果在严格控制调查员和调查过程的条件下,可使配额抽样获得与某些概率抽样非常接近的结果。在进行配额抽样时,要特别注意配额与调查结果之间的密切联系。 雪球抽样 雪球抽样是先选择一组调查对象,通常是随机地选取的。访问这些调查对象之后,再请他们提供另外一些属于所研究的目标总体的调查对象,根据所提供的线索,选择此后的调查对象。这一过程会继续下去,形成一种滚雪球的效果。此抽样的主要目的是估计在总体中十分稀有的人物特征。由于后来被推荐的人可能类似于推荐他们的那些人,因此这种方式的调查也是非概率的。 二、概率抽样 非概率抽样包括简单随机抽样,分层抽样,等距抽样,整群抽样等,每个样本的中选概率是已知的,因此可以计算抽样误差。通常的实地调查中,是把这几种抽样方法相互结合。

常见的概率抽样方法

常见的概率抽样方法 抽样方法简单的可分为概率抽样和非概率抽样,概率抽样常见的方法包括简单随机抽样、分层抽样、系统抽样和整群抽样。 简单随机抽样 简单随机抽样也称为单纯随机抽样、纯随机抽样、SPS抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。 简单随机抽样是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N 不太大时,实施起来并不困难。但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此,在实际中直接采用简单随机抽样的并不多。 简单随机抽样的特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。 简单随机抽样最基本的抽样方法。分为重复抽样和不重复抽样。在重复抽样中,每次抽中的单位仍放回总体,样本中的单位可能不止一次被抽中。不重复抽样中,抽中的单位不再放回总体,样本中的单位只能抽中一次。社会调查采用不重复抽样。 简单随机抽样的具体作法有: ①抽签法。将总体的全部单位逐一作签,搅拌均匀后进行抽取。 ②随机数字表法。将总体所有单位编号,然后从随机数字表中一个随机起点(任一排或一列),开始从左向右或从右向左、向上或向下抽取,直到达到所需的样本容量为止。

简单随机抽样的必须有一个完整的抽样框,即总体各单位的清单。总体太大时,制作这样的抽样框工作量巨大,加之有许多情况,使总体名单根本无法得到。故在大规模社会调查中很少采用纯随机抽样。 分层抽样 先将总体的单位按某种特征分为若干次级总体(层),然后再从每一层内进行单纯随机抽样,组成一个样本。分层可以提高总体指标估计值的精确度,它可以将一个内部变异很大的总体分成一些内部变异较小的层(次总体)。 每一层内个体变异越小越好,层间变异则越大越好。 分层抽样比单纯随机抽样所得到的结果准确性更高,组织管理更方便,而且它能保证总体中每一层都有个体被抽到。这样除了能估计总体的参数值,还可以分别估计各个层内的情况,因此分层抽样技术常被采用。 例如,一个单位的职工有500人,其中不到35岁有125人,35岁至49岁的有280人,50岁以上的有95人.为了了解这个单位职工与身体状况有关的某项指标,要从中抽取一个容量为100的样本,由于职工年龄与这项指标有关,决定采用分层抽样方法进行抽取.因为样本容量与总体的个数的比为1:5,所以在各年龄段抽取的个数依次为125/5,280/5,95/5,即25,56,19。 系统抽样 系统抽样也也称为等距抽样、或机械抽样、SYS抽样它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。是纯随机抽样的变种。在系统抽样中,先将总体从1~N相继编号,并

统计学课后习题

第一章导论 1.Q:什么是统计学? A:统计学是收集、处理、分析、解释数据并从数据中得出结论的科学。 2.Q:解释描述统计和推断统计。 A:描述统计研究的是数据收集、处理、汇总、图表描述、概括与分析等统计方法。统计推断是研究如何利用样本数据来推断总体特征的统计方法。 3.Q:统计数据可分为哪几种类型?不同类型的数据各有什么特点? A:①按计量尺度不同,可分为:分类数据(只能归类于某一类别的非数字型数据)、顺序数据(只能归类于某一有序类别的非数字型数据)、数值型数据(按数字尺度测量的观察值); ②按统计数据的收集方法不同,可分为:观测数据(通过调查或观测而收集到的数据)、实验数据(在 实验中控制实验对象而手机到的数据); ③按被描述的现象和时间的关系,可分析:截面数据(在相同或近似相同的时间点上收集的数据)、时 间序列数据(在不同时间上收集的数据,用于所描述的现象随时间变化的情况)。 4.Q:解释分类数据、顺序数据和数值型数据的含义。 A:见3。 5.Q:举例说明总体、样本、参数、统计量、变量这几个概念。 A:总体是包含所研究的全部个体(数据)的集合;样本是从总体中抽取的一部分元素的集合;参数是用于描述总体特征的概括性数字度量;统计量是用于描述样本特征的概括性数字度量;变量是说明现象某种特征的概念。 6.Q:变量可分为哪几类? A:分类变量(说明事物类别的一个名称);顺序变量(说明事物有序类别的一个名称);数值型变量(说明事物数字特征的一个名称)。 7.Q:举例说明离散型变量和连续性变量。 A:离散型变量:企业数、产品数量;连续型变量:年龄、温度、零件尺寸的误差。 8.Q:请举例统计应用的几个例子。 A:要了解一个地区的人口特征、对产品的质量进行检验等。 9.Q:请举例统计应用的几个领域。 A:政府部门、学术研究领域、日常生活、公司或企业的生产经营管理(企业发展战略、产品质量管理、市场研究、财务分析、经济预测、人力资源管理)。 第二章数据的搜集 大纲重点:1、调查的组织与实施;2、概率抽样和非概率抽样; 1.Q:什么是二手资料?使用二手资料需要注意些什么? A:如果与研究内容有关的原信息已经存在,我们只是对这些原信息重新加工、整理,使之成为我们进行统计分析可以使用的数据,则把它们称为间接来源的数据,即二手资料。二手资料具有搜集方便、数据采集快、采集成本低等优点,但也有很大的局限性,如资料的相关性不够,口径可能不一致,数据也许不准确,也许过时了等等 2.Q:比较概率抽样和非概率抽样的特点,举例说明什么情况下适合采用概率抽样,什么情况下适合采用

非概率抽样方式

非概率抽样方式 (三)非概率抽样方式 非概率抽样,又称为不等概率抽样或非随机抽样,是调研者根据自己的方便或主观判断抽取样本的方法。主要有偶遇抽样、主观抽样、滚雪球抽样、、定额抽样等类型。1.偶遇抽样,也称就近抽样、方便抽样或自然抽样。它是指研究者根据现实情况,以自己方便的形式抽取偶然遇到的人作为调查对象,或者仅仅选择那些离得最近的、最容易找到的人作为调查对象。其优点是方便省力,其缺点是样本的代表性差,,有很大的偶然性。 2.主观抽样,也称目标式抽样、判断式抽样或立意抽样。它是调查者根据自己的主观分析,来选择和确定调查对象的方法;。主观抽样取得的样本.其代表性取决于研究者对总体的了解程度和判断能力。主观抽样的优点是,可以充分发挥研究人员的主观能动性,其缺点是,样本的代表性难以判断,不能推论。 3.滚雪球抽样。当我们无法了解总体情况时,可以从总体中的少数成员入手。对他们进行调查向他们询问还知道哪些符合条件的人,再去找那些人并询问他们知道的人,如同滚雪球一样。我们可以找到越来越多具有相同性质的群体成员。 4.定额抽样。定额抽样从对总体性质的了解开始,在某一总体中考虑具有某种属性的人数所占的比例,然后从具有这种属性的人群中收集数据,并按各类人在总体中的比例赋予它的适当的比重。这样收集数据,从理论上讲应当能够代表总体。这种方法存在的问题是:定额的比例必须精确,但由于最新的关于总体性质变化的信息并不容易得到,往往造成抽样中的偏差。 (四)抽样中的误差问题 进行抽样调查可产生两类误差,一类是抽样误差,另一类是非抽样误差。 1.抽样误差:由抽样的随机性产生,属于随机误差 抽样误差是指主要指样本平均数与总体平均数之差、样本比率与总体比率之差。 抽样误差中通常运用最多的抽样平均误差,即指样本平均数或样本比率的标准差。在重复抽样条件下, (1)样本平均数的抽样平均误差公式为 其中, 为总体标准差,n为样本个案数。

相关文档
最新文档