总体,样本和抽样方法

总体,样本和抽样方法
总体,样本和抽样方法

1.总体与样本

情境一:某校高中学生有900人,校医务室想对全校高中学生的身高情况做一次调查,为了不影响正常教学活动,准备抽取50名学生作为调查对象.你能帮医务室设计一个抽取方案吗

总体:我们一般把所考察对象的某一数值指标的全体作为总体.

个体:构成总体的每一个元素作为个体.

样本:从总体中抽出若干个体所组成的集合叫样本.

样本容量:样本中所包含的个体数量叫样本容量.

2.抽样方法

看下面例子,思考:如何抽取样本才能正确估计总体

情境二:在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿和罗斯福谁将当选下一届总统.为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(注意在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎.于是此杂志预测兰顿将在选举中获胜.实际选举结果正好相反,最后罗斯福在选举中获胜.其数据如下:

体都可能被抽到,每一个个体被抽到的

机会是均等的,满足这样条件的抽样就是随机抽样.

在进行抽样时,为保证抽样的随机性和个体被抽到的机会均等性,统计工作者设计了许

多方法,本章只介绍简单随机抽样、系统抽样和分层抽样.本节课先来学习简单随机抽样.

常用的简单随机抽样办法有抽签法和随机数表法.

⑴抽签法

例从一个100支日光灯管的总体中,用不放回的方法抽取10支日光灯管构成一个简单随机样本.

方法:

①将这100支日光灯管编号,每一只日光灯管对应1到100中的唯一一个数;

②把这100个号分别写在相同的100张纸片上;

③将100张纸片放在一个箱子中搅匀;

④按要求随机抽取号签,并记录;

⑤将编号与号签一致的个体抽出.

抽签法一般步骤:

①编号制签;

②搅拌均匀;

③逐个不放回抽取.

定义:一般地,将总体中的N个个体编号,并把号码分别写在号签上,再将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,不放回的连续抽取n次,就得到一个容量为n的样本,这样的抽样方法就叫抽签法.

问题:若上面的日光灯管有3 000支,要抽取100支,用抽签法有没有困难

⑵随机数表法

例要考察某种品牌的850颗种子的发芽率,从中抽取50颗种子作为样本进行试验.方法:

①对850颗种子进行编号,可编为001,002,003, (850)

②在面对随机数表(其中每个数都是随机方法产生的,这样的数表叫随机数表)之前,指出开始数字的纵横位置(例如从第1行第1列的数4开始);

③获取样本号码(给出的随机数表中是5个数一组,我们使用各个5位数组的前3位,不大于850且不与前面重复的取出,否则就跳过不取,如此下去直到得出50个三位数).随机数表法抽样的一般步骤:

①编号;

②在随机数表上确定起始位置;

③取数.

2.系统抽样

情境一:了解某省农村家庭年平均收入情况.

情境二:检测某电视机厂生产的某种型号的电视机的质量是否合格.

定义:将总体分成均衡的若干部分,然后按照预先制定的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为等距抽样).

2.系统抽样的方法

例为了解某地区近年高一学生期末考试数学成绩,拟从参加考试的15 000名学生的数学成绩中抽取容量为150的样本.

抽取方法:

⑴对全体学生进行编号,号码为1~15 000;

⑵k =N

n

15000

150

=100 (即可以将总体平均分为150个部分,其中每一部分包含100

个个体) ;

⑶从1号到100号进行简单随机抽样,抽取一个号码,比如是56.

⑷按照确定的规则,接下来顺次取出的号码为156,256,…,14 956的学生.

系统抽样的一般步骤

从元素个数为N总体中抽取容量为n的样本:

(1)采用随机的方式将总体中的个体编号 (为简便起见,有时可直接采用个体所带有的号码,如考生的准考证号、街道上各户的门牌号,等等) ;

(2)将整个的编号分段(即分成若干部分),确定分段的间隔k = N n

; (3)在第一段用简单随机抽样确定起始的个体编号s ;

(4)按照事先确定的规则抽取样本(通常是s ,s +k ,s +2k ,s +3k ,…,s +(n -1)k 获取整个样本).

注意:当N n 是整数时,k =N n ;当N n

不是整数时,可随机地从总体中剔除余数,使剩下的总体中个体的数量N' 能被n 整除,这时k = N'n

.然后再用系统抽样方法进行抽样. 3 分层抽样

情境一:某高中学生有900名.为了考察他们的体重状况,打算抽取容量为45的一个样本.已知高一有400名学生,高二有300名学生,高三有200名学生.

试问:能在900人中任意取45个吗能将45个份额均匀分到这三部分中吗应用什么方法抽取

1.分层抽样的定义

当总体由差异明显的几部分组成时,为了使抽取的样本更好地反映总体的情况,常将总体中各个个体按照某种特征分成若干个互不重叠的部分,每一部分叫做“层”,在各层中按层在总体中所占的比例进行抽样,这种抽样叫做“分层抽样”.

情境一的抽样方法:

(1)确定样本容量与总体的个体数之比45 :900 = 1 :20;

(2)利用抽样比确定各年级应抽取的个体数,依次为40020,30020,200

20,即20,15,10;

(3)利用简单随机抽样或系统抽样的方法,从各年级分别抽取20,15,10人,然后合在一起,就是所抽取的样本.

2.分层抽样的一般步骤 分层抽样的一般步骤是:

(1)分层:按某种特征将总体分成若干层. (2)按比例确定每层抽取个体的个数.

(3)各层分别按简单随机抽样的方法抽取.

(4)综合每层抽样,组成样本.

课堂小结

1 对抽样概念的理解

2 各种抽样方法的步奏

课后作业

1 书上

2 练习册

(完整版)样本量计算(DOC)

1.估计样本量的决定因素 1.1资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例;计数资料即使误差控制严格,设计均衡,样本需要大一些,需要30-100例。 1.2研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 1.4 1.5 度为 1.6 1.7 1.8双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需 样本量就大;当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量 就小。当进行双侧检验或单侧检验时,其α或β的Ua?界值通过查标准正态分布的分位数表即可得到。

2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 2.1描述性研究 例. =0.1, 2.2 2.2.1探索有关变量的影响因素研究 有关变量影响因素研究的样本量大多是根据统计学变量分析的要求,样本数至少是变量数的5-10倍。例如,如果研究肺结核患者生存质量及影响因素,首先要考虑影响因素有几个,然后通过文献回顾,可知约有12个预测影响变量,如年龄、性别、婚姻、文化程度、家庭月收入、医疗付费方式、病程、排菌、喀血、结核中毒症状、心理健康、社会支持,那么研究的变量就可以在60-120例。这是一种较为简便的估算样本量的方法,在获得相关文献支持下,最好根据公式计算,计量

总体、样本和抽样方法(一)教学设计

10.3.1总体、样本和抽样方法(一)教学设计 【教学目标】 1.理解总体、样本和随机抽样的概念,掌握简单随机抽样的两个方法. 2.通过实例,体验简单随机抽样的科学性及可靠性,培养学生分析问题、解决问题的能力. 3.通过观察、分析、探究等课堂教学活动,让学生在掌握知识的过程中,体会成功的喜悦,培养实事求是的科学态度。 【教学重点】 正确理解简单随机抽样的概念,掌握简单随机抽样的两个方法的步骤. 【教学难点】 能灵活应用简单随机抽样的两个方法从总体中抽取样本. 【教学关键点】简单随机抽样的两个方法的灵活运用 【教学方法】 这节课主要采取启发引导、讲练结合的教学方法.选取通过贴近学生生活的实例,运用多媒体,增大容量和直观性。预习时,运用微课视频,培养学生自主学习的能力。 【授课班级】12级设计2班(专业:计算机平面设计人数:25人) 【授课时间】2014.6.2 【教材】高等教育出版社《数学(基础模块)》下册 【教学内容】1.总体、个体、样本和样本容量的概念 2.简单随机抽样的两个方法。 【授课类型】传授知识与培养技能相结合 【学情分析】本节课的学习者是中职计算机平面设计专业的学生,他们性格活泼时尚前卫,不喜欢枯燥乏味的数学,喜欢生动有趣的课堂。让学生了与学数学,喜欢上数学课堂是本节课的重中之重。为此,需要打破传统的教学程序,在课堂上有所创新,才能圆满完成本节课教学目标和任务。 【教学环境设计及资源准备】多媒体教室抽奖箱计算器和微课视频 【教学过程】

教学反思 创新之处:1.有意识的去寻找真正切合学生兴趣的话题与事例。 2、让学生头脑和肢体同时动起来,让课堂活动真正达 到和谐与统一! 不足之处:如果和计算机老师结合向学生介绍更多的计算机生成随机数的方法就更好了。

抽样调查样本量确定

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。

如何确定抽样统计的最小样本量

如何确定抽样统计的最小样本量(附:随机抽样统计的抽样误差Excel计算表格) 在电视节目中经常看到关于选举的报道中经常会后有支持率的数字,例如:调查结果为 ?a方支持率为%; ?b方支持率为%; ?c方支持率为%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况); 最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采 样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为 1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=,置信度为90%时,=,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样为y 相对抽样误差h = E / y C= σ / y 以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 置信度相对抽样误差(假设:C=

样本量计算方法

样本量及其计算依据: 根据现有文献[Gerald Holtmann,Nicholas Talley,Tobias Liebregts,Birgit Adam,Christopher Parow.A placebo-controlled trial of itopride in functional dyspepsia.The New England Journal of MEDICINE 2006;(8):832-840],功能性消化不良患者接受伊托必利50mg组治疗后,其NDI改善值的均数为18.0,本研究期望针刺本经取穴组治疗功能性消化不良的NDI改善值的均数为15.0,本研究共设了6个组别,检验水准α=0.05,检验效能1-β=0.90,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n= j=1 k = Ε( X j- x ) 2/(k-l) j=1 通过公式计算,每组所需样本数n=77例,按15%的脱失率计算,每个组应不少于89例,6组应不少于534例。 样本量及其计算依据: 若分为三组或三组以上,采用多个样本均数比较的样本含量估计公式(王家良主编《临床流行学》.上海.上海科学技术出版社,2001.P142)进行样本量的估算,公式如下: k ψ2(Εs j2/k) n=

k = Ε(?X j- x ) 2/(k-l) k为研究所用的组数,?X j, s i各为每组的均数与标准差的估计值,x=Ε?X j/k,ψ为界值,可通过查阅ψ值表得到。

样本量计算(DOC)

1.估计样本量的决定因素 1.1 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 1.2 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 1.3 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显著性,反之就要越大。 1.4 显著性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取0.05或0.01。 1.5 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为0.2,0.1或0.05。即1-β=0.8,0.1或0.95,也就是说把握度为80%,90%或95%。 1.6 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 1.7 总体标准差(s) 一般因未知而用样本标准差s代替。 1.8 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义

样本量的确定

样本量的确定 北京广播学院新闻传播学院 调查统计研究所 二零零一年五月 沈浩 本讲主要内容 如何计算简单随机抽样的样本量确定 如何实现分层抽样中各层样本单位数的分配样本容量的确定 样本量=费用+精度 (函数) 确定样本容量,需要处理好预定的精度与现有经费,同时也要考虑资源和时间等限 制条件,最终的样本量确定是在上述因素之间的权衡关系。分层抽样分配样本的标准 总的样本容量事先确定 估计值要求达到的精度预先给定 影响调查样本容量的因素 调查估计值所希望达到的精度 调查估计值所能允许的误差。 估计量的抽样方差较小,估计值是精确的 估计值的精度越高,所需的样本容量就越大 影响精度的因素也同样影响着样本容量的大小 所研究指标在总体中的变异程度 总体的大小

样本设计和所使用的估计量 无回答率 客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少 除了估计值的精度以外,调查实际操作的限制条件也许是影响样本容量的最大因 素。 11>(给定精度水平下样本容量的确定样本容量的大小与调查估计值所要求的精度紧密相关 数据是通过抽样而不是普查收集的,就会产生抽样误差。 精度是由抽样方差来测量的。 随着样本容量的增加,调查估计值的精度也会不断提高。标准误差 误差界限 变异系数 抽样方差的几种计量方法 抽样调查中样本容量的确定,也经常会使用一种或多种这样的计量方法来对精度进 行说明。 非抽样误差 非抽样误差会对调查估计值的精度产生显著的影响 非抽样误差的大小与样本容量的大小却没有很大的关系 确定样本容量,就不必将这些误差作为影响因素加以考虑

样本量计算

样本量计算 调查研究中样本量的确定 在社会科学研究中,研究者常常会遇到这样得问题:“要掌握总体(population)情况,到底需要多少样本量(sample)?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。本文将根据自己的经验,探讨在调查研究中确定调查所需样本量的一些基本方法,相信这些方法对于其他的社会调查研究也有一定的借鉴意义。 确定样本量的基本公式 在简单随机抽样的条件下,我们在统计教材中可以很容易找到确定调查样本量的公式: Z2 S2 n = ------------ (1) d2 其中: n代表所需要样本量 Z:置信水平的Z统计量,如95%置信水平的Z统计量为1.96,99%的Z为2.68。 S:总体的标准差; d :置信区间的1/2,在实际应用中就是容许误差,或者调查误差。 对于比例型变量,确定样本量的公式为: Z2 ( p ( 1-p)) n = ----------------- (2) d2 其中: n :所需样本量 z:置信水平的z统计量,如95%置信水平的Z统计量为1.96,99%的为2.68

p:目标总体的比例期望值 d:置信区间的半宽 关于调查精度 通常我们所说的调查精度可能有两种表述方法:绝对误差数与相对误差数。如对某市的居民进行收入调查,要求调查的人均收入误差上下不超过50元,这是绝对数表示法,这个绝对误差也就是公式(1)中置信区间半宽d。 而相对误差则是绝对误差与样本平均值的比值。例如我们可能要求调查收入与真实情况的误差不超过1%。假定调查城市的真实人均收入为10000元,则相对误差的绝对数是100元。 公式的应用方法 对于公式的应用,一些参数是我们可以事先确定的:Z值取决于置信水平,通常我们可以考虑95%的置信水平,那么Z=1.96;或者99%,Z=2.68。然后可以确定容许误差d(或者说精度),即我们可以根据实际情况指定置信区间的半宽度d。因此,公式应用的关键是如何确定总体的标准差S。如果我们可以估计出总体的方差(标准差),那么我们可以根据公式计算出样本量: 例如:要了解该城市的居民收入,假定我们知道该市居民收入的标准差为1500,要求的调查误差不超过100元,则在95%的置信水平下,所需的样本量为 n=1.962*15002/1002=8,643,600/10,000=864 即需要调查的样本量为864个。 最大样本量 以上公式只是理论上的,在实际调查中确定合理的样本量,必须考虑多方面的因素。 首先,由于人们通常缺乏对标准差的感性认识,因此对标准差的估计往往是最难的。总体的标准差是123,还是765?如果没有一点对样本的先验知识,那么对标准差的估计是不可能的。好在我们通常能对变量的平均值进行估计,如我们通过历史资料估计该地区目前的年人均收入大致为10,000元,那么根据统计学知识,我们引入变异系数的概念: 变异系数V=标准差S/平均值X<= 1 因此,我们知道人均收入的标准差应该小于平均值,就是说标准差应该在10000以下。当然,这对于我们确定样本量还不能起太大的作用。然而如果我们采用相对误差表述的精度,对公

实例教程 手把手教你计算样本量

实例教程:手把手教你计算样本量 作者:张耀文 小玲看了新英格兰医学杂志的一篇文章[1]后,有些地方不明白,于是来找小咖讨论。 小玲:我觉得这个研究做的棒棒哒,但有一点没看明白,就是原文中统计方法部分的样本量计算到底写了个啥: 小咖:你没看明白就对了。这段话确实没有讲明白样本量到底怎么计算来的。你应该去看看这个研究的Protocol和Supplementary Appendix,里面应该会详细写到。因为限于篇幅,有些研究会在正文中省略一些信息。 小玲:那么,哪里能找到这个研究的Protocol和Supplementary Appendix呢? 小咖:来,跟着我操作。首先搜到新英格兰医学杂志的这篇文章,然后点击①PDF下载这篇文章,再点开②Supplementary Material。

下载③Protocol 和④Supplentary Appendix 。 小玲:原来是这样啊,那我赶紧再去读一读这两个文件。 小玲读完后,又来找小咖。 小玲:我找到啦,原来在Protocol 的84-85页有样本量计算的详细介绍。 小咖:很好。你先总结一下大意。 小玲:比较主要结局(体重变化)时,按照P =0.05进行双侧t 检验。对于另一个主要结局(二分类变量)——体重下降5%及以上、10%以上的人数比例,采用双侧卡方检验比较。假设对照组体重下降10%以上的人数比例为10%,利拉鲁肽组的这个比例为14%。当利拉鲁肽组和对照组的样本量分别为2400例、1200例时,可以有超过90%的把握度发现这种差异。 小咖:很好,你get 到了所有的point 。以本研究为例,计算样本量时,需要

样本量计算

样本量计算 Last revision date: 13 December 2020.

1.估计样本量的决定因素 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。 显着性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取或。 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为,或。即1-β=,或,也就是说把握度为80%,90%或95%。 容许的误差(δ) 如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 总体标准差(s) 一般因未知而用样本标准差s代替。 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。

样本量的确定方法

样本量的确定方法(2008-10-14 09:12:34)一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内 样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样本量 计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算样本量的 公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。 1 / 5 1.简单随机抽样确定样本量主要有两种类型: (1)对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查结果的精度(E), 期望调查结果的置信度(L),以及总体的标准差估计值σ的具体数据,总体单位数N。2222/N) σ/(e/Z+σ计算公式为:n=222/e特殊情况下,如果是很大总体,计算公式变为:n= Zσ95%调查结果在例如希望平均收入的误差在正负人民币30元之间,95%的置信范围以内,其。根据估计总体的标准差为150元,总体单位数为1000。的统计量为的置信度要求 Z1.96:n=150*150/(30*30/(1.96*1.96))+150*150/1000)=88 样本量 (2)于百分比类型的变量(E),,一般根据下列步骤计算样本量。已知调查结果的精度值百分比对于已知数据为百分比。,的精度即样本变异程度,总体数为N以及置信度(L),比例估计(P)22+ P(1-P)/N) :n=P(1-P)/(e/Z则计算公式为22公式为:n= ZP(1-P)/e同样,特殊情况下如果不考虑总体, 。取其样本变异程度最大时的值为我们不知道,P的取值,0.5一般情况下的置信95%,其的置信范围以内之间例如:希望平均收入的误差在正负0.05,调查结果在95%。样本量0.5,1.96度要求Z的统计量为,估计P为总体单位数为

样本量的确定方法

样本量的确定方法 The pony was revised in January 2021

样本量的确定方法(2008-10-14 09:12:34) 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1)研究对象的变化程度,即变异程度; (2)要求和允许的误差大小,即精度要求; (3)要求推断的置信度,一般情况下,置信度取为95%; (4)总体的大小; (5)抽样的方法。 也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城

临床试验样本量的估算

临床试验样本量得估算 样本量得估计涉及诸多参数得确定,最难得到得就就是 预期得或者已知得效应大小(计数资料得率差、计量资料得均数差值),方差(计量资料)或合并得率(计数资料各组得合并率),一般需通过预试验或者查阅历史资料与文献获得,不过很多时候很难得到或者可靠性较差。因此样本量估计有些时候不就是想做就能做得。SFDA得规定主要就是从安全性得角度出发,保证能发现多少得不良反应率;统 计得计算主要就是从power出发,保证有多少把握能做出显著来。 但就是中国得国情?有多少厂家愿意多做? 建议方案里这么写: 从安全性角度出发,按照SFDA××规定,完成100对有效病例,再考虑到脱落原因,再扩大20%,即120对,240例。 或者:本研究为随机双盲、安慰剂平行对照试验,只有显示试验药优于安慰剂时才可认为试验药有效,根据预试验结果,试验组与对照组得 有效率分别为65、0%与42、9%,则每个治疗组中能接受评价得病人样本数必须达到114例(总共228例),这样才能在单侧显著性水平为5%、检验功效为90%得情况下证明试验组疗效优于对照组。假设因调整意向性治疗人群而丢失病例达10%,则需要纳入病人得总样本例数为250例。 非劣性试验(α=0、05,β=0、2)时:

计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=12、365×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=12、365× (S/δ)2 等效性试验(α=0、05,β=0、2)时: 计数资料: 平均有效率(P) 等效标准(δ) N= 公式:N=17、127×P(1-P)/δ2 计量资料: 共同标准差(S) 等效标准(δ) N= 公式:N=17、127× (S/δ)2 上述公式得说明: 1) 该公式源于郑青山教授发表得文献。 2) N 就是每组得估算例数N1=N2,N1 与N2 分别为试验药与参比药得例数; 3) P 就是平均有效率,

如何确定抽样统计的最小样本量

?a方支持率为45.3%; ?b方支持率为30.2%; ?c方支持率为8.5%; ?... 最后都会说明一下,此次电话调查的数量2352,置信度为95%﹐最大抽样误差为±2.5%。 抽样调查的典型情景:对一个大的集合(比如:数千万选民)做一次调查的成本较高,抽样调查可以低成本的用近似的(可接受的)数据反映实际情况;在用户调研中,也经常通过通过抽样调查的方式并对比打分的方法做评估。这里就需要了解置信度和抽样误差的概念; 抽样误差:假如相同规模的抽样调查进行多次,抽样均值在真实均值的上下波动,相对于整体均值的偏移波动就是抽样误差,而这个误差的分布是符合标准正态分布的,例如下图:横轴为整体的均值,圆点是每次抽样的均值,而红色那次抽样就是加上误差后都未覆盖到均值线的情况);

最小抽样量的计算公式:抽样量需要> 30个才算足够多,可以用以下近似的误差/样本量估算公式; n:为样本量; :方差,抽样个体值和整体均值之间的偏离程度,抽样数值分布越分散方差越大,需要的采样量越多; E:为抽样误差(可以根据均值的百分比设定),由于是倒数平方关系,抽样误差减小为1/2,抽样量需要增加为4倍; : 为可靠性系数,即置信度,置信度为95%时,=1.96,置信度为90%时,=1.645,置信度越高需要的样本量越多;95%置信度比90%置信度需要的采样量多40%; 为了体现相对差距:假设抽样均值为y 相对抽样误差h = E / y 变异系数C= σ / y

以下是基于抽样得分的抽样误差估算表格:方差越大需要的样本量越多,数据离散度越低,需要的抽样量越少; 相对抽样误差(假设:C=0.4) π为按照经验得出的最后比例,在未知时π可取50%,待算出结果后再重新拟合,比例越悬 从而看出大部分的电话抽样调查:95%置信度的情况下,误差要控制在2%以内取样量一般在2000-5000;为了方便计算抽样调查的误差和估算抽样量,制作了一个Excel表格附后,调整颜色框中的抽样量数字就可以得到相应的误差或根据指定的误差范围估算出抽样量;

整体样本与抽样方法一

【课题】10.3总体、样本与抽样方法(二) 【教学目标】 知识目标: 了解简单随机抽样、系统抽样、分层抽样等三种抽样方法. 能力目标: 会根据特征选用合适的抽样方法抽取样本,从而培养学生数据处理技能. 情感目标: (1)经历针对实际问题选择抽样方法的过程,发展科学思维; (2)关注生活中的数学,体会数学知识的应用. 【教学重点】 了解简单随机抽样、系统抽样、分层抽样等三种抽样方法. 【教学难点】 对简单随机抽样、系统抽样、分层抽样等三种抽样方法的理解. 【教学设计】 简单随机抽样、系统抽样、分层抽样是三种常用的抽样方法.三种抽样方法的共同特点是在抽样过程中每个个体被抽取的概率相等,体现了这些抽样方法的客观性和公平性.其中简单随机抽样是最基本的抽样方法,在系统抽样和分层抽样时都要用到简单随机的抽样方法.当总体中的个数较少时,常采用简单随机抽样;当总体中的个数较多时,且其分布没有明显的不均匀情况,常采用系统抽样;当已知总体由差异明显的几个部分组成时,常采用分层抽样. 简单随机抽样还可以利用随机数来进行.现在大部分函数型计算器都能产生在之 01 ~ 间均匀分布的随机数,应用起来十分方便. 例4是巩固性练习,老师要指导学生按照教材所介绍的“从容量为N的总体中,用系统抽样抽取容量为n的样本的步骤”进行练习. 【教学备品】 教学课件. 【课时安排】 2课时.(90分钟) 【教学过程】 教学过程教师 行为 学生 行为 教学 意图 时 间

过 程 行为 行为 意图 间 *揭示课题 10.3总体、样本与抽样方法(二) *创设情境 兴趣导入 【问题】 用样本估计总体时,样本抽取得是否恰当,直接关系到总体特性估计的准确程度.那么,应该如何抽取样本呢? 介绍 质疑了解 思考 启发 学生思考 5 *动脑思考 探索新知 【新知识】 下面介绍几种常用的抽样方法. 1.简单随机抽样 从一批苹果中选取10个,每个苹果被选中的可能性一般是不相等的,放在上面的苹果更容易被选中.实际过程又不允许将整箱苹果倒出来,搅拌均匀.因此,10个苹果做样本的代表意义就会打折扣. 我们采用抽签的方法,将苹果按照某种顺序(比如箱、层、行、列顺序)编号,写在小纸片上.将小纸片揉成小团,放到一个不透明的袋子中,充分搅拌后,再从中逐个抽出10个小纸团.最后根据编号找到苹果. 这种抽样叫做简单随机抽样. 简单随机抽样必须保证总体的每个个体被抽到的机会是相同的.也就是说,简单随机抽样是等概率抽样. 抽签法(俗称抓阄法)是最常用的简单随机抽样方法.其主要步骤为 (1)编号做签:将总体中的N 个个体编上号,并把号码写到签上; (2)抽签得样本:将做好的签放到容器中,搅拌均匀后,从中逐个抽出n 个签,得到一个容量为n 的样本. 当总体中所含的个体较少时,通常采用简单随机抽 样.例如,从某班抽取10位同学去参加义务劳动,就可采用抽签的方法来抽取样本. 当总体中的个体较多时,“搅拌均匀”不容易做到,这样抽出的样本的代表性就会打折扣.此时可以采用“随机数法”抽样. 产生随机数的方法很多,利用计算器(或计算机)可以方便地产生随机数. CASIO fx 82ESPLUS 函数型计算器(如图10-3),利用 · 键的第二功能产生随机数.操作方法是:首先设置精确度并将计算器显示设置为小数状态,依次按键SHIFT 、 MODE 、 2 ,然后连续按键 SHIFT 、 RAN# ,以讲解说明引领分析仔细分析关键 观察 理解 记忆 带领 学生分析、管路敷设技术通过管线不仅可以解决吊顶层配置不规范高中资料试卷问题,而且可保障各类管路习题到位。在管路敷设过程中,要加强看护关于管路高中资料试卷连接管口处理高中资料试卷弯扁度固定盒位置保护层防腐跨接地线弯曲半径标等,要求技术交底。管线敷设技术中包含线槽、管架等多项方式,为解决高中语文电气课件中管壁薄、接口不严等问题,合理利用管线敷设技术。线缆敷设原则:在分线盒处,当不同电压回路交叉时,应采用金属隔板进行隔开处理;同一线槽内强电回路须同时切断习题电源,线缆敷设完毕,要进行检查和检测处理。、电气课件中调试对全部高中资料试卷电气设备,在安装过程中以及安装结束后进行 高中资料试卷调整试验;通电检查所有设备高中资料试卷相互作用与相互关系,根据生产工艺高中资料试卷要求,对电气设备进行空载与带负荷下高中资料试卷调控试验;对设备进行调整使其在正常工况下与过度工作下都可以正常工作;对于继电保护进行整核对定值,审核与校对图纸,编写复杂设备与装置高中资料试卷调试方案,编写重要设备高中资料试卷试验方案以及系统启动方案;对整套启动过程中高中资料试卷电气设备进行调试工作并且进行过关运行高中资料试卷技术指导。对于调试过程中高中资料试卷技术问题,作为调试人员,需要在事前掌握图纸资料、设备制造厂家出具高中资料试卷试验报告与相关技术资料,并且了解现场设备高中资料试卷布置情况与有关高中资料试卷电气系统接线等情况 ,然后根据规范与规程规定,制定设备调试高中资料试卷方案。 、电气设备调试高中资料试卷技术电力保护装置调试技术,电力保护高中资料试卷配置技术是指机组在进行继电保护高中资料试卷总体配置时,需要在最大限度内来确保机组高中资料试卷安全,并且尽可能地缩小故障高中资料试卷破坏范围,或者对某些异常高中资料试卷工况进行自动处理,尤其要避免错误高中资料试卷保护装置动作,并且拒绝动作,来避免不必要高中资料试卷突然停机。因此,电力高中资料试卷保护装置调试技术,要求电力保护装置做到准确灵活。对于差动保护装置高中资料试卷调试技术是指发电机一变压器组在发生内部故障时,需要进行外部电源高中资料试卷切除从而采用高中资料试卷主要保护装置。

抽样调查样本量确定.

抽样调查样本量确定.

抽样调查样本量的确定 在贸易统计中, 对于限额以下批零餐饮企业普遍采用抽样调查方法进行解决。然而,由于当前市场经济情况的多样性,经济发展的不均衡性,以及地域宽广性,导致情况多种多样;实际情况的复杂,决定了方案的复杂性,增加了具体抽样的难度。经过多年的探讨,区域二相抽样调查比较符合当前我国的实际情况,我们在这里根据试点所掌握的情况针对采用区域二相抽样调查的贸易抽样方案中如何确定样本量进行分析。 一、样本单位数量的确定原则 一般情况下,确定样本量需要考虑调查的目的、性质和精度要求。以及实际操作的可行性、经费承受能力等。根据调查经验,市场潜力和推断等涉及量比较严格的调查需要的样本量比较大,而一般广告效果等人们差异不是很大或对样本量要求不是很严格的调查,样本量相对可以少一些。实际上确定样本量大小是比较复杂的问题,即要有定性的考虑,也要有定量的考虑;从定性的方面考虑,决策的重要性、调研的性质、数据分析的性质、资源、抽样方法等都决定样本量的大小。但是这只能原则上确定样本量大小。具体确定样本量还需要从定量的角度考虑。 从定量的方面考虑,有具体的统计学公式,不同的抽样方法有不同的公式。归纳起来,样本量的大小主要取决于: (1研究对象的变化程度,即变异程度; (2要求和允许的误差大小,即精度要求; (3要求推断的置信度,一般情况下,置信度取为95%; (4总体的大小; (5抽样的方法。

也就是说,研究的问题越复杂,差异越大时,样本量要求越大;要求的精度越高,可推断性要求越高时,样本量也越大;同时,总体越大,样本量也相对要大,但是,增大呈现出一定对数特征,而不是线形关系;而抽样方法问题,决定设计效应的值,如果我们设定简单随机抽样设计效应的值是1;分层抽样由于抽样效率高于简单随机抽样,其设计效应的值小于1,合适恰当的分层,将使层内样本差异变小,层内差异越小,设计效应小于1的幅度越大;多阶抽样由于效率低于简单随机抽样,设计效应的值大于1,所以抽样调查方法的复杂程度决定其样本量大小。对于不同城市,如果总体不知道或很大,需要进行推断时,大城市多抽,小城市少抽,这种说法原则上是不对的。实际上,在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 二、样本量的确定方法 如何确定样本量,基本方法很多,但是公式检验表明,当误差和置信区间一定时,不同的样 本量计算公式计算出来的样本量是十分相近的,所以,我们完全可以使用简单随机抽样计算 样本量的公式去近似估计其他抽样方法的样本量,这样可以更加快捷方便,然后将样本量根 据一定方法分配到各个子域中去。所以,区域二相抽样不能计算样本量的说法是不科学的。 1.简单随机抽样确定样本量主要有两种类型: (1对于平均数类型的变量 对于已知数据为绝对数,我们一般根据下列步骤来计算所需要的样本量。已知期望调查 结果的精度(E, 期望调查结果的置信度(L,以及总体的标准差估计值σ的具体数据,总体

样本量计算

样本量计算 文档编制序号:[KK8UY-LL9IO69-TTO6M3-MTOL89-FTT688]

1.估计样本量的决定因素 资料性质 计量资料如果设计均衡,误差控制得好,样本可以小于30例; 计数资料即使误差控制严格,设计均衡, 样本需要大一些,需要30-100例。 研究事件的发生率 研究事件预期结局出现的结局(疾病或死亡),疾病发生率越高,所需的样本量越小,反之就要越大。 研究因素的有效率 有效率越高,即实验组和对照组比较数值差异越大,样本量就可以越小,小样本就可以达到统计学的显着性,反之就要越大。 显着性水平 即假设检验第一类(α)错误出现的概率。为假阳性错误出现的概率。α越小,所需的样本量越大,反之就要越小。α水平由研究者具情决定,通常α取或。 检验效能 检验效能又称把握度,为1-β,即假设检验第二类错误出现的概率,为假阴性错误出现的概率。即在特定的α水准下,若总体参数之间确实存在着差别,此时该次实验能发现此差别的概率。检验效能即避免假阴性的能力,β越小,检验效能越高,所需的样本量越大,反之就要越小。β水平由研究者具情决定,通常取β为,或。即1-β=,或,也就是说把握度为80%,90%或95%。容许的误差(δ)

如果调查均数时,则先确定样本的均数( )和总体均数(m)之间最大的误差为多少。容许误差越小,需要样本量越大。一般取总体均数(1-α)可信限的一半。 总体标准差(s) 一般因未知而用样本标准差s代替。 双侧检验与单侧检验 采用统计学检验时,当研究结果高于和低于效应指标的界限均有意义时,应该选择双侧检验,所需样本量就大; 当研究结果仅高于或低于效应指标的界限有意义时,应该选择单侧检验,所需样本量就小。当进行双侧检验或单侧检验时,其α或β的Ua界值通过查标准正态分布的分位数表即可得到。 2.样本量的估算 由于对变量或资料采用的检验方法不同,具体设计方案的样本量计算方法各异,只有通过查阅资料,借鉴他人的经验或进行预实验确定估计样本量决定因素的参数,便可进行估算。 护理中的量性研究可以分为3种类型:①描述性研究:如横断面调查,目的是描述疾病的分布情况或现况调查;②分析性研究:其目的是分析比较发病的相关因素或影响因素;③实验性研究:即队列研究或干预实验。研究的类型不同,则样本量也有所不同。 描述性研究

样本量的确定

样本量的确定 1. 二值分布(估计比例时的样本容量) 这种情况下,表明可能的采样结果只有两种情况,即是与非的问题。比如调查某一批产品的合格率。样本量的确定主要受以下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N ;通过置信水平即可查表确定z 。 通常情况下置信水平选择95%。抽样偏差为±5%,不过也不完全一定,抽样偏差的确定还是要考虑实际情况,比如最小的调查估计值p=5%,此时抽样偏差就应该小于5%。 这时,就可以确定样本量: 22 2 (1)(1)z p p n z p p e N -=-+ P 值的确定:用以前类似样本得到的结果来近似,如果完全不知道就设p=0.5,因为此时方差最大,可求得一个比较保守的样本容量。 样本容量和在p=0.5时运用简单随机抽样估计p 值得到的抽样偏差 e

如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 (1)z p p n e -= 事实上当总体容量很小时,不会采用抽样调查,而是普查了。 2. 正态分布(估计均值时的样本容量) 在这种情况下,表明采样的结果是具有多样性的,并不局限在0、1上。比如对某一城市老年人的患病年龄进行统计。这个时候,样本量同样受如下几个因素影响:置信水平α、所能接受的抽样偏差e (估计值与真实值的最大偏差)、总体数量N 。 样本量为: 22 22 2 z S n z S e N =+ S 表明的是总体标准差,这个可以用以前类似样本得到的S 或是实验调查样本的S 来近似。 同样,如果总体容量N 非常大,可近似为无穷,那么上面这个公式可简化成: 22 2 z S n e = 理论基础: 根据数理统计知识,样本均值对总体均值可构造如下统计量: x X u σ-,他满足标准正态分 布,查表即可得到某一显著性水平下这个统计量的值,这里面的x σ表示总体均值估计量的标准误差。 在无放回简单随机抽样情况下,总体均值估计量的标准误差表达式:

样本量的计算

而对于市场调查; 在市场研究中,常常有客户和研究者询问:“要掌握市场总体情况,到底需要多少样本量?”,或者说“我要求调查精度达到95%,需要多少样本量?”。对此,我往往感到难以回答,因为要解决这个问题,需要考虑的因素是多方面的:研究的对象,研究的主要目的,抽样方法,调查经费…。有人说,北京这么大,上千万人口,我们怎么也得做一万人的访问才能代表北京市吧。根据统计学原理,完全不必。只要在500-1000左右就够了。当然前提是,我们要按照科学的方法去抽样。 根据市场调查的经验,市场潜力等涉及量比较严格的调查所需样本量较大,而产品测试,产品定价,广告效果等人们间彼此差异不是特别大或对量的要求不严格的调查所需样本量较小些。 样本量的大小涉及到调研中所要包括的人数或单元数。确定样本量的大小是比较复杂的问题,既要有定性的考虑也要有定量的考虑。 从定性的方面考虑样本量的大小,其考虑因素有:决策的重要性,调研的性质,变量个数,数据分析的性质,同类研究中所用的样本量,发生率,完成率,资源限制等。具体地说,更重要的决策,需要更多的信息和更准确的信息,这就需要较大的样本;探索性研究,样本量一般较小,而结论性研究如描述性的调查,就需要较大的样本;收集有关许多变量的数据,样本量就要大一些,以减少抽样误差的累积效应;如果需要采用多元统计方法对数据进行复杂的高级分析,样本量就应当较大;如果需要特别详细的分析,如做许多分类等,也需要大样本。针对子样本分析比只限于对总样本分析,所需样本量要大得多。 具体确定样本量还有相应的统计学公式,根据样本量计算公式,我们知道,样本量的大小不取决于总体的多少,而取决于(1) 研究对象的变动程度;(2) 所要求或允许的误差大小; (3) 要求推断的置信程度。也就是说,当所研究的现象越复杂,差异越大时,样本量要求越大;当要求的精度越高,可推断性要求越高时,样本量越大。因此,如果不同城市分别进行推断时,"大城市多抽,小城市少抽"这种说法原则上是不对的。在大城市抽样太大是浪费,在小城市抽样太少没有推断价值。 总之,在确定抽样方法和样本量的时候,既要考虑调查目的,调查性质,精度要求(抽样误差)等,又要考虑实际操作的可实施性,非抽样误差的控制、经费预算等。专业调查公司在这方面会根据您的情况及调查性质,进行综合权衡,达到一个最优的样本量的选择。 实际研究中的一些经验 根据一些学者的研究,以及远东零点在市场研究中的经验,市场调查中确定样本量通常的做法是: 1、通过对方差的估计,采用公式计算所需样本量,主要做法有:

相关文档
最新文档