分层随机抽样及其excel分析

分层随机抽样及其excel分析
分层随机抽样及其excel分析

课程设计任务书

案例:某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,若采取分层比例抽样法,如何抽样?

下面针对案例对分层随机抽样进行大致说明。

一.分层随机抽样定义:

分层抽样也称类型抽样或分类抽样,就是将总体单位按一定标准(调研对象的属性、特征等)分组,然后在各个类型组中用纯随机抽样方式或其他抽样方式抽取样本单位,而不是在总体中直接抽取样本单位。

二.注意事项:

分层抽样必须注意以下问题:第一,必须有清楚的分层界限,在划分时不致发生混淆;第二,必须知道各层中的单位数目和比例;第三,分层的数目不宜太多,否则将失去分层的特征,不便在每层中抽样。

三.分层抽样步骤:

分层抽样的步骤包括:

(1)确认目标总体。

(2)决定样本数。

(3)决定分层标志。

(4)将总体按照分层标志分成若干类,其中每一类称为一层。

(5)在每一层中随机抽取出足够的样本。

四.具体做法及例子说明:

分层抽样的具体做法有以下两种:

1.等比例分层抽样。这种抽样法就是按照各层中样本单位的数目占总体单位数目的比例分配各层的样本数量。

[例]某教授对甲大学的学生消费倾向产生了兴趣,想对全校学生做抽样调查,总体有5 000人,欲抽样500人,则:

总体样本

一年级 2 000人一年级200人

二年级 1 500人二年级150人

三年级 1 000人三年级100人

四年级500人四年级50人

2.不等比例分层抽样,又称分层最佳抽样。这种抽样法不按各层中样本单位数占总体单位数的比例分配各层样本数,而是根据各层的标准差的大小来调整各层样本数目。该方法既考虑了各层在总体中所占比重的大小,又考虑了各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度,故也可将不等比例分层抽样称为分层信任程度抽样。[例]某公司要调研某地家用电器产品的潜在用户,这种产品的消费同居民收入水平有关,因

此以家庭收入为分层基础。假定该地居民户即总体单位数为20 000户,已确定调研样本数为200户。家庭收入分高、中、低三层,其中高档收入家庭为2 000户,占总体单位数的比重为10%;中等收入家庭为6 000户,占总体单位数的30%;低等收入家庭为12 000户,占总体单位数的60%。现又假定各层样本标准差为:高档收入家庭是300元,中等收入家庭是200元,低等收入家庭是50元。现要求根据分层最佳抽样法,确定各收入层家庭应抽取的户数各为多少? 公式n Si

Ni Si Ni ???∑ Ni 为i 层调查单位总数;ni 为i 层应抽的样本数目;si 为i 层调查单位标准差

为了便于观察,列表1如下。

表1 调研单位数与样本标准差乘积计算表

家庭收入分层 各层调研单位数

(潜在用户数) 各层的样本标准差 乘积 样本单位数

高 2 000 300 600 000 200×600 000÷2 400 000=50

中 6 000 200 1 200 000 200×1200000÷2400 000=100

低 12 000 50 600 000 200×600 000÷2 400 000=50

合计20 000 — 2 400 000 —

如果根据等比例分层抽样的话,那么,高档收入家庭的分层样本数为20户(200×10%);中等收入家庭的分层样本数为60户(200×30%);低等收入家庭的分层样本数为120户(200 ×60%)。将前后两种方法抽取的各层样本数做个对比,不难看出,相比于等比例分层抽样法,根据分层最佳抽样法抽取样本,则高档收入家庭的分层样本数增加了30户,中等收入家庭的分层样本数增加了40户;低等收入家庭的分层样本数则减少了70户。由于购买家用电器同家庭收入水平是成正比例变动的,所以,增加高、中档层的样本数,相应减少低档层的样本数,将有利于提高抽样的准确性。

对案例开始进行分析:

由上述可知该案例中应采取不等比例抽样。

由公式可以求出:

收入在10000以下的家庭户的样本量应为(180000/1000000)*1000=180.

收入在10000—30000的家庭户的样本量应为(350000/1000000)*1000=350.

收入在30000—60000的家庭户的样本量应为(3000000/1000000)*1000=300.

收入在60000以上的家庭户的样本量应为(170000/1000000)*1000=170.

其分层比例抽样示意图如下所示:

分层比例抽样示意图

总体

子样本

样本

案例的excel 实现过程:

因为在excel 中,抽样功能是作为一种扩展功能存在的,所以在应用时就应该先加载分析工具库。

点击工具,选择加载宏,再选择分析工具库。

单击“工具”菜单,再选择“数据分析”选项,打开“数据分析”对话框,从中选择“抽样”。

单击“抽样”选项,弹出“抽样”对话框。

在输入区域框中输入总体单位编号所在的单元格区域,如果输入区域的第二行或第一列为标志项(横行标题或纵列标题),可以选中“标志”复选框。

在抽样方法项下,有周期和随机两种抽样模式:“周期”模式即所谓的等距抽样。“随机”模式适用于纯随机抽样、分层抽样、整群抽样和多阶段抽样。在这里我们选择随机选项。

指定输出区域,单击“确定”后,即可得到抽样结果。

点击确定,可得抽样结果,得到与计算相同数量的分层抽样。

1简单随机抽样、系统抽样、分层抽样含答案

简单随机抽样、系统抽样、分层抽样 1.简单随机抽样的定义 设一个总体含有N 个个体,从中逐个不放回地抽取n 个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,就把这种抽样方法叫做简单随机抽样. 2.简单随机抽样的分类 简单随机抽样????? 抽签法随机数法 3.简单随机抽样的优点及适用类型 简单随机抽样有操作简便易行的优点,在总体个体数不多的情况下是行之有效的. 4.系统抽样的概念 先将总体中的个体逐一编号,然后按号码顺序以一定的间隔k 进行抽取,先从第一个间隔中随机地抽取一个号码,然后按此间隔依次抽取即得到所求样本. 5.系统抽样的步骤 假设要从容量为N 的总体中抽取容量为n 的样本,步骤为: (1)先将总体的N 个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等. (2)确定分段间隔k ,对编号进行分段.当N n (n 是样本容量)是整数时,取k =N n ; (3)在第1段用简单随机抽样确定第一个个体编号l(l≤k); (4)按照一定的规则抽取样本.通常是将l 加上间隔k 得到第2个个体编号(l +k),再加k 得到第3个个体编号(l +2k),依次进行下去,直到获取整个样本. 6.分层抽样的概念 在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样. 7.分层抽样的适用条件 分层抽样尽量利用事先所掌握的各种信息,并充分考虑保持样本结构与总体结构的一致性,这对提高样本的代表性非常重要.当总体是由差异明显的几个部分组成时,往往选

用excel进行随机抽样

方法: 在进行统计的时候,我们可能需要随机抽取一定数量的样本,比如从100个数中抽取40个,保证无重复性。 工具:Microsoft Excel 2013 步骤:1.选择“视图”-“宏”-“录制宏”,宏名任取,然后“确定”。 2.选择“宏”-“停止录制”;再选择“宏”-“查看宏”。 3.选择“编辑”按钮,将下面的代码粘贴覆盖原有代码。

以下复制粘贴 1.Sub Randx() 2.Dim xx(1 To 100) As Integer 3.For t = 1 To 40 4.rerand: 5.x = Int(Rnd() * 100 + 1) 6.If xx(x) > 0 Then GoTo rerand 7.r = r + 1 8.Cells(r, 1) = x 9.xx(x) = r 10.Next 11.End Sub 4.点击工具栏的按钮或者"F5"按钮,在excel的A列就可以发现随机生成的40个数了。 实践: 从2000个数中抽取51个,保证无重复性。

步骤1,2 同前 步骤3: 复制粘贴 1.Sub Randx() 2.Dim xx(1 To 2000) As Integer 3.For t = 1 To 50 4.rerand: 5.x = Int(Rnd() * 100 + 1) 6.If xx(x) > 0 Then GoTo rerand 7.r = r + 1 8.Cells(r, 1) = x 9.xx(x) = r 10.Next End Sub 步骤4同上 结果:

步骤5: 排序选中抽取的数字--- 点选excel 表的数据项----选择排序----确定

《分层抽样》教案

《分层抽样》教案 【教学目标】 1、正确理解分层抽样的概念;掌握分层抽样的一般步骤. 2、通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实际问题的方法. 3、通过对统计学知识的研究,感知数学知识中“估计”与“精确”性的矛盾统一,培养学生的辩证唯物主义的世界观与价值观. 【教学重点】分层抽样的概念和步骤;应用分层抽样方法解决部分实际问题. 【教学难点】对分层抽样方法的理解. 【教学过程】 一、创设情境,温故求新 1、复习提问 (1)为了了解我班65名同学的近视情况,准备抽取10名学生进行检查,应怎样进行抽取? (2)为了了解我校高二年级1403名学生的近视情况,准备抽取100名学生进行检查,应怎样进行抽取? 通过对学生采用不同抽样方法的原因进行提问,归纳总结:当总体中的个体数较少时采用简单随机抽样的方法,当总体中的个体数较多时采用系统抽样的方法. 2、新课引入

(3)为了了解我区高中生2400人,初中生10900人,小学生11000人的近视情况,要从中抽取1%的学生进行检查,应怎样进行抽取? 对于这个问题,我们还能不能采用前两节所学的简单随机抽样或系统抽样呢? 样本中应该高中生、初中生和小学生都有,那么他们应该按照什么比例来抽取呢? 为了尽可能地保证样本结构和总体结构的一致性,我们可以按各部分所占的比例进行抽取,抽取高中生、初中生和小学生各1%的人,即抽取 高中生:2400×1%=24(人) 初中生:10900×1%=109(人) 小学生:11000×1%=110(人) 然后再在各个学段用简单随机抽样或系统抽样的方法把这24人、109人和110人抽取出来,最后再将这些抽取出来的个体合在一起,即构成了我们所要调查的样本. 二、启发引导,形成概念 1、分层抽样的定义 根据刚才的分析,让学生思考讨论,引导学生给出分层抽样的定义. 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.

正态抽样及概率分布的EXCEL模拟演示

正态抽样及概率分布的EXCEL模拟 张庆远1 [摘要] 利用EXCEL办公软件的函数及VBA功能,编制正态分布抽样的演示程序,并根据所抽到的样本数据自动进行相应的统计分析,通过理论分布频数与计算出的实际分布频数比较,帮助学生加深理解正态分布的概率分布规律,辅助于医学统计学教学;该方法具有直观、形象、易用且快速得到结果等特点,使复杂的抽象理论变得形象而具体,极大提高了课堂教学效果。 [关键词] EXCEL 正态分布统计教学演示 在医学统计学教学过程中,正态分布规律是一个教学重点,也是统计学习所遇到的第一个概率分布规律。曾有老师以实际调查的方式指导学生对某校入学新生的相应体检指标数据进行统计分析[1],以达到帮助学生来加深对正态分布规律的认识和理解,但这种方法效率低,手工计算工作量大,在实际操作中会存在一定难度。也有以EXCEL制作简单的动态正态分布曲线的方式来进行课件展示[2],感觉也仅是将手工画正态分布曲线改为用多媒体来制作,少了抽样模拟的效果。 在借鉴他人经验的基础上[3],本人利用EXCEL的相关函数及VBA 功能,编制程序,模拟正态分布的抽样,并利用表格中的关联计算,即时完成对所抽到样本数据的统计描述分析,随时了解查看不同u值下样本数据的频数分布情况。 1、设计思路 给出一个假设已知其总体均数和总体标准差的正态分布总体,在要求的样本含量及精度的情况下,利用相应函数从中随机进行单个数据抽取,每抽出一个数据便依次写在相应列中,抽完后,做出该批样本数据的频数分布表,并自动绘出频数分布直方图,最后按照所给的不同标准正态分布u值,计算并比较相应理论频数分布与实际概率分布的吻合程度。 2 具体操作 首先用EXCEL新建一个文件,保存并命名为“正态抽样及概率分布的EXCEL演示”,接着在此文件SHEET1工作薄中相应单元格输入如下文字、公式代码或数值。 2.1 完成假设已知总体的总体均数及总体标准差的设置,见图1,其中B1、B2、B3、B4格子中可以自行设置已知总体的总体均数,总体标准差,欲抽样本含量值,及抽出样本值欲保留的小数位数;B5格中所输入公式可以完成以假设已知总体的相应参数为基础的一次正态抽样,抽出一个样本值显示在B5格中,通过编制相应程序,可以做到当抽样时,每抽出一个样本值后,便依次将其数值写在D列中保存,B7、B8、B9、B10、B11格中为即时根据所抽样本计算出的相应统计量值,以备下面进行频数表编制时组距的计算和组段的划分引用。同时在“视图”-“工具栏”下拉菜单中选中并打开“控件工具箱”,在B6格中添加一个按钮控件,其“caption”属性改为“开始抽样”,以便将来点击运行程序时使用。 1张庆远男讲师河南南阳医学高等专科学校基础部

随机抽样知识讲解

随机抽样 【学习目标】 1、了解简单随机抽样的概念,掌握实施简单随机抽样的常用方法:抽签法和随机数表法; 2、了解系统抽样的意义,并会用系统抽样的方法从总体中抽取样本; 3、了解分层抽样的概念与特征,清楚简单随机抽样、系统抽样、分层抽样的区别和联系. 【要点梳理】 要点一、简单随机抽样 简单随机抽样是一种最简单、最基本的抽样方法.抽样中选取个体的方法有两种:放回和不放回.我们在抽样调查中用的是不放回抽取. 1、简单随机抽样的概念: 一般地,从元素个数为N的总体中不放回地抽取容量为n的样本,如果每一次抽取时总体中的各个个体被抽到的可能性是相同的,那么这种抽样方法叫简单随机抽样,这样抽取的样本,叫做简单随机样本. 2、简单随机抽样的特点: (1)被抽取样本的总体个数N是有限的; (2)简单随机样本数n小于等于样本总体的个数N; (3)从总体中逐个进行抽取,使抽样便于在实践中操作; (4)它是不放回抽取,这使其具有广泛应用性; (5)每一次抽样时,每个个体等可能的被抽到,保证了抽样方法的公平性. 3、实施抽样的方法: (1)抽签法: 抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力又不方便,若标号的纸片或小球搅拌得不均匀还可能导致抽样的不公平.

抽签法的一般步骤: ①将总体中的N个个体编号; ②把这N个号码写在形状、大小相同的号签上; ③将号签放在同一箱中,并搅拌均匀; ④从箱中每次抽取一个号签,连续抽取n次; ⑤将总体中与抽到的号签的编号一致的n个个体取出. (2)随机数表法: 要理解好随机数表,即表中每个位置上等可能出现0,1,2,…,9这十个数字的数表.随机数表中各个位置上出现各个数字的等可能性,决定了利用随机数表进行抽样时抽取到总体中各个个体序号的等可能性. 随机数表法的步骤: ①将总体的个体编号(每个号码的位数一致); ②在随机数表中任选一个数字作为开始; ③从选定的数开始按一定的方向读下去,若得到的数码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止. 注意: ①选定开始数字,要保证所选数字的随机性; ②确定读数方向获取样本号码时,读数方向可向左、向右、向上、向下,样本号码不能重复,否则舍去. 要点诠释: 1、简单随机抽样是一种最简单、最基本的抽样方法,简单随机抽样有两种选取个体的方法:放回和不放回,我们在抽样调查中用的是不放回抽样,常用的简单随机抽样方法有抽签法和随机数法. 2、抽签法的优点是简单易行,缺点是当总体的容量非常大时,费时、费力,又不方便,如果标号的签搅拌得不均匀,会导致抽样不公平,随机数表法的优点与抽签法相同,缺点上当总体容量较大时,仍然不

在excel中产生随机数

用excel产生随机数 统计软件提供的随机数发生器可以使我们对抽样分布进行计算机模拟,对抽样分布有更加直观的理解。Excel的分析工具库中有一个“随机数发生器”模块,可以产生服从大部分常用分布的模拟数据,但没有提供直接产生随机数的函数。在SPSS中产生随机数的函数在“Randomnumbers”类别中,相应的函数都是以Rv 开头的。 1 样本均值抽样分布的随机模拟 假总体的均值为μ,标准差为σ,则统计理论表明,不论总体的分布如何,只要样本容量n足够大,样本均值的分布总会趋向于正态分布,且均值为μ,标 准差为。 例题:假设总体为均匀分布,模拟样本均值的抽样分布。 假设总体的分布为0-1区间上的均匀分布,则总体的均值为0.5,方差等于 1/12,标准差等于0.288675。现在,我们从总体中抽取1000个样本容量为2的样本(有放回抽样),计算每个样本的样本均值,然后观察样本均值的分布状况。 新建一个Excel工作簿,单击“工具”“数据分析”“随机数发生器”,在弹出的对话框中把变量个数设为2,随机数个数为1000,选择0-1区间的均匀分布,结果放在新工作表中(图1)。把输出结果的每一行看作一个容量为2的样本,共有1000个样本。在C列中计算每个样本的均值。接下来我们就可以分析这1000个样本均值的分布状况了。由于SPSS的直方图工具更为方便,我们把相应的数据复制到SPSS中作直方图,结果如图2,抽样分布的均值为0.5097,标准差为 0.20345,理论值等于0.288675/ 2 =0.20412,两者差异不大。 图1 随机数发生器对话框

图2 样本均值的抽样分布,样本容量=2 2 样本比例抽样分布的随机模拟 样本比例实质上就是指标数值只能取0和1时的样本均值。由于在这种情况下总体的分布为0-1分布,因此在重复抽样的条件下样本均值抽样分布的理论分布是二项分布。中心极限定理表明当样本用量足够大(能够保证np≥5,nq≥5)时二项分布可以用正态分布来近似。 [例] 假设有大批零件,不合格率p为0.2。随机模拟从总体中抽取样本容量分别为5,20,50的2000个样本,分析样本比例p? 的抽样分布。 新建一个工作表,在单元格中输入图5-10左上角所示的信息作为总体:总体中取值为1(不合格)的概率为0.2,取值为0(合格)的概率为0.8。 图3 二项分布的随机模拟

谈谈几种典型的抽样方法(案例)

谈谈几种典型的抽样方法(案例) 学院:经济学院 班级: 08经41 学号: 08084004 姓名:毛雪晨 日期: 2011年10月20日

摘要:本文以抽样方法为中心,主要阐述几种常见的抽样方法,如简单随机抽样,分层抽样,整群抽样,系统抽样以及配额抽样,探讨了各种抽样方法在实际生活的应用以及各自的优缺点等。 关键词:抽样调查,应用,缺点。

导语:抽样调查是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法。显然,抽样调查虽然是非全面调查,但它的目的却在于取得反映总体情况的信息资料,因而,也可起到全面调查的作用。 抽样调查是建立在随机原则基础上,从总体中抽取部分单位进行调查,并概率估计原理,应用所的资料对总体的数量特征进行推断的一种调查方法。例如,从某地区全部职工当中随机抽取部分职工,以家庭为单位按月调查取得有关收入、支出等方面的资料,并依据这些资料推断出全区职工的收支情况,这就是一种抽样调查。从调查方法上来看,它是属于一种非全面调查。但又与一般调查不同,它不只停留于搜集资料和整理资料,而且还要对资料进行分析,并据以推断总体的数量特征,从而提高统计的认识能力。因此,抽样调查的理论和方法在统计中占有很重要的地位。 下面介绍一下常用的抽样方法: 一. 简单随机抽样 一般,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样。 简单随机抽样的具体作法有:直接抽选法,抽签法,随机数法。 直接抽选法例如某项调查采用抽样调查的方法对某市职工收入状况进行研究,该市有职工56,000名,抽取5,000名职工进行调查,他们的年平均收入为10,000元,据此推断全市职工年收入为8,000--12,000元之间。 抽签法又称“抓阄法”。它是先将调查总体的每个单位编号,然后采用随机的方法任意抽取号码,直到抽足样本。在这里选取一个案例说明,如要在10个人中选取3个人作为代表,先把总体中的10个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取3次,就得到一个容量为3的样本。这就是抽签法,与直接抽样法类似。 另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算

统计学excel实验答案(版)

Excel在统计学中的应用 用Excel搜集与整理数据 用Excel搜集数据 统计数据的收集是统计工作过程的基础性环节,方法有多种多样,其中以抽样调查最有代表性。在抽样调查中,为保证抽样的随机性,需要取得随机数字,所以我们在这里介绍一下如何用Excel生成随机数字并进行抽样的方法。需要提醒的是,在使用Excel进行实习前,电脑中的Excel需要完全安装,所以部分同学电脑中的office软件需要重新安装,否则实习无法正常进行。本书中例题全部用Excel2007完成。 使用Excel进行抽样,首先要对各个总体单位进行编号,编号可以按随机原则,也可以按有关标志或无关标志,具体可参见本书有关抽样的章节,编号后,将编号输入工作表。 1.我们假定统计总体有200个总体单位,总体单位的编号从1到200,输入工作表后如图10-1所示: 图10-1 总体各单位编号表 各总体单位的编号输入完成后,可按以下步骤进行操作: 第一步:选择数据分析选项(如果你使用的是Excel2003,单击工具菜单,若无数据分析选项,可在工具菜单下选择加载宏,在弹出的对话框中选择分析工具库,便可出现数据分

析选项;如果你使用的是Excel2007,点击左上角Office标志图标,Excel选项,加载项,在下面的管理下拉列表中选择“Excel加载项”,转到,勾选“分析工具库”,确定。),打开数据分析对话框,从中选择抽样。如图10-2所示。 图10-2数据分析对话框 第二步:单击抽样选项,确定后弹出抽样对话框。如图10-3: 图10-3 抽样对话框 第三步:在输入区域框中输入总体单位编号所在的单元格区域,在本例是$A$1:$J$20,系统将从A列开始抽取样本,然后按顺序抽取B列至J列。如果输入区域的第一行或第一列为标志项(横行标题或纵列标题),可单击标志复选框。 第四步:选择“随机模式”,样本数为10。 在抽样方法项下,有周期和随机两种抽样模式。 “周期”模式即所谓的等距抽样(或机械抽样),采用这种抽样方法,需将总体单位数除以要抽取的样本单位数,求得取样的周期间隔。如我们要在200个总体单位中抽取10个,则在“间隔”框中输入20;如果在200个总体单位中抽取24个,则在“间隔”框中输入8

分层抽样 例题文档

第三章分层随机抽样书P129 3.1.某高校欲了解教职员工对某项津贴与职务职称挂钩的分配制度改革的态度,准备在全校教职员工中进行抽样调查,为了提高抽样技术,准备进行分层抽样,请判断下面的几种分层方法是否合适? (1)按性别分层 (2)按教师、行政管理人员、职工分层; (3)按职称)(正高、副高、中级、初级、其他)分层 (4)按部门(如系、所、处)分层 3.2. 某学院4个专业的新生元旦晚会,组织者为了活跃气氛,欲在800名学生中抽出8名作为“幸运星”,为了以示公平,要求每位学生被抽中的概率相同。组织者知道利用简单随机抽样的方法可以满足要求,你能不能帮助组织者再设计几种方案? 3.3.某居委会辖有三个居民新村,居委会欲对居民购买彩票情况进行调查,调查者考虑以新村分层,在每个新村中随机抽取了10个居民户最近一个月购买彩票所花费的金额(元),下表是每个新村及调查情况: (1)试估计该小区居民户购买彩票的平均支出,并给出估计标准差。 (2)当置信度为95%,要求极限误差不超过10%时,按比例和奈曼分配时样本量及各层的样本量分别为多少? 3.4.随着经济发展,某市居民年生活习惯在改变,为研究该现象,某机构以市中心163万居民户作为研究对象,将居民户按6个行政分层,在每个行政区随机抽出30户居民进行调查,(各层抽样比可忽略),调查结果如下:

(1)试估计该市居民在家吃年夜饭的比例,并给出估计的标准差。 (2)置信度为95%,要求极限绝对误差不超过1%时,按比例和奈曼分配时样本 量及各层的样本量分别为多少? 3.5.某开发区利用电话调查对区内冷冻食品情况进行调查(各层抽样比忽略)调查后各层样本户购买冷冻食品支出的中间结果如下表: 试估计该开发区居民购买冷冻食品的平均支出,以及估计的95%的置信区间。 3.6.某单位欲估计职工的离职意愿,聘请了专业公司来进行调研,公司人员按高级职称、中级职称和初级职称分为3层,已知层权分别为0.2,0.3,0.5,预先猜测各层的总体比例为:0.1,0.2,,0.4,如果采用按比例的分层抽样,要求估计的方差与样本量为100的简单随机抽样相当,则样本量为多少?(不考虑有限总体校正系数) 3.7.如果一个大的简单随机样本按类别分为6组,然后按照层的实际大小重新进行加权,这一过程称为事后分层,才用这种方法是由于(判断以下说法的

分层、分段随机抽样的区别

分层、分段随机的区别简单随机抽样,也叫纯随机抽样。就是从总体中不加任何分组、划类、排队等,完全随机地抽取调查单位。 分段抽样又称多级抽样或多阶段抽样,就是把从总体中抽取样本的过程分成两个或多个阶段进行的抽样方法。它是在总体内个体单位数量较大,而彼此间的差异不太大时,先将总体各单位按一定标志分成若干群体,作为抽样的第1阶段单位,并依照随机原则,从中抽出若干群体作为第1阶段样本;然后将第1阶段样本又分成若干小群体,作为抽样的第2阶段单位,从中抽出若干群体作为第2阶段样本,依此类推,直到满足需要为止。最末阶段抽出的样本单位的集合,就是最终形成的总体样本。一般在抽取前阶段样本时采用分类抽样或等距抽样,抽取后阶段样本时用整群抽样或简单随机抽样。多阶段抽样的意义在于缩小总体范围,提高抽样效率,降低抽样成本。其最大优点就是可以达到以最小的人财物消耗和最短的时间获得最佳调查效果的目的,特别适用于调查范围大、单位多、情况复杂的调查对象。此外,多阶段抽样由于在各阶段抽样时可根据具体情况灵活选用不同的抽样方法,所以能够综合各种抽样方法的优点,有利于提高样本质量。多阶段抽样的不足之处是抽样误差较大。由于每次抽样都必然产生误差,所以抽样阶段越多抽样误差就越大。

分层抽样,也叫类型抽样。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。群集抽样法即将母体按某种标准分为若干群集(cluster) ; 其次,以群集为抽样单位。然后,由这些群集中用简单随机抽样法抽出若干群集为一组群集样本,这种抽样程序即称为群集随机抽样法。其所抽出的样本称为群集样本。 系统抽样,也叫机械抽样或等距抽样。是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:抽出的单位在总体中是均匀分布的,且抽取的样本可少于纯随机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。

分层抽样教案

河南省2010年高中数学优质课大赛教案 2.1.3分层抽样 洛阳市第十九中学郭歌 2010. 9

《分层抽样》教案 教材:人教版普通高中课程标准实验教科书(必修3) 授课教师:洛阳市第十九中学郭歌 【教学目标】知识与技能目标: 正确理解分层抽样的概念;掌握分层抽样的一般步骤. 过程与方法目标: 通过对现实生活中实际问题进行分层抽样,感知应用数 学知识解决实际问题的方法. 情感与价值观目标: 通过对统计学知识的研究,感知数学知识中“估计”与 “精确”性的矛盾统一,培养学生的辩证唯物主义的世 界观与价值观. 【教学重点】分层抽样的概念和步骤;应用分层抽样方法解决部分实际问题. 【教学难点】对分层抽样方法的理解. 【教学方法】教师启发讲授,学生探究学习. 【教学手段】计算机、投影仪、自制教具. 【教学过程】 一、创设情境,温故求新 在《淮南子?说山训》中有这样一句话:“以小明大,见一叶落而知岁之将暮,睹瓶中之冰而知天下之寒.”由此引出本章所学内容“统计”的本质.

1、复习提问 (1)为了了解我班50名同学的近视情况,准备抽取10名学生进行检查,应怎样进行抽取? (2)为了了解我校高一年级700名学生的近视情况,准备抽取100名学生进行检查,应怎样进行抽取? 通过对学生采用不同抽样方法的原因进行提问,归纳总结:当总体中的个体数较少时采用简单随机抽样的方法,当总体中的个体数较多时采用系统抽样的方法. 2、新课引入 (3)为了了解我区高中生2400人,初中生10900人,小学生11000人的近视情况,要从中抽取1%的学生进行检查,应怎样进行抽取? 对于这个问题,我们还能不能采用前两节所学的简单随机抽样或系统抽样呢? 高中生、初中生和小学生的近视程度有差异,用简单随机抽样或系统抽样所得样本中可能会出现高中生过少或绝大部分是初中生的情况,所得样本代表性较差. 样本中应该高中生、初中生和小学生都有,那么他们应该按照什么比例来抽取呢? 为了尽可能地保证样本结构和总体结构的一致性,我们可以按各部分所占的比例进行抽取,抽取高中生、初中生和小学生各1%的人,即抽取 高中生:2400×1%=24(人)

分层随机抽样(答案)

分层随机抽样 一、单选题 1、分层抽样设计效应满足(B ) A 、1deff = B 、1deff < C 、1deff ≈ D 、1deff > 2、分层抽样的特点是(A ) A 、层内差异小,层间差异大 B 、层间差异小,层内差异大 C 、层间差异小 D 、层内差异大 3、下面的表达式中错误的是(D ) A 、 ∑=1h f B 、∑=n n h C 、∑=1h W D 、∑=1h N 4、在给定费用下估计量的方差)(st y V 达到最小,或者对于给定的估计量方差V 使得总费用达到最小的样本量分配称为(C ) A 、常数分配 B 、比例分配 C 、最优分配 D 、奈曼分配 5、最优分配(opt V )、比例分配(prop V )的分层随机抽样与相同样本量的简单随机抽样(srs V )的精度之间的关系式为(A ) A 、srs prop opt V V V ≤≤ B 、srs opt prop V V V ≤≤ C 、srs opt prop V V V ≥≥ D 、opt prop srs V V V ≤≤ 6、下面哪种样本量分配方式属于比例分配?( A) A 、 N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑== 1 C 、 ∑==L h h h h h h S N S N n n 1 D 、 ∑==L h h h h h h S W S W n n 1 7、下面哪种样本量分配属于一般最优分配?( B) A 、N n N n h h = B 、h L h h h h h h h c S N c S N n n ∑== 1

分层抽样练习题

第3课时6.1.3分层抽样 分层训练 1.高一、高二、高三学生共3200名,其中高三800名,如果通过分层抽样的方法从全体学生中抽取一个160人的样本,那么应当从高三年级的学生中抽取的人数是( ) (A)160 (B)40 (C)80 (D)320 2.某年级有10个班,每个班同学按1~50编号,为了了解班上某方面情况,要求每班编号为10号的同学去开一个座谈会,这里运用的抽样方法是() (A)分层抽样(B) 系统抽样 (C)简单随机抽样(D)抽签法 3.某校共有2500名学生,其中男生1300名,女生1200名,用分层抽样法抽取一个容量为200的样本,则男生应抽取____________名. 4.一个公司有N个员工,下设一些部门,现采用分层抽样方法从全体员工中抽取一个容量为n的样本(N 是n的倍数)。已知某部门被抽取m个员工,那么这一部门的员工数是____________. 5.某校高中部有学生950人,其中高一年级学生350人,高二年级学生400人,其余为高三年级学生,若采用分层抽样从高中部所有学生中抽取一个容量为190的样本,则每个年级应该抽取多少人?高一 _______,高二_____. 6.某年的有奖邮政明信片销售活动中,规定每100万张为一个开奖组,通过随机抽取的方式,确定号码后四位为2709的获得三等奖。这是运用什么方法来确定三等奖号码的?共有多少个三等奖号码? 7.系统抽样法,分层抽样法适用的范围分别是_______________________________________和 ____________________________________ 8.某工厂中共有职工3000人,其中,中、青、老职工的比例为5:3:2,从所有职工中抽取一个容量为400的样本,应采取哪种抽样方法较合理?且中、青、老年职工应分别抽取多少人? 思考?运用 9.某社区有500个家庭,其中高收入家庭125户,中等收入家庭280户,低收入家庭95户,为了调查社会购买力的某项指标,要从中抽取一个容量为100户的样本; 某学校高一年级有12名女排运动员,要从中抽取人调查学习负担情况。 试讨论上述两个抽样分别采取何种方式为佳 10.某家电商场根据2005年彩电市调查显示:“康佳”、“长虹”、“TCL”、“海信”、“熊猫”彩电分别占市场份额的19%、18%、17%、8%、3%.商场根据以上数据进“康佳”、“海信”、“熊猫”三种品牌的彩电共3000台,现欲从这三种品牌的彩电中随机抽取60台进行售后服务跟踪调查,请你设计一个抽样方案,并简述其步骤。若商场进的是“康佳”、“长虹”、“TCL”三种品牌的彩电3000台,该抽样方案该如何调整? 本节学习疑点:

抽样调查-分层抽样实验报告

实验报告 实验思考题: 1、某调查员欲从某大学所有学生中抽样调查学生平均生活费支出情况,假设该调查员已经 完成了抽样,并获得样本情况(见样本文件),请根据此样本分别按性别、家庭所在地分层,并计算各层的样本量、平均生活费支出、生活费支出的方差及标准差。 (1)先对数据按照家庭所在地进行排序:【数据】→【排序】,选择“家庭所在地”(2)再对数据进行分类汇总:【数据】→【分类汇总】,“分类字段”选择“家庭所在地”,“汇总方式”选择“平均值”,“选定汇总项”选择“平均月生活费”,在对话框下方选择“汇总结果显示在数据下方”;再做两次分类汇总,“汇总方式”分别选择“计数”和“标准偏差”。最后得到表1-1所示结果: 表1-1 家庭所在地平均月生活费 大型城市平均值 大型城市计数86 大型城市标准偏差 乡镇地区平均值 乡镇地区计数68 乡镇地区标准偏差 中小城市平均值 中小城市计数118 中小城市标准偏差 总计平均值 总计数272 总计标准偏差

(3)在SPSS软件中得出的计算结果: 选择————,然后在出现的对话框中 分别在“Dependent list”框中选入“家庭所在地”,在“Independent List”框中选入“平均月生活费”,得到如表1-2所示结果: 表1-2 Report 平均月生活费 家庭所在地Mean N Std. Deviation 大型城市86 乡镇地区68 中小城市118 Total272 选择——,在出现的对话框中选择“function”选择估计量,得到如图1-2所示结果: 图1-1 图1-2

选择————,出现如下图所示对话框,并按照下图1-3中所选项进行操作: 得到如下图表的结果: Case Processing Summary 家庭所在地 Cases Valid Missing Total N Percent N Percent N Percent 平均月生活费大型城市86%0.0%86%乡镇地区68%0.0%68% 中小城市118%0.0%118% Descriptives 家庭所在地Statistic Std. Error 平均月生活费大型城市Mean 95% Confidence Interval for Mean Lower Bound Upper Bound 5% Trimmed Mean Median Variance

常见的随机抽样方法介绍

抽样方法介绍 朱一军 福建省产品质量检验研究院 、随机方法选择及随机数产生 按照GB/T 10111-2008《随机数的产生及其在产品质量抽 样检验中的应用程序》的要求,并根据受检单位的产品堆放形式、基数(批量)大 小,确定抽样方法(通常包括简单随机抽样、分层随机抽样、系统抽样、整群抽 样、全数抽样五种方法 )。 随机数一般可使用随机数表、骰子或扑克牌中任选一种方式产生。 (一)简单随机抽样 (抽签法、随机样数表法)常常用于总体个数较少时,它的主要特征是从总 体中逐个抽取; 优点:操作简便易行 缺点:总体过大不易实行 1.定义: 一般地,设一个总体含有N个个体,从中逐个不放回地抽取 n个个体作为样本(nW N ,如果每次抽取式总体内的各个个体被抽到的机会都相 等,就把这种抽样方法叫做简单随机抽样。 2.简单随机抽样方法 (1)抽签法 一般地,抽签法就是把总体中的N个个体编号,把号码写在 号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取 n次,就得到一个容量为n的样本。

抽签法简单易行,适用于总体中的个数不多时。当总体中 的个体数较多时,将总体“搅拌均匀”就比较困难,用抽签法产生的样本代表性差的可能性很大) 2)随机数法 随机抽样中,另一个经常被采用的方法是随机数法,即利用随机数表、随机数骰子或计算机产生的随机数进行抽样。 二)分层抽样 Stratified Random Sampling) 主要特征分层按比例抽 样,主要使用于总体中的个体有明显差异。共同点:每个个体被抽到的概率都相等N/M。 定义 般地,在抽样时,将总体分成互不交叉的层,然后按照 定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样 stratified sampling )。 三)系统抽样 当总体中的个体数较多时,采用简单随机抽样显得较为费事。这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。 步骤: 般地,假设要从容量为N 的总体中抽取容量为n 的样本, 我们可以按下列步骤进行系统抽样: (1)先将总体的N个个体编号。 (2)确定分段间隔k,对编号 进行分段。当N/n (n是样本

分层随机抽样及其excel分析

课程设计任务书

案例:某公司要估计某地家用电器的潜在用户。这种商品的消费同居民收入水平相关,因而以家庭年收入为分层基础。假定某地居民为1,000,000户,已确定样本数为1,000户,家庭年收入分10,000元以下,10,000——30,000元;30,000——60,000元,60,000元以上四层,其中收入在10,000元以下家庭户为180,000户,收入在10,000——30,000元家庭户为350,000户,收入在30,000——60,000元家庭户为3000,000户,收入在60,000元以下家庭户为170,000户,若采取分层比例抽样法,如何抽样? 下面针对案例对分层随机抽样进行大致说明。 一.分层随机抽样定义: 分层抽样也称类型抽样或分类抽样,就是将总体单位按一定标准(调研对象的属性、特征等)分组,然后在各个类型组中用纯随机抽样方式或其他抽样方式抽取样本单位,而不是在总体中直接抽取样本单位。 二.注意事项: 分层抽样必须注意以下问题:第一,必须有清楚的分层界限,在划分时不致发生混淆;第二,必须知道各层中的单位数目和比例;第三,分层的数目不宜太多,否则将失去分层的特征,不便在每层中抽样。 三.分层抽样步骤: 分层抽样的步骤包括: (1)确认目标总体。 (2)决定样本数。 (3)决定分层标志。 (4)将总体按照分层标志分成若干类,其中每一类称为一层。 (5)在每一层中随机抽取出足够的样本。 四.具体做法及例子说明: 分层抽样的具体做法有以下两种: 1.等比例分层抽样。这种抽样法就是按照各层中样本单位的数目占总体单位数目的比例分配各层的样本数量。 [例]某教授对甲大学的学生消费倾向产生了兴趣,想对全校学生做抽样调查,总体有5 000人,欲抽样500人,则: 总体样本 一年级 2 000人一年级200人 二年级 1 500人二年级150人 三年级 1 000人三年级100人 四年级500人四年级50人 2.不等比例分层抽样,又称分层最佳抽样。这种抽样法不按各层中样本单位数占总体单位数的比例分配各层样本数,而是根据各层的标准差的大小来调整各层样本数目。该方法既考虑了各层在总体中所占比重的大小,又考虑了各层标准差的差异程度,有利于降低各层的差异,以提高样本的可信程度,故也可将不等比例分层抽样称为分层信任程度抽样。[例]某公司要调研某地家用电器产品的潜在用户,这种产品的消费同居民收入水平有关,因

分层随机抽样的SAS实现

分层随机抽样的SAS实现 摘要:本文首先分别就抽样和分层随机抽样进行了简单介绍,然后利用SAS 宏指令和函数给出了分层抽样的SAS实现程序并简要阐述了决定系数的使用方法。 抽样方法(Sampling Method)是按照一定程序,从所研究对象的全体(母体)中抽取一部份(样本)进行调查或观查,并在一定的条件下,运用数理统计的原理和方法,对母体的数量特征进行估计和推断。 抽样方法可分为随机抽样(亦称为机率抽样Probability Sampling)和非随机抽样(亦称为非机率抽样Non-Probability Sampling)两大类,这两类的抽样方法都被经常地使用。随机抽样是指按照机率原则,从母体中抽取一定数目的单位元作为样本进行观察,随机抽样使母体中每个单位都有一定的机率被选入样本,从而使根据样本所做出的结论对母体具有充分的代表性。非随机抽样则是以方便为出发点或根据研究者主观的判断来抽取样本。非随机抽样主要依赖研究者个人的经验和判断,它无法估计和控制抽样误差(sampling error),亦无法用样本的量化数据来推断母体。 在所有抽样方法中,属分层抽样(Stratified Sampling)法所应用的范围最广与最多。它是先将母体所有单位按某些重要因素进行分类(层),然后在各类(层)中采用简单随机抽样(simple random sampling)或系统抽样(system sampling)方式抽取样本单位。分层抽样比简单随机抽样和系统抽样更为精确,能够通过对较少的抽样单位的调查,得到比较准确的推断结果,特别是当母体较大、内部结构复杂时,分层抽样常能取得令人满意的效果。同时,分层抽样在对母体推断的同时,还能获得对每层的推论。 分层抽样的方式,一般有等比例抽样与非等比例抽样。等比例抽样,要求各类样本单位数的分配比例与母体单位在各类的分配比例一致。等比例抽样简便易行且分配比较合理,在实际工作中应用较广。非等比例抽样,不受上述条件限制,即有的层可多抽些样本单位,有的层也可少抽些样本单位。非等比例抽样大多适用于各层的单位数相差悬殊,或层内变异数相差较大的情形。在这种情况下,如按等比例抽样,可能在母体单位数少的层中抽取样本单位数过少,代表性不足,则可适当放宽多抽;同样,层内变异触较大的,也可多抽些样本单位。但是在实际运作前要准确了解各层标志变异程度大小是比较困难的。 可将本文中母体视为一个庞大的数据库,而所做的抽样工作即是在这数据库中抽取具有代表性的样本点。 在设计抽样方法的过程中,最具有关键性的角色即是选择何种抽样方法。抽样设计的方法有很多种,一般较常用的就属分层随机抽样法。在统计推论时,即是由样本数据对母体进行推估,如何找出抽样比也是一个相当重要的问题。 本文运用SAS宏指令及一些函数,编写了一个抽样程序,并简要阐述了决定系数的使用方法。 SAS Macro程序 A. 仿真产生1000笔数据

Excel随机抽样的简单方法

Excel随机抽样的简单方法 比如,如果您的Excel有1000人,想从这1000个人当中抽出100个人来做样品,那么,如何做呢?当然,前提条件是,抽样出来的这100个人,不是重复的人。我们可以使用的函数的方法和VBA的方法来解决上述或类似的难题。 说白了,所谓的抽样,无非就是取随机数的问题。 一、使用函数实现抽样 如不懂VBA,可使用如下的蓄意循环运算办法, 但理论上不是100%会成功的, 而且数字太多, 比较费时。 A1输入 =IF(SUM($B$1:$B$100)<>100,INT(RAND()*1000+1),A1) B1 输入 =COUNTIF($A$1:$A4100,A1) 将A1:B1 下拖至 A100:B100 然后执行菜单操作:工具→选项→计算→重复运算;打勾→最高次数 10000次→确定,A1:B100 便会不停运算。 如运算 10000次后, 尚未成功, 可再按 F9, 再执行运算, 直至成功;如成功, 应即马上将 A1:A100 做黏贴值, B1:B100 清除内容, 及将重复运算脱勾, 完成。 二、使用VBA抽样的方法 条件为:1 至 1000内, 选 100个不重复的随机数(要正整数)。 由于需要不重复的变量, 所以必须要经循环程序去判断。

最简单的方法, 是执行宏, 可用如下的代码, 100个不重复的变量便马上显示在A1:A100 Sub 我的抽样() Dim xx(1 To 1000) As Integer For t = 1 To 100 rerand: x = Int(Rnd() * 1000 + 1) If xx(x) > 0 Then GoTorerand r = r + 1 Cells(r, 1) = x xx(x) = r Next End Sub

必修3教案2.1.3 分层抽样

2.1.3 分层抽样 教学目标: 1、知识与技能: (1)正确理解分层抽样的概念; (2)掌握分层抽样的一般步骤; (3)区分简单随机抽样、系统抽样和分层抽样,并选择适当正确的方法进行抽样。 2、过程与方法:通过对现实生活中实际问题进行分层抽样,感知应用数学知识解决实际问题的方法。 3、情感态度与价值观:通过对统计学知识的研究,感知数学知识中“估计 与“精确”性的矛盾统一,培养学生的辩证唯物主义的世界观与价值观。 4、重点与难点:正确理解分层抽样的定义,灵活应用分层抽样抽取样本,并恰当的选择三种抽样方法 解决现实生活中的抽样问题。 教学设想: 【创设情景】 假设某地区有高中生2400人,初中生10900人,小学生11000人,此地 教育部门为了了解本地区中小学的近视情况及其形成原因,要从本地区的 小学生中抽取1%的学生进行调查,你认为应当怎样抽取样本? 【探究新知】 一、分层抽样的定义。 一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样的方法叫分层抽样。 【说明】分层抽样又称类型抽样,应用分层抽样应遵循以下要求: (1)分层:将相似的个体归人一类,即为一层,分层要求每层的各个个体互不交叉,即遵循不重复、不遗漏的原则。 (2)分层抽样为保证每个个体等可能入样,需遵循在各层中进行简单随机抽样,每层样本数量与每层个体数量的比与这层个体数量与总体容量的比相等。 二、分层抽样的步骤: (1)分层:按某种特征将总体分成若干部分。 (2)按比例确定每层抽取个体的个数。 (3)各层分别按简单随机抽样的方法抽取。 (4)综合每层抽样,组成样本。 【说明】 (1)分层需遵循不重复、不遗漏的原则。 (2)抽取比例由每层个体占总体的比例确定。 (3)各层抽样按简单随机抽样进行。 探究交流 (1)分层抽样又称类型抽样,即将相似的个体归入一类(层),然后每层抽取若干个体构成样本,所以分层抽样为保证每个个体等可能入样,必须进行 () A、每层等可能抽样 B、每层不等可能抽样 C、所有层按同一抽样比等可能抽样

相关文档
最新文档