正态抽样及概率分布的EXCEL模拟演示

正态抽样及概率分布的EXCEL模拟演示
正态抽样及概率分布的EXCEL模拟演示

正态抽样及概率分布的EXCEL模拟

张庆远1

[摘要] 利用EXCEL办公软件的函数及VBA功能,编制正态分布抽样的演示程序,并根据所抽到的样本数据自动进行相应的统计分析,通过理论分布频数与计算出的实际分布频数比较,帮助学生加深理解正态分布的概率分布规律,辅助于医学统计学教学;该方法具有直观、形象、易用且快速得到结果等特点,使复杂的抽象理论变得形象而具体,极大提高了课堂教学效果。

[关键词] EXCEL 正态分布统计教学演示

在医学统计学教学过程中,正态分布规律是一个教学重点,也是统计学习所遇到的第一个概率分布规律。曾有老师以实际调查的方式指导学生对某校入学新生的相应体检指标数据进行统计分析[1],以达到帮助学生来加深对正态分布规律的认识和理解,但这种方法效率低,手工计算工作量大,在实际操作中会存在一定难度。也有以EXCEL制作简单的动态正态分布曲线的方式来进行课件展示[2],感觉也仅是将手工画正态分布曲线改为用多媒体来制作,少了抽样模拟的效果。

在借鉴他人经验的基础上[3],本人利用EXCEL的相关函数及VBA 功能,编制程序,模拟正态分布的抽样,并利用表格中的关联计算,即时完成对所抽到样本数据的统计描述分析,随时了解查看不同u值下样本数据的频数分布情况。

1、设计思路

给出一个假设已知其总体均数和总体标准差的正态分布总体,在要求的样本含量及精度的情况下,利用相应函数从中随机进行单个数据抽取,每抽出一个数据便依次写在相应列中,抽完后,做出该批样本数据的频数分布表,并自动绘出频数分布直方图,最后按照所给的不同标准正态分布u值,计算并比较相应理论频数分布与实际概率分布的吻合程度。

2 具体操作

首先用EXCEL新建一个文件,保存并命名为“正态抽样及概率分布的EXCEL演示”,接着在此文件SHEET1工作薄中相应单元格输入如下文字、公式代码或数值。

2.1 完成假设已知总体的总体均数及总体标准差的设置,见图1,其中B1、B2、B3、B4格子中可以自行设置已知总体的总体均数,总体标准差,欲抽样本含量值,及抽出样本值欲保留的小数位数;B5格中所输入公式可以完成以假设已知总体的相应参数为基础的一次正态抽样,抽出一个样本值显示在B5格中,通过编制相应程序,可以做到当抽样时,每抽出一个样本值后,便依次将其数值写在D列中保存,B7、B8、B9、B10、B11格中为即时根据所抽样本计算出的相应统计量值,以备下面进行频数表编制时组距的计算和组段的划分引用。同时在“视图”-“工具栏”下拉菜单中选中并打开“控件工具箱”,在B6格中添加一个按钮控件,其“caption”属性改为“开始抽样”,以便将来点击运行程序时使用。

1张庆远男讲师河南南阳医学高等专科学校基础部

2.2 完成所抽样本数据频数表的编制,见图2。其编制思想为以样本中最小值做为起始组段,以极差的1/10距离为组距,将频数表划分为11个组段,其中A15-A25格中即为所计算的相应组段下限值;B15-B25格为各组段区间标示;C15-C25格子为计算各组段所含样本数据的频数。C26格为所计算频数和,以便检测频数表中样本频数是否与B3中样本例数是否相同。此频数表即可为后面做图用,也可为观察频数分布状态做参考。

2.3理论频数分布与实际频数分布的比较表格设置,见图3和图4;此表可以按所给u值计算任意u值情况下在取值上下限范围内的实际样本数据频数,然后计算中相应的双侧中间部分的实际频率分,并与相应u 值状况下的理论概率分布相比较。其中G5格中的u值要求输入正值,且可任意更改,更改后可即时观察到G4-K4格子中数值的相应变化并加以比较,以便评价实际频率与理论分布概率的吻合程度。

2.4 绘出频数分布直方图(见图5)在任意表格(如F5格)单击,绘制相应直方图;此图为以B15-B25

格子中数据为横轴,以C15-C25格子中数值为纵轴而做出的一个样本数据频数分布立体三维直方图。图5即是以样本含量300时所抽样本为例所做图形,具体直方图制作可参考相关EXCEL学习资料。

2.5 编写按钮控件的运行程序鼠标左键双击B6格中“开始抽样”按钮控件,打开相应代码窗口,输入如下程序语句,要求在英文输入法状态下进行输入,其中有下划线部分注意不用再重复输入。

Private Sub CommandButton1_Click()

Range("D:D") = ""

For i = 1 To Range("b3")

Application.ScreenUpdating = False

h = Cells(5, 2).V alue

Cells(i, 4) = h

Application.ScreenUpdating = True

Next

End Sub

3 演示与操作

按以上方法设置完成后,可进一步对窗口大小、背景颜色、字体大小、图形位置、显示比例等进行设置,使其美观漂亮。演示时,只需对“B1、B2、B3、B4单元格中的数据进行相应改动即可。注意每改动任一格中数值后,需在其它任意空白单元格中左健单击以确定更改,然后按下“开始抽样”控件即可进行抽样,并动态观察到所抽样本频数分布直方图的相应即时变化。

4 注意问题

1)在公式栏中输入字符时,除汉字外,均要在英文输入法下进行输入。

2)当点击“开始抽样”按钮后,如不能进行相应抽样的动态演示,而出现按钮选择框时,可打开“工具”菜单下“宏”的“安全性”窗口,将安全级设为“低”,然后关闭文件,注意关闭时接受文件更改,选“是”,然后再次打开文件运行即可。

5 总结

本方法利用EXCEL进行正态分布抽样及概率分布的电脑模拟动态演示实验,优点如下1)EXCEL软件在一般的多媒体电脑操作平台的广泛安装及普遍适用性。2)该演示设计原理简单,通俗易懂,演示时操作简单,抽样迅速。3)演示窗口中不仅有相关数据计算列表,同时有图形加以展现,图、表结合,既可精确展示数据,又可直观的观看图形。4)一次编制,多次使用,总体参数允许任意更改设置,可观察不同总体和u值下的样本频数分布情况。通过在教学过程中的实际使用,使抽象难解的统计理论变得直观形象,收到了良好的教学效果,值得大家借签推广。

1.任森,屈刚.利用新生入学体检进行卫生统计方法的教学.卫生职业教育,2006,24(4):84-85

2.孙忠,崔壮.用EXCEL设计《卫生统计学》动态课件的尝试.继续医学教育,2007,21(34):64-66 3.柳青,等.随机抽样与抽样分布的电脑实验.中国卫生统计,1995,12(4):46-48

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

统计量及其抽样分布练习题

第六章 统计量及其抽样分布 练习题 一、填空题(共10题,每题2分,共计20分) 1.简单随机抽样样本均值X 的方差取决于_________和_________,要使X 的标准差降低到原来的50%,则样本容量需要扩大到原来的_________倍。 2. 设1217,,,X X X 是总体(,4)N μ的样本,2S 是样本方差,若2()0.01P S a >=,则a =____________。 3.若(5)X t ,则2X 服从_______分布。 4.已知0.95(10,5) 4.74F =,则0.05(5,10)F 等于___________。 5.中心极限定理是说:如果总体存在有限的方差,那么,随着_________的增加,不论这个总体变量的分布如何,抽样平均数的分布趋近于_____________。 6. 总体分布已知时,样本均值的分布为_________抽样分布;总体分布未知,大样本情况下,样本均值的分布为_________抽样分布。 7. 简单随机样本的性质满足_________和_________。 8.若(2,4)X N ,查分布表,计算概率(X 3)P ≥=_________。若(X )0.9115P a ≤=,计算a =_________。 9. 若12~(0,2),~(0,2),X N X N 1X 与2X 独立,则2212X X +()/2服从______分布。 10. 若~(16,4)X N ,则5X 服从___________分布。 二、选择题(共10题,每题1分,共计10分)

1.中心极限定理可保证在大量观察下 ( ) A . 样本平均数趋近于总体平均数的趋势 B . 样本方差趋近于总体方差的趋势 C . 样本平均数分布趋近于正态分布的趋势 D. 样本比例趋近于总体比例的趋势 2.设随机变量()(1)X t n n >,则21/Y X =服从 ( ) 。 A. 正态分布 B.卡方分布 C. t 分布 D. F 分布 3.某品牌袋装糖果重量的标准是(500±5)克。为了检验该产品的重量是否符合标准,现从某日生产的这种糖果中随机抽查10袋,测得平均每袋重量为498克。下列说法中错误的是( ) A. 样本容量为10 B .抽样误差为2 C. 样本平均每袋重量是统计量 D. 498是估计值 4.设总体均值为100,总体方差为25,在大样本情况下,无论总体的分布形式如何,样本平均数的分布都是服从或近似服从( ) A. (100/,25)N n B. N C. (100,25/)N n D. (100,N 5、设2(0,1),(5),X N Y χ且X 与Y 独立,则随机变量_________服从自由度为5的t 分布。 ( ) A. /X Y B. 5/Y X C. /X /

用Excel绘制级配曲线图步骤

用Excel绘制级配曲线图步骤 1、建立图表:在图表向导中选择XY散点图,点击下一步,点击数据区域中红色箭 头选择任意数据区域;点击下一步,选择标题,输入图表标题(筛分级配曲线图)、数值X轴(筛孔尺寸mm)、数值Y轴(通过率%);选择网格线,选择数值X 轴,选择主要网格线,点击下一步,点击完成。 2、修改坐标轴:双击X轴数字,设置筛孔尺寸。选择刻度,将最小值设为0、最 大值设为级配类型最大粒径对应的泰勒曲线值(如AC-25,最大粒径为31.5mm,对应的泰勒曲线值为y=100.45lgdi=4.723);选择字体,设置需要的字体大小,点击确定。双击Y轴数字,将最小值设为0、最大值设为100、主要刻度单位设为10、次要刻度单位设为0,选择字体,设置需要的字体大小,点击确定。 3、设置筛孔尺寸系列:在图表区点击鼠标右键,选择数据源,选择系列,选择添 加,选择X值输入筛孔尺寸对应的泰勒曲线值[如筛孔26.5mm(将孔径作为系列名称输入更方便)为4.370,4.370[),选择Y值输入0,100。再选择添加输入其它筛孔尺寸。选择确定。双击系列,设置系列格式。选择图案,设置系列线格式,选择数据标志,点击确定。双击数据标志,将数字修改为对应的筛孔尺寸。

4、输入级配范围和级配中值线:在图表区点击鼠标右键,选择数据源,选择系列, 选择添加,选择X值输入筛孔尺寸对应的泰勒曲线值(4.723,4.370,3.762……), 选择Y值输入级配上下限和中值。点击确定。 5、输入设计级配线:在图表区点击鼠标右键,选择数据源,选择系列,选择添加, 选择X值输入筛孔尺寸对应的泰勒曲线值(4.723,4.370,3.762……),选择Y 值点击红色箭头选择任意设计级配区域。

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

抽样分布习题与答案

第 4 章抽样分布自测题选择题 1.抽样分布是指() A. 一个样本各观测值的分布C. 样本统计量的分布 B. 总体中各观测值的分布D. 样本数量的分布 2.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的均值为() 2 A. B. x C.2 D. n 3.根据中心极限定理可知,当样本容量充分大时,样本均值的抽样分布服从正态分布,其分布的方差为() 2 A. B.x C.2 D. n 4.从均值为,方差为2 n 的样本,则()的任意一个总体中抽取大小为 A.当 n 充分大时,样本均值x 的分布近似服从正态分布 B.只有当 n<30 时,样本均值x的分布近似服从正态分布 C.样本均值 x 的分布与n无关 D. 无论 n 多大,样本均值x 的分布都是非正态分布 5.假设总体服从均匀分布,从该总体中抽取容量为 36 的样本,则样本均值的抽样分布() A. 服从非正态分布 B. 近似正态分布 C. 服从均匀分布 D. 服从 2 分布 6. 从服从正态分布的无限总体中分别抽取容量为4,16,36的样本,则当样本容量增大时,样 本均值的标准差() A. 保持不变 B. 增加 C.减小 D.无法确定 7. 某大学的一家快餐店记录了过去 5 年每天的营业额,每天营业额的均值为2500 元,标准差为 400 元。由于在某些节日的营业额偏高,所以每日营业额的分布是右偏的,假设从这5年中随机抽取100 天,并计算这100 天的平均营业额,则样本均值的抽样分布是() A. 正态分布,均值为250 元,标准差为40 元 B. 正态分布,均值为2500 元,标准差为40 元 C.右偏,均值为2500 元,标准差为400 元 D. 正态分布,均值为2500 元,标准差为400 元 8. 在一个饭店门口等待出租车的时间是左偏的,均值为12 分钟,标准差为 3 分钟。如果从饭店门口随机抽取 81 名顾客并记录他们等待出租车的时间,则样本均值的抽样分布是() A. 正态分布,均值为12 分钟,标准差为0.33 分钟 B. 正态分布,均值为12 分钟,标准差为 3 分钟 C. 左偏分布,均值为12 分钟,标准差为 3 分钟

习题六 样本及抽样分布.

习题六样本及抽样分布 一、填空题 1.设来自总体的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =; 2.在总体中随机地抽取一个容量为 36 的样本,则均值落在4与6之间的概率 = 0.9332 ; 3.设某厂生产的灯泡的使用寿命 (单位:小时,抽取一容量为9的样本,得到 ,则; 4.设为总体的一个样本,则 0.025 ; 5.设为总体的一个样本,且服从分布,这里, ,则1/3 ; 6.设随机变量相互独立,均服从分布且与分别是来自总体的简单随机样本,则统计量服从参数为 9 的 t 分布。 7.设是取自正态总体的简单随机样本且 ,则 0.05 , 0.01 时,统计量服从分布,其自由度为 2 ;

8.设总体 X 服从正态分布,而是来自总体的简单随机样 本,则随机变量 服从 F 分布,参数为 10,5 ; 9.设随机变量则 F(n,1 ; 10.设随机变量且,A为常数,则 0.7 二、选择题 1.设是来自总体的简单随机样本,是样本均值, 记 则服从自由度的分布的随机变量是( A ); A. B. C. D. 2.设是经验分布函数,基于来自总体的样本,而是总体的分布函数,则下列命题错误的为,对于每个给定的( B ) A.是分布函数 B.依概率收敛于 C.是一个统计量 D.其数学期望是

3.设总体服从0-1分布,是来自总体的样本,是样本均值,则下列各选项中的量不是统计量的是( B ) A. B. C. D. 4.设是正态总体的一个样本,其中已知而未知,则下列各选项中的量不是统计量的是( C )。 A. B. C. D. 5.设和分别来自两个正态总体和的样本,且相互独立,分别为两个样本的样本方差,则服从的统计量是( B ) A. B. C. D. 6.设是正态总体的一个样本,和分别为样本均值和样本方差,则下面结论不成立的有( D ) A.相互独立; B.与相互独立; C.与相互独立D.与相互独立。

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

统计学习题答案 第4章 抽样与抽样分布

统计学习题答案第4章抽样与抽样分布

第4章抽样与抽样分布——练习题(全免) 1. 一个具有64 n个观察值的随机样本抽自于均 = 值等于20、标准差等于16的总体。 ⑴给出x的抽样分布(重复抽样)的均值和标 准差 ⑵描述x的抽样分布的形状。你的回答依赖于 样本容量吗? ⑶计算标准正态z统计量对应于5.15 = x的值。 ⑷计算标准正态z统计量对应于23 x的值。 = 解: 已知n=64,为大样本,μ=20,σ=16, ⑴在重复抽样情况下,x的抽样分布的均值为 a. 20, 2 b. 近似正态 c. -2.25 d. 1.50 2 . 参考练习4.1求概率。 ⑴x<16;⑵x>23;⑶x>25;⑷.x落在16和22之间;⑸x<14。 解: a. 0.0228 b. 0.0668 c. 0.0062 d. 0.8185 e. 0.0013 3. 一个具有100 n个观察值的随机样本选自于 = μ、16=σ的总体。试求下列概率的近似值:30 =

解: a. 0.8944 b. 0.0228 c. 0.1292 d. 0.9699 4. 一个具有900=n 个观察值的随机样本选自于100=μ和10=σ的总体。 ⑴ 你预计x 的最大值和最小值是什么? ⑵ 你认为x 至多偏离μ多么远? ⑶ 为了回答b 你必须要知道μ吗?请解释。 解:a. 101, 99 b. 1 c. 不必 5. 考虑一个包含x 的值等于0,1,2,…,97,98,99的总体。假设x 的取值的可能性是相同的。则运用计算机对下面的每一个n 值产生500个随机样本,并对于每一个样本计算x 。对于每一个样本容量,构造x 的500个值的相对频率直方图。当n 值增加时在直方图上会发生什么变化?存在什么相似性?这里30,10,5,2====n n n n 和50=n 。 解:趋向正态 6. 美国汽车联合会(AAA )是一个拥有90个俱 乐部的非营利联盟,它对其成员提供旅行、

教你用excel做折线图很实用

折线图 折线图是用来表示某种现象在时间序列上的动态,或者某种现象随另一种现象而变化的情况,可以大致反映两者之间的数学函数关系。 由于折线图表现的是数据的动态或变化趋势,因此先必须明确表达资料的目的,尽可能的做到把主要概念表达出来。 如果要了解种群的消长规律时,一般采用单位时间的消长曲线,以时间单位为x轴,种群数量为y轴。 如果要了解种群的增长规律时,就必须把逐个单位时间的数据依次累加起来作为y轴的数据,这样的折线图称为增长曲线图。 例如诱蛾灯下每天的发蛾量可以做成消长曲线图。消长曲线可以清楚的看出每一个世代的发生型,如前峰型、中峰型、双峰型等,但不能够确切的了解任一单位时间的发蛾量在整个种群中的进度。只有把每个单位时间的发蛾量依次累加起来,才能表达出发蛾的增长规律。

实例 用下表数据,作三化螟发蛾消长曲线。 调查日期 6/246/266/286/307/27/47/67/87/10(月/日) 发蛾量(头)862066820690701209318459780782505625

1 输入数据 启动Microsoft Excel 2003,在工作表里按上表的形式输入数据。然后将数据整理为如下图所示。 操作步骤: 定义为“文本”数据类型 定义为“数值”数据类型 定义为“数值”数据类型

2 使用图表向导 在主菜“插入”中选中“图表”命令,或者直接点击工具栏里的快捷按钮启动图表向导

⑴选择图表类型 选中折线图选中这个子类 点击“下一步”

⑵设置图表数据源 选中系列产生在行 在数据区域栏输入表达式: =Sheet1!$A$3:$J$5 或者用鼠标在“Sheet1”工作表中框选 A3:J5 点击“系列”卡片按钮,进入数据源编 辑

习题六__样本及抽样分布解答

样本及抽样分布 一、填空题 1 ?设来自总体X的一个样本观察值为:2.1, 5.4, 3.2, 9.8, 3.5,则样本均值= 4.8 ,样本方差=2.7161 2; 2. 在总体X ~ N (5,16)中随机地抽取一个容量为36的样本,则均值X落在4 与6之间的概率=0.9332 ; 3. 设某厂生产的灯泡的使用寿命X~N(1000,二2)仲位:小时),抽取一容量为 9 的样本,得到殳=940,s =100 ,则P(X ::: 940) = ___________ ; 7 4. 设X1,X2,?., X7 为总体X ~ N(0,0.52)的一个样本,则Pr X i24^ 0.025 : i=1 5. 设X1,X2,...,X6为总体X ~ N(0,1)的一个样本,且CY服从2分布,这里, Y =(X1 X2 X3)2(X4 X5 X6)2,则C=血_ ; 6?设随机变量X,Y相互独立,均服从N(0,32)分布且X1,X2,...,X9与Y,Y2,...,Y分 别是来自总体X ,Y的简单随机样本,则统计量U= X1... X9服从参数为—9 H2+...+Y2 的_L_分布。 7. 设X11X21X31X4是取自X ~ N(0,22)正态总体的简单随机样本且 ^a(X^2X2)2b(3X^4X4)2,,则a = 0.05 , 0.01 时,统计量Y 服从 2分布,其自由度为一2_; 1 9. 设随机变量X ~t(n)(n 1),Y 2,则Y~ —; X 1 10. 设随机变量X~F(n,n)且P(X∣>A) = 0.3 , A 为常数,则P(XA—)= 0.7 A

8. 设总体X服从正态分布X ~ N(0,22),而X1,X2,...,X15是来自总体的简单随机 X 2十+X2 样本,则随机变量Y X1 2... 利服从F 分布,参数为10,5 ; 2(X11 +...+X15)

EXCEL曲线图

引用用Excel函数画曲线的方法1.用Excel函数画曲线图的一般方法 因为Excel有强大的计算功能,而且有数据填充柄这个有力的工具,所以,绘制曲线还是十分方便的。用Excel画曲线的最大优点是不失真。大体步骤是 这样的: ⑴用“开始”→“程序”→“Microsoft office”→”Excel”,以进入Excel窗口。再考虑画曲线,为此: ⑵在A1 和A2单元格输入自变量的两个最低取值,并用填充柄把其它取值自动填入; ⑶在B列输入与A列自变量对应的数据或计算结果。有三种方法输入: 第一种方法是手工逐项输入的方法,这种方法适合无确定数字规律的数据:例如日产量或月销售量等; 第二种方法是手工输入计算公式法:这种方法适合在Excel的函数中没有 列入粘贴函数的情况,例如,计算Y=3X^2时,没有现成的函数可用,就必须自己键入公式后,再进行计算; 第三种方法是利用Excel 中的函数的方法,因为在Excel中提供了大量的 内部预定义的公式,包括常用函数、数学和三角函数、统计函数、财务函数、 文本函数等等。 怎样用手工输入计算公式和怎样利用Excel的函数直接得出计算结果,下 面将分别以例题的形式予以说明; ⑷开始画曲线:同时选择A列和B列的数据→“插入”→“图表”→这时出现如下图所示的图表向导:

选“XY散点图”→在“子图表类型”中选择如图所选择的曲线形式→再点击下面的…按下不放可查看示例?钮,以查看曲线的形状→“下一步”→选“系列产生在列”→“下一步”→“标题”(输入本图表的名称)→“坐标”(是否默认或取消图中的X轴和Y轴数据)→“网络线”(决定是否要网格线)→“下一步”后,图形就完成了; ⑸自定义绘图区格式:因为在Excel工作表上的曲线底色是灰色的,线条的类型(如连线、点线等)也不一定满足需要,为此,可右击这个图,选“绘图区格式”→“自定义”→“样式”(选择线条样式)→“颜色”(如果是准备将这个曲线用在Word上,应该选择白色)→“粗细”(选择线条的粗细)。 ⑹把这个图形复制到Word中进行必要的裁剪; ⑺把经过裁剪过的图形复制到Word画图程序的画板上,进行补画直线或坐标,或修补或写字,“保存”后,曲线图就完成了。 2.举例 下面针对三种不同的情况举三个例子说明如下: 例1. 下图是今年高考试题的一个曲线图,已知抛物线公式是Y=2X^2 ,请画出其曲线图。 因为不能直接利用Excel给出的函数,所以,其曲线数据应该用自己输入公式的方法计算出来,画图步骤如下:

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

excel 在一个界面中如何同时画出频次直方图和正态分布图

excel 在一个界面中如何同时画出频次直方图和正态分布图 excel有个数据分析工具,里面可以做直方图,但是正态分布图不能直接做。 若要两种图都显示,那么就需要用到函数了。 方法如下: 假若你的数据在A1:A10 1.统计数据个数;任意选个单元格,如B1,输入count(A1:A10); 2.求最大值;如B2中输入:max(A1:A10) 3.求最小值;如B3中输入:min(A1:A10) 4.求平均值;如B4中输入:average(A1:A10) 5.求标准偏差:如B5中输入:stdev(A1:A10) 6.获得数据区间;用最大值减最小值;如B6中输入:B3-B2 7.获得直方图个数;个数的开放加1,如B7中输入:sqrt(B1)+1 8.获得直方图组距;用区间除以(直方图个数-1),如B8中输入B7/(B7-1) 下面就开始作图了: 1.任选个空单元格:如C列第一个单元格C1,令C1等于最小值,即输入=B3 2.在C2中输入=C1+$B$8 (最小值逐渐累加,绝对引用) 3.选中C2,然后向下拉,直到数据大于最大值就可以了;比如你拉到C5了。 4.统计频数,如在D1中输入frequency(A1:A10,C1:C5)确定,然后将选中D1到D5,将光标定位到公式栏,同时按住ALT+Shift+Enter 5.统计正态分布的数据,E1中输入normdist(C1,$B$4,$B$5,0)回车;然后选中E1,下拉到E5 一、数据准备 直方图:

组界及频率 1. 统计数据个数;任意选个单元格,如B1,输入count(A1:A10); =IF(C9="","",COUNT(C9:AB14)) 2. 子组大小:=IF(B9="","",COUNT(B9:B14)) 3. 子组个数: =IF(AD14="","",IF(AD14=0,0,AD14/M4)) (用数据总数除子组大小(M4单元格)) =IF(C9="","",COUNT(C9:AB14)) (一共有多少个数据) 4. 求最大值;如B2中输入:max(A1:A10);=IF('X-R'!C9="","",MAX('X-R'!C9:'X-R'!AB14)) 5. 求最小值;如B3中输入:min(A1:A10);=IF('X-R'!C9="","",MIN('X-R'!C9:'X-R'!AB14)) 6. 求平均值;如B4中输入:average(A1:A10);=IF(C9="","",AVERAGE(C9:AB11)) 7. 求标准偏差:如B5中输入:stdev(A1:A10);=STDEV(C9:AA13);=IF(AE8="","",SQRT((AB45-(AE8*AE8/AD14))/(AD14-1))) 8. Sigma = =IF(AD17="","",AD17/L37) δ=R/D2 直方图: 以最小值减去SIGMA的二分之一为组界的起始数。 直方图的数据区间:以最大值减去最小值的十分之一为间隔 正态图: X Normal

第5章 样本及抽样分布课后习题答案(高教出版社,浙江大学)

第5章 样本及抽样分布 1,设总体X 服从均值为1/2的指数分布,4321,,,X X X X 是来自总体的容量为4的样本,求 (1)4321,,,X X X X 的联合概率密度;(2)}2.17.0,15.0{21<<<x ,所以 (1) 联合概率密度为)()()()(),,,(43214321x f x f x f x f x x x x g = )(2432116x x x x e +++-=,(0,,,4321>X X X X ) (2)2 1,X X 的联合概率密度为) (2212x x e +-,所以 ????----== <<<<2 .17 .0221 5 .01215.02 .17 .021222121 2 1224}2.17.0,15.0{dx e dx e dx dx e X X P x x x x ))((4.24.121------=e e e e (3),21)(41)(41==∑=i i X E X E 16 1 2141)(161)(2 41=? ?? ???==∑=i i X D X D ; (4)4 1 )()()(2121==X E X E X X E ,(由独立性) ]4 1)()([21]41[21])5.0[()(])5.0([22 2222221221+-=+-= -=-X E X E X X E X E X E X X E 8 1]412141[21]4121)()([212 222=-??? ??+=+-+=X E X D ; (5)2 2 22 12122212141)()()(])[()(?? ? ??-=-=X E X E X X E X X E X X D 16 3161)4141)(4141(161)]()()][()([222121=-++=- ++=X E X D X E X D 。

excel正态分布

正态分布函数的语法是NORMDIST(x,mean,standard_dev,cumulative)cumulative为一逻辑值,如果为0则是密度函数,如果为1则是累积分布函数。如果画正态分布图,则为0。例如均值10%,标准值为20%的正态分布,先在A1中敲入一个变量,假定-50,选中A列,点编辑-填充-序列,选择列,等差序列,步长值10,终止值70。然后在B1中敲入NORMDIST (A1,10,20,0),返回值为0.000222,选中B1,当鼠标在右下角变成黑十字时,下拉至B13,选中A1B13区域,点击工具栏上的图表向导-散点图,选中第一排第二个图,点下一步,默认设置,下一步,标题自己写,网格线中的勾去掉,图例中的勾去掉,点下一步,完成。图就初步完成了。下面是微调把鼠标在图的坐标轴上点右键,选坐标轴格式,在刻度中填入你想要的最小值,最大值,主要刻度单位(x轴上的数值间隔),y轴交叉于(y 为0时,x多少)等等。确定后,正态分布图就大功告成了。 PS:标准正态分布的语法为NORMSDIST(z), 正态分布 (一)NORMDIST函数的数学基础 利用Excel计算正态分布,可以使用函数。 格式如下:变量,均值,标准差,累积, 其中: 变量:为分布要计算的值; 均值:分布的均值; 标准差:分布的标准差; 累积:若1,则为分布函数;若0,则为概率密度函数。 当均值为0,标准差为1时,正态分布函数即为标准正态分布函数 。 例3已知考试成绩服从正态分布,,,求考试成绩低于500分的概率。 解在Excel中单击任意单元格,输入公式: “ 500,600,100,1 ”,

贾俊平《统计学》(第5版)课后习题-第6章 统计量及其抽样分布【圣才出品】

第6章 统计量及其抽样分布一、思考题 1.什么是统计量?为什么要引进统计量?统计量中为什么不含任何未知参数? 答:(1)设12n X X X ,, …,是从总体X 中抽取的容量为n 的一个样本,如果由此 样本构造一个函数12()n T X X X ,,…,,不依赖于任何未知参数,则称函数12()n T X X X ,,…,是一个统计量。 (2)在实际应用中,当从某总体中抽取一个样本后,并不能直接应用它去对总体的有关性质和特征进行推断,这是因为样本虽然是从总体中获取的代表,含有总体性质的信息,但仍较分散。为了使统计推断成为可能,首先必须把分散在样本中关心的信息集中起来,针对不同的研究目的,构造不同的样本函数。 (3)统计量是样本的一个函数。由样本构造具体的统计量,实际上是对样本所含的总体信息按某种要求进行加工处理,把分散在样本中的信息集中到统计量的取值上,不同的统计推断问题要求构造不同的统计量,所以统计量不包含未知参数。 2.判断下列样本函数哪些是统计量?哪些不是统计量? 1121021210310410()/10 min() T X X X T X X X T X T X μ μσ =+++==-=-…,,…,()/答:统计量中不能含有未知参数,故1T 、2T 是统计量,3T 、4T 不是统计量。

3.什么是次序统计量? 答:设12n X X X ,, …,是从总体X 中抽取的一个样本,()i X 称为第i 个次序统计量,它是样本 12()n X X X ,,…,满足如下条件的函数:每当样本得到一组观测值12X X ,,…,n X 时,其由小到大的排序 (1)(2)()()i n X X X X ≤≤≤≤≤……中,第i 个值()i X 就作为次序统计量()i X 的观测值,而(1)(2)()n X X X ,,…,称为次序统计量,其中(1)X 和()n X 分别为最小和最大次序统计量。 4.什么是充分统计量? 答:在统计学中,假如一个统计量能把含在样本中有关总体的信息一点都不损失地提取出来,那对保证后边的统计推断质量具有重要意义。统计量加工过程中一点信息都不损失的统计量通常称为充分统计量。 5.什么是自由度? 答:统计学上的自由度是指当以样本的统计量来估计总体的参数时,样本中独立或能自由变化的变量的个数。 6.简述2 χ分布、t 分布、F 分布及正态分布之间的关系。答:(1)随机变量X 1,X 2,… X n 相互独立,且都服从标准正态分布,则它们的平方和21 n i i X =∑服从自由度为n 的2 χ分布。(2)随机变量X 服从标准正态分布,Y 服从自由度为n 的2 χ分布,且X 与Y 独立,

利用Excel软件绘制正态概率纸的方法_图文(精)

数理统计分靳与应用 , 偏差O-,能够直观地分析出工序的过程能力,求出工序的过程能力指数Cr值或Cm值.并且还可咀估计工序的不合格品率。因此,利用正态概率纸分析工序的方法,具有多功能的优点(参阅文献『1]): 利用正态概率纸分析工序,有着直观、简单、快速和易于掌握等诸多优点,在生产现场中使用备受欢迎,但由于它是一种图算法,精度相对较差,然而在现场使用其精度也已足够。如能提高正态概率纸本身的绘制精度,将有助于弥补正态概率纸的这一缺点。 但是采用正态概率纸分析 j 工序,其前提是必须首先有正态j 概率纸,因此,就必须首先解决i 正态概率纸的绘制问题。 过去绘制正态概率纸都是手工放大绘图,然后缩小印制成专用坐标纸再供现场使用,不仅麻烦,而且误差较大,更加影响了使用精度。现在由于电脑的普及,采用电子表格软件Excel绘 态概率纸纵坐标上各代表点的位置问题。 根据文献[2]所提供的手工绘制正态概率纸的步骤,对之加咀改造和发展,形成下列利用Excel绘制正态概率纸的方法和步骤: 1.选纵坐标值中有代表性的点(正态分布函数值“):

0.0l%,0.02%,…,0.09%;0.10%.0.20%,…,0.90%:1.00%,2.00%.….9.00%;1000%.11.00%. ….19.00%;20.00%,22.00%.….28.00%(取偶数);30.00%,32.00%, ?一,38.00%(取偶数);40.00%,42.00%,…,48.00%(取偶数);50.00%,52.00%,…,58.00%(取偶 数):60.00%,62.00%,…,68瑚%(取偶数);70肿%.72.00%,….78.00%f取偶数);80.oo%,81肿%,?一, 89.00%;90.00%,91.00%,….99.00%;99.10%,99.20%, …, 99.90%:99.91%.9992%,….99.99%。 2.查正态分布函数表,查出上 刻度之间的间距)的方法来绘制表格的,故我们需要将原始纵坐标的数据转化成行高数据,以便于纵坐标的绘制;横坐标是等间距的,故一般设为lOO列,间距 即列宽为0.38。 纵坐标数据的转化公式:(1)算出相邻两个Zct之间的差值X。 X=Za..一ZⅡ+l (I)

(完整word版)习题六样本及抽样分布

习题六 样本及抽样分布 一、填空题 1.设来自总体X 的一个样本观察值为:2.1,5.4,3.2,9.8,3.5,则样本均值 = 4.8 ,样本方差 =22.716; 2.在总体~(5,16)X N 中随机地抽取一个容量为 36 的样本,则均值X 落在4与6之间的概率 = 0.9332 ; 3. 设某厂生产的灯泡的使用寿命2~(1000,)X N σ (单位:小时),抽取一容量为9的样本,得到940,100x s ==,则(940)P X <= ; 4.设127,,...,X X X 为总体2 ~(0,0.5)X N 的一个样本,则7 21 (4)i i P X =>=∑ 0.025 ; 5.设126,,...,X X X 为总体~(0,1)X N 的一个样本,且cY 服从2χ分布,这里, 22123456()()Y X X X X X X =+++++,则c =1/3 ; 6.设随机变量,X Y 相互独立,均服从2(0,3)N 分布且129,,...,X X X 与129,,...,Y Y Y 分 别是来自总体,X Y 的简单随机样本,则统计量U =服从参数为 9 的 t 分布。 7.设1234,,,X X X X 是取自2~(0,2)X N 正态总体的简单随机样本且 22!234(2)(34),Y a X X b X X =-+-,则a = 0.05 ,b = 0.01 时,统计量Y 服从 2χ分布,其自由度为 2 ; 8.设总体 X 服从正态分布2~(0,2)X N ,而1215,,...,X X X 是来自总体的简单随机 样本,则随机变量 22 110 22 1115...2(...) X X Y X X ++=++ 服从 F 分布,参数为 10,5 ; 9.设随机变量21 ~()(1),,X t n n Y X >=则~Y F(n,1) ; 10.设随机变量~(,)X F n n 且()0.3P X A >=,A 为常数,则1 ()P X A > = 0.7 二、选择题 1.设12,,...,n X X X 是来自总体2(,)N μσ的简单随机样本,X 是样本均值, 记22222 21 23111 111(),(),(),11n n n i i i i i i S X X S X X S X n n n μ====-=-=---∑∑∑ 2 241 1(),n i i S X n μ==-∑则服从自由度1n -的t 分布的随机变量是T =( A ); A . B C D 2.设()n F x 是经验分布函数,基于来自总体X 的样本,而()F x 是X 总体的 分布函数,则下列命题错误的为,对于每个给定的,()n x F x ( B ) A .是分布函数 B .依概率收敛于()F x C .是一个统计量 D .其数学期望是()F x

利用Excel的NORMSDIST计算正态分布函数表1

利用Excel的NORMSDIST函数建立正态分布 表 董大钧,乔莉 理工大学应用技术学院、信息与控制分院, 113122 摘要:利用Excel办公软件特有的NORMSDIST函数可以很准确方便的建立正态分布表、查找某分位数点的正态分布概率值,极大的提高了数理统计的效率。该函数可返回指定平均值和标准偏差的正态分布函数,将其引入到统计及数据分析处理过程中,代替原有的手工查找正态分布表,除具有直观、形象、易用等特点外,更增加了动态功能,极大提高了工作效率及准确性。 关键词:Excel;正态分布;函数;统计 引言 正态分布是应用最广泛的连续概率分布,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,某种产品的力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。在科学研究及数理统计计算过程中,人们往往要通过某本概率统计教材附录中的正态分布表去查找,非常麻烦。若手头有计算机,并安装有Excel软件,就可以利用Excel的NORMSDIST( x )函数进行计算某分位数点的正态分布概率值,或建立一个正态分布表,准确又方便。 1 正态分布及其应用 正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为N(μ,σ2 )。则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ

相关文档
最新文档