正态分布图的制作方法

正态分布图的制作方法
正态分布图的制作方法

参考資料:QC 数学の話(大村 平著) 日科技連出版 翻訳完成日期:2009年6月6日 品质管理的基石统计初步(翻訳:李琰) 目录

·从互换性到品质管理

·QC 是迈向文明社会的技术突破 ·从互换性到品质管理 ·SQC 的成熟与TQC ·数据整理的基本 ·代表值的选出 ·平均值的计算 ·标准偏差的计算 ·正态分布概念引入 ·正态分布的加法与减法 ·正态分布应用举例

第1章

从统计学的互换性到品质管理

20世纪人类历史上发生了3大震撼世界技术的突破。1,原子能的利用;2,高分子化合物的合成;3,

信息技术的飞跃发展。关于原子能的利用,主要在民生和军事方面得到了广泛的发展。在人类历史上原子能的出现翻开了历史新的一页,震撼了世界这是众所周知的。二次世界大战期间在広島,長崎投下的原子弹的爆炸,造成了人类的大量伤亡。在民生应用方面,随着碳素系列能源的枯竭和CO 2排出的控制, 原子能发电已经得到广泛应用。

另外在高分子化合物合成技术方面,给人类生活带来了极大的影响。用塑料做成的各种各样建材类,器

具类遍布了我们的生活周围。如果把我们生活中存在的塑料制品全部拿走的话,我们生活就象没有了文字一样,土蹦瓦解。化肥使粮食增产。人工纤维的合成,给我们提供了丰富多样的衣着。合成橡胶,洗剂,粘结剂,调味品等不胜枚举。

还有,信息技术的飞跃发展。首先让我们只看一下和我们切身利益相关的民生用品,各种各样的业务预

约,存款储蓄,通信网和铁道网的管理,天气预报,犯罪搜查等虽然眼睛直接看不到,却支撑着我们的近代生活。而且各种技术计算,生命科学,人工智能等先端事物已变成了我们生活中的神圣组织。如果说没有高分子化合物我们的生活会瓦解的话,那么没有信息我们的生活会瘫痪。

基于以上,我们可以说,原子能是能源方面的突破,高分子合成是硬件方面的突破,信息技术是软件方

面的突破,3个方面对我们的生活带来了震撼性的影响。

那么为什么以上3个方面可以在20世纪能够获得极大的技术突破呢? 我认为是以下两个方面的原因:

1, 抗身抗生物质的发现。 2, 品质管理的普及。

为什么这么说呢?下面阐述理由。

最初的科学文明,把人类从严酷的劳动和疾病中解放出来。人类为了确保衣食住的安定,做出了很大的

QC 数学的

話题

努力,也取得了很大的进步。其中被迫做出的最大的苦战是与疾病的搏斗。但是20世纪链酶素和盘尼西林的出现飞跃性的改善了人们抗疾病的能力。不治之病和恐慌人们的结核病,痢疾,伤寒,霍乱,鼠疫等多种传染病得到了控制。一百年前和现在的寿命曲线对比看一下,就会一目了然。因此抗生物质的发现是20世纪震撼世界的较大的技术突破。

接下来我们讲述品质管理的推荐理由。生活在现代生活中的我们,被大量的工业品包围。正是因为工业品的存在,我们才可以享受丰富的现代生活。而且这些工业制品对我们基本没造成伤害。

电子微波炉过热造成的着火,热水壶把儿的着火,鞋底的脱落,皮带扣的断裂后造成裤子的突然脱落,瓶塞的破裂等以上的品质问题还不至于造成很大的担心。还有灯泡坏了换一个即可,电池和胶卷等也很容易买到手。几乎没有我们买不到的东西。我们可以放心大胆地使用围绕在我们周围的工业制品,但是做到放心使用是一件非常难的事情。要实现放心使用,我们首先必须做那些事情呢?

第一,这些工业制品必须大量生产。如果没有大量生产,销售价格不可能便宜,当然也不可能遍布全国。

第二,这些大量生产的工业制品必须100%的确保质量。如果品质不能保证,普及越广就会引起到处出问题。这是社会所不允许的。

基于以上,也就是说既要大量生产又要100%保证质量。当然不仅工业制品,农产物,水产物,畜产物等也是一样既要大量生产又要100%保证质量。

那么,怎么做才能使做出的所有的产品都符合品质要求呢?还有,流到市场上的产品都能保证质量吗?

然后就出现了一系列的品质管理手法(Quality Control,简称QC)。QC萌芽于1920年,成熟于20世纪后半期。均一品质产品的大量的供给生产,是科学文明发展史上的飞跃。这个飞跃被评价为20世纪文明的技术突破。这个评价一点也不夸张。

首先,互换性的解说。

黑猩猩用石头敲开果实的皮;有一种啄木的鸟用嘴吸仙人掌球,用嘴趋赶枯木缝中的虫子。动物使用工具的例子,通过观察可以举很多例子。但是,不管怎么动物都是在自然现有的物品中选别使用工具。动物自己不能创造工具,也不能使用部品组装成新的工具。

人类最初和动物一样,可是后来,通过锻打石头制作石器。把铁棒的头部磨尖制作枪。还有把尖的石器帮在铁棒的头部制作出了新的工具。这可以认为是使用两个以上的部品通过组装制作新工具的开始。

然后,人类学会把弓和箭合起来使用。把两个部品组合后使用确实是人类史上的一大进步。就是在那时,人类利用智慧,制作出了很多箭可以使用同一个弓,这样的箭相互之间可以相互替换具有融通性。这种部品之间可以相互替换使用的特性称为互换性。

在概念没有成熟之前,互换性已经被提前使用了。

话虽如此,互换性的概念成熟,基于互换性的基础上,大量生产成为可能在历史上是最近的事情。

17~18世纪伴随着工业革命的发展,大量生产大量消费的时代到来。没有互换性大量生产是几乎不可能的事情。在各个场所互换性的利用变成了理所当然的事情。

也就是在那个时候的1763年,法国的将军,为了实现带火炮,弹药的炮兵器材的互换性,发表了他制订的标准化计划。

进入20世纪后,正式的大量生产的时代到来了。那时谈的最多的话题是美国T型形式的车,从1908年开始近20年间生产了1500万台T型形式的车,该车也被称为“世纪车”。在日本也引进了海外车型经过日本本国的改进,有一种叫“圆太郎”的车在东京风靡一时,现在的前辈们非常怀念以前的古典的车厢。

在当时T型形式的车因性能好,外观优美曾经很畅销。不管怎么样T型车当时仍然是有钱人的奢侈品。

到普通大众可以买的起为止,必须进行大副降价。对于价格下降做出巨大贡献的是,传送带在流水线上的使用。

传送带系统,几乎被所有的制造业导入使用,为20世纪工业发展做出了巨大贡献。

那么,流水线能够成立的第一条件是部品同伴之间具有互换性。流水线左边传送上过来的部品和流水线上右边流过来的部品可以自由组装。流水线左边传送上过来的部品和流水线上右边流过来的部品永远可以自由组装,如果不是这样,流水线生产不可能实现。也就是说,左边部品的同伴之间必须具有互换性,右边部品的同伴之间必须具有互换性。

比如说,部品之间没有互换性,那将是一件非常麻烦的事情。配对部品在流水线上按一定的节拍流过来,如果某一个部品不能使用,将被返回原处。当然对该不良品需要进行必要的处理。也就是说带传送带的流水线生产方式是不可能的。

基于以上原因,用带传送带的流水线生产方式进行大量生产的前提条件是部品的同伴之间具有互换性。

那么通过什么样的手段才能保证部品之间的互换性呢?下面进行举例说明。

让我们想象一下,有一个直径10㎜的轴与一个直径为10㎜的轴套进行配合,并且进行大量生产。

站在生产轴的角度上,总是希望做出来的轴的外直径与10㎜相比不大也不小。站在做轴套的角度上,总是希望做出来的轴套的孔径与10㎜相比不大也不小。因为不是神仙,做出来的产品与要求的尺寸一点误差也没有是不可能的事情。

那么按这样的条件做出来的轴和轴套进行配合。用一个轴与所有的轴套进行配合试一下发现、轴的外径比轴套的孔径大时,轴无法进入到轴套中。轴的外径比轴套的孔径大的概率50%发生的可能性也是有的。不得已,只有通过不同的轴与不同的轴套逐个试一遍,也许会提高轴和轴套配合的良品率,那么会需要很多人手,在大量生产的情况下只有边生产边哭了。如果轴的同伴之间,轴套的同伴之间没有互换性的话,生产会非常狼狈。

因此在加工时要指定尺寸公差(尺寸单位使用mm.)

轴的直径10+0.0-0.1 (1.1)

轴套的直径10+0.1-0.0 (1.2)

总之,轴的外径在9.0~10.0之间波动,轴套的直径在10.0~10.1之间波动。按以上规格进行加工的话,尺寸最大的轴与尺寸最小的轴套进行配合的话,之间的缝隙用下列公式进行计算:

(10-0.0)-(10+0.0)=0 (1.3)

轴与轴套之间虽然一点缝隙也没有,努努力还是可以把轴塞到轴套中。下面我们用外径最小的轴与内径最大的轴套配合,之间的缝隙用下列公式进行计算:

(10+0.1)-(10-0.1)=0.2 (1.4)

轴与轴套之间会产生0.2的缝隙,但是这点缝隙对使用上不造成影响。这样的话所有的轴可以配合所有的轴套。可以说在本例的轴的同伴之间,轴套的同伴之间互换性得到了实现。

另外,(1.1)中的+0.0-0.1部分被成为公差值(tolerance)。为了实现部品同伴之间的互换性而制订的尺寸变化幅度。

接下来的话题可能会扯的远一些。现在我们尽量做出来的轴和轴套满足(1.1)和(1.2) 的要求。做出的大量的制品如果经过测量不满足尺寸规格,对不良品需要剔除,要花相当多的时间和劳力,也就是说要花大量的经费。

这时需要对所做的产品进行检查,比如说我们要加工一个轴要用图1.1样式的检查器具进行检查。虽然看起来有些古老,但是是最廉价的检查方法。

我们假定我们用无变形,无擦伤,无缺损的原材料制作内径为9.9和10.0的孔,制作出来的轴进入10.0的孔,不能进入到9.9孔内,我们判定该轴为良品。相反如果生产出来的轴不能进入10.0的孔或进入到9.9孔内我们判定该轴为不良品。

作为10+0.1-0.0孔的检查器具,用10.1的圆棒,10.0的圆棒进行测试,10.1的圆棒进入到孔中或10.0的圆棒不能进入到孔中都判定为不良品。

以上讲述的例子中,为了使轴和轴套具有互换性,对轴和轴套的尺寸进行了管理。尺寸是产品的重要品质项目之一,用专用的品质管理方法进行管理也言之不过。

前面提到过的话题讲述一下,前面(1.1)的要求进行加工轴时,轴的外径以9.95为目标进行加工。还有(1.2)的要求进行加工孔时,孔的内径以10.05为目标进行加工。也就是说,在部品加工时,我们一般按指定的公差中心值进行生产。在加工时如果有正确的品质管理方法,制作出来的轴和轴套之间的配合偏紧,偏松的几率接近零的话是最理想的。

基于以上,我们可以说大量生产与互换性是表里如一的,互换性与品质管理也是表里如一的。

SQC的成熟与TQC

时代在不断的进步,敲响人类最不幸大门的是第二次世界大战的爆发(1939~1945)。对于二次世界大战的看法多种多样,但是简单一句话概括的话,扩大了殖民地,世界被一分为二。一个是以美·英为首的战胜国,以日本为主的战败国。沾满血迹的一场场战争是历史上的悲惨事件。

随着近代工业的崛起,也伴随着战争的发生。但是这个战争是企业之间争夺销售量的战争,也就是企业之间的品质之战。在近代的战争中,战争的胜败主要取决于武器的数量和质量。于是在各个国家生产兵器的流水线大量激增,没有经验的作业员大量进入流水线,虽然可以增产,但是也不能降低质量。

对于这个非常高的要求,做的比较好的是美国。汽车自动化的实现,虽然一部分原因援于是因资源丰富和劳动力充足,但比这更为重要的是在品质管理方面的成功。

在各种各样的管理方法中,取得最显著成果的是抽样方法的应用。突然投入生产线的作业员生产出来的品质是不稳定的。对所有产品都检查,再加上剔除不良品,会花费大量的时间和人手。因此在大量生产的时候只有进行抽样检查。抽样时需按照一定的规则,用对抽样品的检查推测全部产品的品质状况。

根据品质检查结果,为了把不良品的不良率控制在要求范围内看需不要对生产工程进行改善。抽样方法作为品质管理战术确实带来了很好的效果。抽样方法被称为品质管理的源泉。以抽样方法这样的统计数学为基础的品质管理称为SQC(Statistical Quality Control)

对大量生产出来的制品进行抽样检查,可以推测整体不良率也可以对不良现状进行调查。但是仅靠这个抽样方法并不能降低不良率。从品质管理的角度上,材料和加工方法等方面,抽样方法确实是有效的品质管理手段。

但是,根据抽样方法的数据,对所有制品的品质性质进行推测的统计方法称为推测统计学。推测统计学需要有高等数学的知识,但是现场每个岗位全部配布具有高等数学的员工是不可能的。对数据整理,浅易能够理解的现场管理手法诞生了。这就是后来在日本企业非常普及的QC七个手法。

QC的七个手法是:检查表,直方图,柏拉图,管理图,散布图,特性要因图,图解。在所有的图解里面数据的层别图第一被重视。

第二次世界大战结束后,日本以制造工业国为目标从战后的废墟中迅速崛起。导入从美国产生并成熟起来的品质管理方法。日本从手表,相机,缝纫机,石油炉等轻工业为首的企业中充分使用了品质管理方法。最初的Made In Japan的产品给人的印象是价格便宜,质量非常差。导入美国的品质管理方法经过消化吸收后应用于他们的企业,短时间内改变了世界对日本产品的看法。

后来以现场为主的QC活动,扩展到企画,设计,营业,财务等部门,公司进入到全员QC活动的阶段。

品质的好与坏最终由客户判断的,符合客户需要的产品对客户来说就是良品。作为与客户经常接触的窗口人员应该了解倾注了全公司智慧的品质管理。

QC活动的实战部队是QC小组,以现场的班长为中心,现场作业员参加,以学习会的形式展开了QC小组运动。渐渐QC活动的热情运动充满了公司。

这种QC活动把公司全员的热情和想法带到品质管理中,使品质管理获得了巨大的成功,被全世界所认可。象这样全员参加的品质管理称为TQC(Total Quality Control)

以制造业为中心取得成功的TQC,后来在农水产业,建设业,流通业,金融业,服务业等几乎所有领域都推广了QC活动。

第2章

数据整理的的宝石。

看到一棵树会想到一片森林方法。

中国自古以来流行一句话:“举一反三”。是说对于一件事件知道的其中一部分可以推测其全部事件的特性。在英语中“A word to a wise man is enough”,这就是取样管理理念的精髓。

我们应该为抽样方法在品质管理上带来的特殊功效而感到高兴。我们使用的抽样方法是,在大量生产的制品中抽取极其少的一部分样品进行品质测量,调查。利用样品的测量,调查数据进行对全体产品的特性推测。也就是说知道1就可以推测100。但是对抽样方法必须智慧的使用,为了能够智慧地使用抽样方法,需要对下面的枯燥无味的话题进行说明。

我们在全部制品中取少数样品进行测量分析,这个被调查对象的全体称为母集团(POPULATION)。为调查取出来的样品称为标本(SAMPLE)这是统计学的一般做法。母集团中的要素个数是无限的话,我们称该母集团为无限母集团。母集团中的要素个数是有限的话我们称该母集团为有限母集团。虽然存在有限母集团,但是我们一般研究无限母集团。

那么,针对抽样检查,我们举个例子进行话题说明。检查对象的性质,有连续性的特征和离散性的特征两种情况。对两种情况必须进行区分。连续性的值:重量、长度、强度等。离散性:个数、性别、正、误、上、中、下。站在测量的立场上来看,对连续的参数进行测量时称为计量性,对离散性的参数进行测量时称为计数性。

对连续性和离散性的两种性质的数据使用的统计方法是不一样的。

连续性的数据做出来的图让我们感到非常美、非常陶醉。关于用物理性的测量仪器很难计量的数据、近年来各种各样的方法开始被设计出来并且得到了应用。不管如何,美感是品质管理的中枢。如果在品质管理上不追求完美品质就会掉眼泪了。

那么我们进行举例说明,例如某制药公司在最终工程,要把药每100g装入一个药瓶中。从医学的角度上和经营的角度上两方面进行考虑,装入药瓶的管理规格设为:

100±10g

也就是说把药装入药瓶的工程品质管理目标是:每瓶药的药量必须控制在“100±10g”的范围内。

在这个管理工程中,作业员有没有按规定在作业呢?装入瓶中的药量是否符合“100±10g”的要求呢?

为了解开以上疑问需要对装好的药瓶的药量进行抽样检查。在抽样时千万注意不能有习惯癖好。当您的习惯癖好刚好与机器的周期性癖好一致时,抽出来的样品的检验结果会和母集团的整体状态存在比较大的偏差。

为了避开认为因素造成的偏差,在抽样时尽可能不要把人为的意愿加进去。在抽样时完全听于天命。这样的抽样称为随即抽样(random sampling)

____________2·1________________________________

85 69 41 45 99 51 38 77 96

82 76 43 41 76 61 83 43 34

63 56 51 67 68 99 50 67 83

__________________________________________________

如果进行抽样,首先准备类似2·1的数表。比如说在以上表中抽取82,接下来再抽取哪个数据可以非常好的代表整体数据呢?速度很快的抽取82旁边的76的话那是不行的。必须反正常思维的把样品抽出来。

代表值的选出

那么,我们就马上开始吧。从简单的例子。

1,2,2,2,3,3,4,5

对以上8个数据进行筛选。我们看到这8个数据的值时,可以联想到8个行李包的重量,也可以联想到8位员工的从业年数,就是联想到8个人拥有的钞票的数量也是可以的。暂且认为这8个数据的值与母集团,标本等没有关系。怎么样才能正确的表达出这8个数据的特性呢?什么也不用考虑,因为只有8个数据,只要把[1,2,2,2,3,3,4,5]8个数据念完就可以知道整体的内容。但是当数据很多时怎么办呢?一个一个去数是不可能的。当数据多时需要从以下几点说明集团的性质。

1,值(数据)的个数

2,代表值

3,波动的大小

4,分布情况

关于数据不需要做特别的说明,本部分内容略去。对另外3个项目重点介绍。

首先,代表值的说明。在8个数据中选一个数做代表值,哪一个值最合适呢?如果这8个数据的值代表的是8个小包的重量,让我们做一个货架,放置任何一个小包都可以承受的起,那么选5作为代表值最合适不过了。

另外,当这8个值代表的是选举侯选者的编号时,那么2号是当选者。因为2这个值出现频度最多的,象这样的值称为频率最高值。在普通选举中,用频率最高值来决定胜负。

但是,假如没有特殊情况。只是单纯地来选代表值,那么这个代表值应该是接近这8个值中心的那个数。比如说[以0.1为中心值集合],[以300万为中心值的集合]。

中央值

数值从小到大排序,处于位置中心的值称为中央值。

算术平均值

[1,2,2,2,3,3,4,5]

对以上8个数据按民主主义的原则,每个数据取8分之1再相加。(2·1)

(1×1/8)+(2×1/8)+…+(5×1/8)

=(1+2+2+2+3+3+4+5)/8

=2.75

根据以上公式,8个数相加以后再平均(算术平均)。算术平均值可以作为集团的一个代表值。算术平均值有特殊的含义。让我们做个图(2·1)进行说明,首先我们假设有一个完全没有重量的棒,在棒上的任何地方都可以设定一个原点。然后,离开原点的一个单位距离的地方,画一个一个单位重量的球。在这里就设定距离单位为cm厘米,其实设定mm,m都可以。如同以上,我们在离开原点2个距离单位的地方画3个重量单位的球,在离开原点3个距离单位的地方画2个重量单位的球,在离开原点距离4个单位的地方画一个重量单位的球,在离开原点5个距离单位的地方画一个重量单位的球。让我们在画了球的棒上找一个点,这个点不偏向任何方向,这个点就是物理学上的重心,也就是数学上的相加平均(算术平均)。

我们书归正转,下面需要大家记住数学的专用符号。我们现实遇到的情况,并不象举的例子那样简单(1,2,2,2,3,3,4,5)。而往往是下面的情况:

x1,x2,x3, (x)

求N个值的和值就是如下公式

x1+x2+x3+…+xi+…xn

n

∑xi

i=1

以上求和公式是数学上的专用公式。∑读为西格玛,S是希腊字符Sum(合计)的第一个字母的表示。在∑下面i=1,i是从1开始的。∑上面写的n的意思是从1开始相加一直加到n为止。简单的记法为:

∑xi

N个值的相加平均记为x-,相加平均(算术平均)是N个值相加再被N除,用下面的公式进行表示:

x-=1/n∑xi

我们把N个值相乘再开方根,我们前面举例的8个数据为例

85

?

?

?

?

?=81440≈2.48

?

2

3

4

3

2

2

1?

通过以上公式得到的平均值称为相乘平均(几何平均)

相乘平均(几何平均)与整个集合的中心值非常接近,也非常有意义。因为计算比较麻烦,物理学上的意思的理解也比较困难,所以在统计学上始终没有得到广泛的应用。

偏差大小的表示

我们前面举过8个数值的例子。

1,2,2,2,3,3,4,5

作为这个集合的代表值可以使用相加平均(算术平均)2.75来描述。接下来我们着眼研究这组集合的偏差。虽然算术平均值可以一定程度上描述集合的性质,但是偏差多大看不出来,比如说2和4之间,-300和500之间集合的相加平均(算术平均)都有可能是2.75。因此我们需要对集合的偏差做出约束。就象集合的代表值一样,偏差也有专门的算法。我们用集合中的最大值与最小值的差来表示偏差。偏差的符号用R来表示

R=5-1=4

R是英语单词Range的第一个字母。这样的表示非常的轻松,但是如同算术平均值一样有它的缺点。证据如下:

(1,1,1,5,5)和(1,3,3,3,5)

两组数据进行比较看一下,两者的偏差R都是4,前组的数据分散在最大与最小两边,后组的数据则集中在中央。用眼睛一看感觉到后组的波动较小。为什么会出现这种情况呢?是因为偏差R值只用到了最大值与最小值两个数据。

与上面的求相加平均(算术平均)时一样,让所有的值都参与进来进行集合波动的研究。我们还是利用2·1的列举的8个数据,分别求他们离开中心值的距离,然后再对他们进行相加平均。

1-2.75=-1.75,…(中略)…,5-2.75=2.25

然后8个值相加再被8除,会得到什么样的结果呢?

期待充满胸怀,8个值分别减去2.75得到的差值再相加,我们会发现得到的和值是0。因为差值既有负值又有正值所以得到的和是0,这说明正向偏移的距离和负向偏移的距离相等。

我们不考虑正负号,偏移距离的绝对值进行平均。首先请看2·2的表。 -------------------------------------------------------------- Xi xi-x ︱ i-x ︱

-------------------------------------------------------------- 1 -1.75 1.75 2 -0.75 0.75 2 -0.75 0.75 2 -0.75 0.75 3 0.25 0.25 3 0.25 0.25 4 1.25 1.25 5 2.25 2.25

---------------------------------------------------------------- 合计 22 0 8.00

把xi-x 所有的值相加后,得到的和是0。如果不考虑正负号,把︱ i-x ︱所有的值相加得到的和是8。 群体波动的表示:1/n(xi-x)=1/8*8.00=1

8个值偏差波动是1,我们称之为平均偏差。标准偏差非常容易理解,也很容易计算。虽然有以上优点,但是还是没有被广泛应用,因为标准偏差是不考虑正负采用绝对值来计算的,在统计学的数学体系中是不受欢迎的。由于平均偏差是采用绝对值而没有得到广泛的应用,那么怎样才能既不需要采用绝对值,又能把符号去掉呢?我们使用二次方的形式。下面仍以 1,2,2,2,3,3,4,5 为例进行说明

-------------------------------------------------------------- Xi xi-x (i-x )2

-------------------------------------------------------------- 1 -1.75 3.0625 2 -0.75 0.5625 2 -0.75 0.5625 2 -0.75 0.5625 3 0.25 0.0625 3 0.25 0.0625 4 1.25 1.5625 5 2.25 5.0625

---------------------------------------------------------------- 合计 22 0 11.5000

利用下面的公式进行进行计算:

1/n(∑(xi-x)2

=1/8*11.500=1.4375 2·3

如果我们举例的单位为无名数的话,不会产生什么误解。可是如果给它增加个单位cm ,(xi-x -

)2的单位是cm 2

也就是说长度的单位的8个值,用2·3表示后变成了面积的单位cm 2

因此我们引入数学符号

2)(/1∧-∑x xi n =8/5.11=4375.1≈1.2

通过以上公式得到的值我们称之为标准偏差

来自表2·2

σ=

2

)

(

/

1∧

-

∑x

xi

n

该公式称为标准偏差公式,该标准偏差公式在统计学里面具有重要的意义。

练习:

1、09年2月15日

利用给定的数据进行求:标准偏差。

波动的分布情况

我们为了直截了当地描述一组数据的特性,前面讲述了相加平均也就是算术平均的概念。为了描述一个群体的数据的波动情况,我们引入了标准偏差的概念。最后我们研究一下数据的分布。

我们就用前面曾经用过的素材:

1,2,2,2,3,3,4,5 (2.1)

与前面2·1相同,数据共有8个,相加平均为2.75,标准偏差约1.2。

0.5,1.5,2.5,2.5,3.5,3.5,3.5,4.5 (2.15)

对“2.15”群体的数据而言,数值个数是8,相加平均2.75,标准偏差约1.2。如果仅凭数据个数,相加平均,标准偏差来描述一组数据群性质的话,(2.1)与(2.15)是完全一样的。

但是这两组数据的内容是完全不同的。前者都是整数(ROUND NUMBER),后者都是带小数点的数据群。前者群里面2这个数出现了3次,在群里面偏小的数据较多;后者群里面3.5这个数出现了3次,在群里面偏大的数据较多。两群数据到底有多少区别,只是用语言无法完全描绘。

因此,针对两组数据我们进行制作图表。以横轴表示数据的大小,纵轴表示数值的个数,这样制作出来的图称为直方图(histogram)也称柱状图。对两者的柱状图进行比较。

通过对两个图的比较我们可以看出,2·1直方图的中心向左偏,2·15的直方图的中心向右偏。不管如何,从两个图的对比可以看出,两图的中心反向。如果只是用语言说明,人的心情会很焦急。 对于直方图分布形状的描绘,用图画说明会更加容易理解。我们有句古话[听人说一百遍,不如用眼看一看], 在这里可以说成[用语言解释一百遍,不如用图看一看]。我们把2·1直方图的柱子高度,用线连起来,可以得到一条折线图。

因为在2·1的数据群中,数据总数只有8个,柱子只有5根,所以连起来的曲线不圆滑。但是随着数据的增多,柱子也会变多。当柱子无穷多时,最终折线变成平滑的曲线。

(g)锯齿型 常见的直方图

(f)孤岛型 (h)U 字型

在我们日常生活中常见的直方如上所示。

(a)是非常标准的正态分布图。我们以一定的品质为目标生产产品,无论怎么努力,产品与要求之间肯定

有误差。我们尽量减小误差,正误差和负误差尽量做到接近于0,但不可能使误差变为0。正态分布是抽样统计学的基本。

(b)工程的产品数据偏中心线以上。

(c)工程的产品数据偏中心线以下。

(d)加工过程中,有一个环节出了异常。比如说:车床的刀具磨损等

(e)两台机器同时加工同一类型的零件,但是两台机器的加工性能差别较大

(f)在组装过程中,大批量的中间有小批量的产品部品使用错误时,会有此图产生

(g)该图形在测量错误等时会发生。

以上我们介绍了各种各样的正态分布图,不同的图形也分别取了名字。不管取什么样名字,只要与图形的特征相吻合就可以了。

前面曾经介绍过的题材(1,2,2,2,3,3,4,5)可以按如下描述:

数值的个数 8个

代表值 2.75

数据波动度 1.2

分布型山顶左偏

下面讲述直方图的制作方法:

#:求极差R=最大值-最小值=SU-SL=107.3-93.4=13.9

#:求平均值X =(X1+X2+…X80)÷80 #:数据群划分组数决定(参照下图)

因为在该数据群中有80个数据所以根据上图需要分8个数据组。 #:求区间宽度a=R ÷组数=R ÷8=13.9÷8=1.7375≈2 #:制作区间度数列表 表2·5 区间度数列表

利用以上数据使用EXCEL 工具就可以制作出直方图了

正态分布图的制作方法

参考資料:QC 数学の話(大村 平著) 日科技連出版 翻訳完成日期:2009年6月6日 品质管理的基石统计初步(翻訳:李琰) 目录 ·从互换性到品质管理 ·QC 是迈向文明社会的技术突破 ·从互换性到品质管理 ·SQC 的成熟与TQC ·数据整理的基本 ·代表值的选出 ·平均值的计算 ·标准偏差的计算 ·正态分布概念引入 ·正态分布的加法与减法 ·正态分布应用举例 第1章 从统计学的互换性到品质管理 20世纪人类历史上发生了3大震撼世界技术的突破。1,原子能的利用;2,高分子化合物的合成;3, 信息技术的飞跃发展。关于原子能的利用,主要在民生和军事方面得到了广泛的发展。在人类历史上原子能的出现翻开了历史新的一页,震撼了世界这是众所周知的。二次世界大战期间在広島,長崎投下的原子弹的爆炸,造成了人类的大量伤亡。在民生应用方面,随着碳素系列能源的枯竭和CO 2排出的控制, 原子能发电已经得到广泛应用。 另外在高分子化合物合成技术方面,给人类生活带来了极大的影响。用塑料做成的各种各样建材类,器 具类遍布了我们的生活周围。如果把我们生活中存在的塑料制品全部拿走的话,我们生活就象没有了文字一样,土蹦瓦解。化肥使粮食增产。人工纤维的合成,给我们提供了丰富多样的衣着。合成橡胶,洗剂,粘结剂,调味品等不胜枚举。 还有,信息技术的飞跃发展。首先让我们只看一下和我们切身利益相关的民生用品,各种各样的业务预 约,存款储蓄,通信网和铁道网的管理,天气预报,犯罪搜查等虽然眼睛直接看不到,却支撑着我们的近代生活。而且各种技术计算,生命科学,人工智能等先端事物已变成了我们生活中的神圣组织。如果说没有高分子化合物我们的生活会瓦解的话,那么没有信息我们的生活会瘫痪。 基于以上,我们可以说,原子能是能源方面的突破,高分子合成是硬件方面的突破,信息技术是软件方 面的突破,3个方面对我们的生活带来了震撼性的影响。 那么为什么以上3个方面可以在20世纪能够获得极大的技术突破呢? 我认为是以下两个方面的原因: 1, 抗身抗生物质的发现。 2, 品质管理的普及。 为什么这么说呢?下面阐述理由。 最初的科学文明,把人类从严酷的劳动和疾病中解放出来。人类为了确保衣食住的安定,做出了很大的 QC 数学的 話题

excel 在一个界面中如何同时画出频次直方图和正态分布图

excel 在一个界面中如何同时画出频次直方图和正态分布图 excel有个数据分析工具,里面可以做直方图,但是正态分布图不能直接做。 若要两种图都显示,那么就需要用到函数了。 方法如下: 假若你的数据在A1:A10 1.统计数据个数;任意选个单元格,如B1,输入count(A1:A10); 2.求最大值;如B2中输入:max(A1:A10) 3.求最小值;如B3中输入:min(A1:A10) 4.求平均值;如B4中输入:average(A1:A10) 5.求标准偏差:如B5中输入:stdev(A1:A10) 6.获得数据区间;用最大值减最小值;如B6中输入:B3-B2 7.获得直方图个数;个数的开放加1,如B7中输入:sqrt(B1)+1 8.获得直方图组距;用区间除以(直方图个数-1),如B8中输入B7/(B7-1) 下面就开始作图了: 1.任选个空单元格:如C列第一个单元格C1,令C1等于最小值,即输入=B3 2.在C2中输入=C1+$B$8 (最小值逐渐累加,绝对引用) 3.选中C2,然后向下拉,直到数据大于最大值就可以了;比如你拉到C5了。 4.统计频数,如在D1中输入frequency(A1:A10,C1:C5)确定,然后将选中D1到D5,将光标定位到公式栏,同时按住ALT+Shift+Enter 5.统计正态分布的数据,E1中输入normdist(C1,$B$4,$B$5,0)回车;然后选中E1,下拉到E5 一、数据准备 直方图:

组界及频率 1. 统计数据个数;任意选个单元格,如B1,输入count(A1:A10); =IF(C9="","",COUNT(C9:AB14)) 2. 子组大小:=IF(B9="","",COUNT(B9:B14)) 3. 子组个数: =IF(AD14="","",IF(AD14=0,0,AD14/M4)) (用数据总数除子组大小(M4单元格)) =IF(C9="","",COUNT(C9:AB14)) (一共有多少个数据) 4. 求最大值;如B2中输入:max(A1:A10);=IF('X-R'!C9="","",MAX('X-R'!C9:'X-R'!AB14)) 5. 求最小值;如B3中输入:min(A1:A10);=IF('X-R'!C9="","",MIN('X-R'!C9:'X-R'!AB14)) 6. 求平均值;如B4中输入:average(A1:A10);=IF(C9="","",AVERAGE(C9:AB11)) 7. 求标准偏差:如B5中输入:stdev(A1:A10);=STDEV(C9:AA13);=IF(AE8="","",SQRT((AB45-(AE8*AE8/AD14))/(AD14-1))) 8. Sigma = =IF(AD17="","",AD17/L37) δ=R/D2 直方图: 以最小值减去SIGMA的二分之一为组界的起始数。 直方图的数据区间:以最大值减去最小值的十分之一为间隔 正态图: X Normal

excel正态分布

正态分布函数的语法是NORMDIST(x,mean,standard_dev,cumulative)cumulative为一逻辑值,如果为0则是密度函数,如果为1则是累积分布函数。如果画正态分布图,则为0。例如均值10%,标准值为20%的正态分布,先在A1中敲入一个变量,假定-50,选中A列,点编辑-填充-序列,选择列,等差序列,步长值10,终止值70。然后在B1中敲入NORMDIST (A1,10,20,0),返回值为0.000222,选中B1,当鼠标在右下角变成黑十字时,下拉至B13,选中A1B13区域,点击工具栏上的图表向导-散点图,选中第一排第二个图,点下一步,默认设置,下一步,标题自己写,网格线中的勾去掉,图例中的勾去掉,点下一步,完成。图就初步完成了。下面是微调把鼠标在图的坐标轴上点右键,选坐标轴格式,在刻度中填入你想要的最小值,最大值,主要刻度单位(x轴上的数值间隔),y轴交叉于(y 为0时,x多少)等等。确定后,正态分布图就大功告成了。 PS:标准正态分布的语法为NORMSDIST(z), 正态分布 (一)NORMDIST函数的数学基础 利用Excel计算正态分布,可以使用函数。 格式如下:变量,均值,标准差,累积, 其中: 变量:为分布要计算的值; 均值:分布的均值; 标准差:分布的标准差; 累积:若1,则为分布函数;若0,则为概率密度函数。 当均值为0,标准差为1时,正态分布函数即为标准正态分布函数 。 例3已知考试成绩服从正态分布,,,求考试成绩低于500分的概率。 解在Excel中单击任意单元格,输入公式: “ 500,600,100,1 ”,

利用Excel软件绘制正态概率纸的方法_图文(精)

数理统计分靳与应用 , 偏差O-,能够直观地分析出工序的过程能力,求出工序的过程能力指数Cr值或Cm值.并且还可咀估计工序的不合格品率。因此,利用正态概率纸分析工序的方法,具有多功能的优点(参阅文献『1]): 利用正态概率纸分析工序,有着直观、简单、快速和易于掌握等诸多优点,在生产现场中使用备受欢迎,但由于它是一种图算法,精度相对较差,然而在现场使用其精度也已足够。如能提高正态概率纸本身的绘制精度,将有助于弥补正态概率纸的这一缺点。 但是采用正态概率纸分析 j 工序,其前提是必须首先有正态j 概率纸,因此,就必须首先解决i 正态概率纸的绘制问题。 过去绘制正态概率纸都是手工放大绘图,然后缩小印制成专用坐标纸再供现场使用,不仅麻烦,而且误差较大,更加影响了使用精度。现在由于电脑的普及,采用电子表格软件Excel绘 态概率纸纵坐标上各代表点的位置问题。 根据文献[2]所提供的手工绘制正态概率纸的步骤,对之加咀改造和发展,形成下列利用Excel绘制正态概率纸的方法和步骤: 1.选纵坐标值中有代表性的点(正态分布函数值“):

0.0l%,0.02%,…,0.09%;0.10%.0.20%,…,0.90%:1.00%,2.00%.….9.00%;1000%.11.00%. ….19.00%;20.00%,22.00%.….28.00%(取偶数);30.00%,32.00%, ?一,38.00%(取偶数);40.00%,42.00%,…,48.00%(取偶数);50.00%,52.00%,…,58.00%(取偶 数):60.00%,62.00%,…,68瑚%(取偶数);70肿%.72.00%,….78.00%f取偶数);80.oo%,81肿%,?一, 89.00%;90.00%,91.00%,….99.00%;99.10%,99.20%, …, 99.90%:99.91%.9992%,….99.99%。 2.查正态分布函数表,查出上 刻度之间的间距)的方法来绘制表格的,故我们需要将原始纵坐标的数据转化成行高数据,以便于纵坐标的绘制;横坐标是等间距的,故一般设为lOO列,间距 即列宽为0.38。 纵坐标数据的转化公式:(1)算出相邻两个Zct之间的差值X。 X=Za..一ZⅡ+l (I)

利用Excel的NORMSDIST计算正态分布函数表1

利用Excel的NORMSDIST函数建立正态分布 表 董大钧,乔莉 理工大学应用技术学院、信息与控制分院, 113122 摘要:利用Excel办公软件特有的NORMSDIST函数可以很准确方便的建立正态分布表、查找某分位数点的正态分布概率值,极大的提高了数理统计的效率。该函数可返回指定平均值和标准偏差的正态分布函数,将其引入到统计及数据分析处理过程中,代替原有的手工查找正态分布表,除具有直观、形象、易用等特点外,更增加了动态功能,极大提高了工作效率及准确性。 关键词:Excel;正态分布;函数;统计 引言 正态分布是应用最广泛的连续概率分布,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,某种产品的力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。在科学研究及数理统计计算过程中,人们往往要通过某本概率统计教材附录中的正态分布表去查找,非常麻烦。若手头有计算机,并安装有Excel软件,就可以利用Excel的NORMSDIST( x )函数进行计算某分位数点的正态分布概率值,或建立一个正态分布表,准确又方便。 1 正态分布及其应用 正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为N(μ,σ2 )。则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是μ = 0,σ

用Excel2007制作直方图和正态分布曲线图

用Excel2007制作直方图和正态分布曲线图 ? ?| ?浏览:3677 ?| ?更新:2014-04-15 02:39 ?| ?标签: ? 1 ? 2 ? 3 ? 4 ? 5 ? 6 ?7 在学习工作中总会有一些用到直方图、正态分布曲线图的地方,下面手把手教大家在Excel2007中制作直方图和正态分布曲线图

工具/原料 ?Excel(2007) 方法/步骤 1. 1 数据录入 新建Excel文档,录入待分析数据(本例中将数据录入A列,则在后面引用中所有的数据记为A: A); 2. 2 计算“最大值”、“最小值”、“极差”、“分组数”、“分组组距”,公式如图: 3. 3 分组 “分组”就是确定直方图的横轴坐标起止范围和每个小组的起止位置。选一个比最小值小的一个恰当的值作为第一个组的起始坐标,然后依次加上“分组组距”,直到最后一个数据值比“最大值”大为止。这时的实际分组数量可能与计算的“分组数”有一点正常的差别。类似如下图。 4. 4 统计频率 “频率”就是去统计每个分组中所包含的数据的个数。 最简单的方法就是直接在所有的数据中直接去统计,但当数据量很大的时候,这种方法不但费时,而且容易出错。

一般来说有两种方法来统计每个小组的数据个数:1.采用“FREQUENCY”函数;2.采用“COUNT I F”让后再去相减。 这里介绍的是“FREQUENCY”函数方法: “Date_array”:是选取要统计的数据源,就是选择原始数据的范围; “Bins_array”:是选取直方图分组的数据源,就是选择分组数据的范围; 5. 5 生成“FREQUENCY”函数公式组,步骤如下: 1. 先选中将要统计直方图每个子组中数据数量的区域 6. 6 2. 再按“F2”健,进入到“编辑”状态 7.7 3. 再同时按住“Ctrl”和“Shift”两个键,再按“回车Enter”键,最后三键同时松开,大功告成! 8.8 制作直方图 选中统计好的直方图每个小组的分布个数的数据源(就是“频率”),用“柱形图”来完成直方图: 选中频率列下所有数据(G1:G21),插入→柱形图→二维柱形图

如何用EXCEL制作成绩分析的正态分布图解读

如何用EXCEL制作成绩分析的正态分布图 摘要:教学评价在学校教育教学工作中的重要地位毋容置疑。考试是对学生进行的一种教育测量,也是对教师教学质量、出题水平的评价。特别是数理统计方法的应用,使得我们对学生的教育测量转化为教学评价得到了有效的帮助。本文论述了如何用EXCEL制作考试成绩的正态分成图,并结合其它相关的衡量标准,比如,区分度,学生成绩柱状分布图,难度系数,优秀率等,融合于一个图表中进行分析。这是一种有效的可操作的方法,能让每一位教师从图中获得一种易于接受的直观认识,并且方便找出教学中存在的问题,并为以后教学改进措施的制定提供有效的帮助。 关键词:教学评价,EXCEL,成绩分析,正态分布。 教育评价学是教育科学领域中的一个重要的应用性很强的分支学科。在当今世界教育领域中,教育评价、教育基础理论和教育发展被认为是三大研究范围。教育是人类有目的、有计划、有组织的活动,教育活动涉及教育方案、教育活动的实施、教育活动的参与者等等,要提高学校教育活动的有效性,就必须对这些内容进行适当的评价。因此,教育评价对于学校教育的改革和发展,对于学校教育的管理和决策,都有着至关重要的作用,所以备受各国政府及其教育行政部门的重视。 在学校日常工作中,通过教育评价活动来强化管理,已受到人们的广泛重视。不论是宏观的教育行政管理还是微观的学校工作管理,都把教育评价当作一种有效的管理手段。就一所学校而言,管理水平的高低在一定程度上能反映出该校的评价工作开展得怎么样,而评价水平的高低又能体现出学校领导者的管理水平。实施素质教育的关键是教师素质的高低。为了提高教师素质,教育行政部门和学校都加大了对教师的管理力度,开展了对教师的教学评价工作。通过有效地评价教师,不仅调动了教师工作的积极性,而且进一步促进了师资队伍的建设。所以,要做一个有效的管理者,就要重视教育评价的作用。 教学评价是教育评价的重要组成部分。它以考试作为一种基础性的手段,来收集有关学生对知识的掌握程度方面的信息;以测验作为测量的手段,获得客观的数据,进行进一步的分析、综合,并作出价值上的判断。 在学校教育教学工作中,从研究的目的出发开展评价工作,就是要通过评价活动促进教育教学改革实验的进行,从而提高教育教学的科学研究水平。因此,教学评价将有助于学校及教育工作者自身进行检查、反思,并主动改进教育教学工作,从而有助于提高教育教学质量。教学常规工作中的段考、期考,不仅仅是为了测量学生的知识掌握程度,我们还应该使用现代的数理统计技术和现代信息技术来对考试成绩进行仔细、有效的分析,从中找出需要改进的教学问题,并为今后的教学改革提供依据。因此,我们就需要使用正态分布曲线来给我们的成绩分析提供一个有效的参考。 一、如何用EXCEL制作成绩分析的正态分布图呢?我们先来看一份样图:

excel正态分布图标曲线的制作过程介绍

excel有个数据分析工具,里面可以做直方图,但是正态分布图不能直接做。 若要两种图都显示,那么就需要用到函数了。 方法如下: 假若你的数据在A1:A10 1.统计数据个数;任意选个单元格,如B1,输入count(A1:A10); 2.求最大值;如B2中输入:max(A1:A10) 3.求最小值;如B3中输入:min(A1:A10) 4.求平均值;如B4中输入:average(A1:A10) 5.求标准偏差:如B5中输入:stdev(A1:A10) 6.获得数据区间;用最大值减最小值;如B6中输入:B3-B2 7.获得直方图个数;个数的开放加1,如B7中输入:sqrt(B1)+1 8.获得直方图组距;用区间除以(直方图个数-1),如B8中输入B7/(B7-1) 下面就开始作图了: 1.任选个空单元格:如C列第一个单元格C1,令C1等于最小值,即输入=B3 2.在C2中输入=C1+$B$8 (最小值逐渐累加,绝对引用) 3.选中C2,然后向下拉,直到数据大于最大值就可以了;比如你拉到C5了。 4.统计频数,如在D1中输入frequency(A1:A10,C1:C5)确定,然后将选中D1到D5,将光标定位到公式栏,同时按住ALT+Shift+Enter 5.统计正态分布的数据,E1中输入normdist(C1,$B$4,$B$5,0)回车;然后选中E1,下拉到E5 选择数据区域-二维堆积柱形图-确定完成,点击二维堆积柱形图的上数据图-右键-更改系列图标类型-选择折线图-图标空白处-右键-设置数据系列格式,看图吧:

----- ---- ----

------

excel利用函数制作正态分布图的方法

excel利用函数制作正态分布图的方法 Excel中的正太分布图具体该如何利用函数制作呢?接下来是小编为大家带来的excel利用函数制作正态分布图的方法,供大家参考。 excel利用函数制作正态分布图的方法函数制作正太分布图步骤1:获取正态分布概念密度 正态分布概率密度正态分布函数NORMDIST获取。 在这里是以分组边界值为X来计算: Mean=AVERAGE(A:A)(数据算术平均) Standard_dev=STDEV(A:A)(数据的标准方差) Cumulative=0(概率密度函数) excel利用函数制作正态分布图的方法图1 函数制作正太分布图步骤2:向下填充 excel利用函数制作正态分布图的方法图2 函数制作正太分布图步骤3:在直方图中增加正态分布曲线图 1、在直方图内右键选择数据添加 2、系列名称:选中H1单元格 3、系列值:选中H2:H21 4、确定、确定 excel利用函数制作正态分布图的方法图3 EXCEL中如何控制每列数据的长度并避免重复录入 1、用数据有效性定义数据长度。

用鼠标选定你要输入的数据范围,点数据-有效性-设置,有效性条件设成允许文本长度等于5(具体条件可根据你的需要改变)。 还可以定义一些提示信息、出错警告信息和是否打开中文输入法等,定义好后点确定。 2、用条件格式避免重复。 选定A列,点格式-条件格式,将条件设成公式=COUNTIF($A:$A,$A1)1,点格式-字体-颜色,选定红色后点两次确定。 这样设定好后你输入数据如果长度不对会有提示,如果数据重复字体将会变成红色。 在EXCEL中如何把B列与A列不同之处标识出来 (一)、如果是要求A、B两列的同一行数据相比较: 假定第一行为表头,单击A2单元格,点格式-条件格式,将条件设为: 单元格数值不等于=B2 点格式-字体-颜色,选中红色,点两次确定。 用格式刷将A2单元格的条件格式向下复制。 B列可参照此方法设置。 (二)、如果是A列与B列整体比较(即相同数据不在同一行): 假定第一行为表头,单击A2单元格,点格式-条件格式,将条件设为: 公式=COUNTIF($B:$B,$A2)=0

用EXCEL制作直方图和正态分布图

制作直方图 1、数据录入 新建Excel文档,录入待分析数据(本例中将数据录入A列,则在后面引用中所有的数据记为A:A);2 2、计算最大值、最小值、极差、分组数、分组组距 其中:极差=最大值-最小值,分组数=数据的平方根向上取整,分组组距=极差/ 分组数 3、分组 分组就是确定直方图的横轴坐标起止范围和每个小组的起止位置。选一个比最小 值小的一个恰当的值作为第一个组的起始坐标,然后依次加上“分组组距”,直 到最后一个数据值比“最大值”大为止。这时的实际分组数量可能与计算的“分 组数”有一点正常的差别。 4、统计频率 “频率”就是去统计每个分组中所包含的数据的个数。 序号分组频数频率(%) 最大值57.9 1 50.50 0 0.00 最小值50.6 2 50.91 1 0.00 极差7.3 3 51.31 0 0.00 分组数18 4 51.72 1 0.00 分组组距0.406 5 52.12 6 0.02 6 52.53 7 0.02 7 52.94 24 0.08 8 53.34 59 0.20 9 53.75 37 0.12 10 54.15 38 0.13 11 54.56 36 0.12 12 54.97 28 0.09 13 55.37 18 0.06 14 55.78 22 0.07 15 56.18 10 0.03 16 56.59 3 0.01 17 57.00 6 0.02 18 57.40 0 0.00 19 57.81 2 0.01 20 58.21 1 0.00

5、制作直方图 选中统计好的直方图每个小组的分布个数的数据源(就是“频率”),用“柱形图”来完成直方图:选中频率列下所有数据(G1:G21),插入→柱形图→二维柱形图 6、修整柱形图 选中柱形图中的“柱子”→右键→设置数据系列格式: (1)系列选项,分类间距设置为0%; (2)边框颜色:实线,白色(你喜欢的就好) (3)关闭“设置数据系列格式”窗口 10 20 30 40 50 60 70 1234567891011121314151617181920 系列1 10 20 30 40 50 60 70 1234567891011121314151617181920 频数 频数

Excel有关正态分布函数和曲线图

Excel有关正态分布函数和曲线图 正态分布函数的语法是NORMDIST(x,mean,standard_dev,cumulative)cumulative为一逻辑值,如果为0则是密度函数,如果为1则是累积分布函数。如果画正态分布图,则为0。 例如均值10%,标准值为20%的正态分布,先在A1中敲入一个变量,假定-50,选中A列,点编辑-填充-序列,选择列,等差序列,步长值10,终止值70。然后在B1中敲入NORMDIST(A1,10,20,0),返回值为0.000222,选中B1,当鼠标在右下角变成黑十字时,下拉至B13,选中A1B13区域,点击工具栏上的图表向导-散点图,选中第二排第二个图,点下一步,默认设置,下一步,标题自己写,网格线中的勾去掉,图例中的勾去掉,点下一步,完成。图就初步完成了。下面是微调把鼠标在图的坐标轴上点右键,选坐标轴格式,在刻度中填入你想要的最小值,最大值,主要刻度单位(x轴上的数值间隔),y轴交叉于(y为0时,x多少)等等。确定后,正态分布图就大功告成了。 PS:标准正态分布的语法为NORMSDIST(z), 均值:分布的均值; 标准差:分布的标准差; 累积:若1,则为分布函数;若0,则为概率密度函数。 当均值为0,标准差为1时,正态分布函数NORMDIST即为标准正态分布函数NORMDIST。 例3已知考试成绩服从正态分布,,,求考试成绩低于500分的概率。解在Excel中单击任意单元格,输入公式: “=NORMDIST (500,600,100,1 )”, 得到的结果为0.158655,即,表示成绩低于500分者占总人数的 15.8655%。 例4假设参加某次考试的考生共有2000人,考试科目为5门,现已知考生总分的算术平均值为 360,标准差为40分,试估计总分在400分以上的学生人数。假设5门成绩总分近似服从正态分布。 解设表示学生成绩的总分,根据题意,,。 第一步,求。 在Excel中单击任意单元格,输入公式: “=NORMDIST (400,360,40,1 )”,得数为0.841345. 在Excel中单击任意单元格,输入公式: “ ”,得到的结果为400.000042,即 第二步,求总分在400分以上的学生人数。 在Excel中单击任意单元格,输入“=2000*0.841345”,得到结果为1682.689, 即在2000人中,总分在400分以上的学生人数约为1683人。

利用Excel的NORMSDIST计算正态分布函数表

利用Excel的NORMSDIST 函数建立正态 分布表 董大钧,乔莉 理工大学应用技术学院、信息与控制分院,113122 摘要:利用Excel办公软件特有的NORMSDIST函数可以很准确方便的建立正态分布表、查找某分位数点的正态分布概率值,极大的提高了数理统计的效率。该函数可返回指定平均值和标准偏差的正态分布函数,将其引入到统计及数据分析处理过程中,代替原有的手工查找正态分布表,除具有直观、形象、易用等特点外,更增加了动态功能,极大提高了工作效率及准确性。 关键词:Excel;正态分布;函数;统计 引言 正态分布是应用最广泛的连续概率分布,生产与科学实验中很多随机变量的概率分布都 可以近似地用正态分布来描述。例如,在生产条件不变的情况下,某种产品的力、抗压强度、 口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个 量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 在科学研究及数理统计计算过程中,人们往往要通过某本概率统计教材附录中的正态分布表 去查找,非常麻烦。若手头有计算机,并安装有Excel软件,就可以利用Excel的NORMSDISTX )函数进行计算某分位数点的正态分布概率值,或建立一个正态分布表,准确又方便。 1正态分布及其应用 正态分布(normal distribution )又名高斯分布(Gaussian distribution),是一个在数学、 物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为卩、标准方差为 /的高斯分布,记为N(卩,/ )。则其概率密度函数为正态分布的期望值□决定了其位置,其标准差b决定了分布的幅度。因其曲线呈钟

相关文档
最新文档