经验分布函数图绘制与演示
经验分布函数图绘制与演示
————————————————————————————————作者:————————————————————————————————日期:
实验二经验分布函数图形的绘制与演示
实验序号:2日期:2014 年 5 月 29 日班级数学学院2012级 F 班学号124080545 姓名王信
实验名称经验分布函数图形的绘制与演示
问题的背景和目的:
设X1,X2,…,X n是取自总体X的随机样本,F n(x)是总体X的经验分布函数,当n→∞时由格列汶科定理知
该定理说明F n(x)在整个实数轴上一概率1均匀收敛于F(x)。当样本容量n充分大时,经验分布函数F n(x)可以作为总体分布函数F(x)的一个良好的近似,这是数理
统计学中以样本推断总体的理论依据。
实验内容:
1、理解经验分布函数的构成,经验分布函数是样本的函数,随着样本观测值的变
化而变化。通过实验学习经验分布函数图形的绘制方法和动态演示过程
2、任意产生一组随机样本,对该样本从小到大排序;然后利用排序后的样本作
经验分布函数图形;让样本动态发生变化,观察相应的经验分布函数的数值和图形的
变化。
实验所用软件及版本:Excel 2003
实验过程:
1、经验分布函数的作图n=4。
①在Excel中产生一个服从均匀分布U(1,6)的样本容量n=4的随机样本。在单元格A2中
输入产生均匀分布U(1,6)的随机数命令“=1+5*RAND()”,再将其拖放填充至A5,就可在
单元格区域A2:A5中产生4个样本观测值x1,x2,x3,x4,每按一次F9键,这些随机数就会
发生变化,这为我们进行动态显示带来方便。接着我们把样本观测值x1,x2,x3,x4从小到
大排序,在单元格B2:B5中分别使用命令“=SMALL($A$2:$A$5,1)”(k=1,2,3,4)得到顺
序样本观测值。
②在单元格C2内输入起始值0,单击【编辑】/【填充】/【系列】,在出现的对话框输入
相应选项(如图1所示),就可在单元格区域C2:C702中顺序产生0,0.01,0.02,…,7
共703个自变量x的取值序列。
图1
③在D2单元格内输入公式
“=IF(C2<$B$2,0,IF(C2<$B$3,1/4,IF(C2<$B$4,2/4,IF(C2<$B$5,3/4,1))))”,再利用拖放填充功能将D2单元格内的计算公式复制到整个单元格区域D2:D702,就自动计算出所有Fn(x)的取值。
④最后利用单元格区域C2:C702中自变量x的取值和D2:D702中经验分布函数Fn(x)的
值画出散点图。单击【插入】/【散点图】。再对所得到的图形进行修饰整理即可得到经验分布函数图(如图2所示)。
图2
2、正态分布随机n=100。N(100,42)
在B2单元格输入公式“=NORMINV(RAND(),10,4)”产生服从正态分布N(100,42)
的100个样本观测值x1,x2,...,x100。接着把样本观测值x1,x2,…,x100从小到大排序。在
单元格C2中输入公式“=SMALL($B$2:$B$101,A2)”,将C2中的公式拖放填充至
C101单元格,得到顺序样本观测值。根据正态分布的3σ原理,在单元格D2中输
入起始值-5,单击【编辑】/【填充】/【系列】,在出现的对话框中输入相关选项,
这里选择等差数列,序列产生在列,步长值为0.01,终止值为26(如图3所示)。
在E2单元格输入公式”=COUNTIF($C$2:$C$101,"<="&$D2)/100”,将其拖放填充至
E312单元格得到相应的经验分布函数值Fn(x)。在F2单元格输入公式
“=NORMDIST(D2,10,4,1)”将其拖放填充至F312单元格。得到F(x)的值。选中E1:F312单击【插入】/【折线图】,将F(x)和Fn(x)画在同一个图里,对图形进行修饰
调整,得到图4.
图3 图4
实验结果总结及实验体会:
实验结果:
经验分布函数作图
正态分布随机数
实验体会:
使用Excel表格,每按一次F9,随机样本观测值发生改变,相应的顺序样本观测值发生相应变化。总体分布函数F(x)和经验分布函数Fn(x)图形也随之发生动态变化。,这给我们留下生动而直观的印象。便于观察总体分布函数和经验分布函数的变化趋势,进行比较。可以加深对经验分布函数的了解。从图可以看出,当样本容量n充分大时经验分布函数可以看做是总体分布函数的一个良好的近似。
教师评语与成绩:
标准正态分布的密度函数样本
幻灯片1 正态分布 第二章 第七节 一、标准正态分布的密度函数 二、标准正态分布的概率计算 三、一般正态分布的密度函数 四、正态分布的概率计算幻灯片2 正态分布的重要性正态分布是概率论中最重要的分布, 这能够由 以下情形加以说明: ⑴ 正态分布是自然界及工程技术中最常见的分布之一, 大量的随机现象都是服从或近似服从正态分布的.能够证明, 如果一个随机指标受到诸多因素的影响, 但其中任何一个因素都不起决定性作用, 则该随机指标一定服从或近似服从正态分布. 这些性质是其它 ⑵ 正态分布有许多良好的性质, 许多分布所不具备的. ⑶ 正态分布能够作为许多分布的近似分布.幻灯片3 -标准正态分布下面我们介绍一种最重要的正态分布 一、标准正态分布的密度函数若连续型随机变量X 的密度函数为定义 则称X 服从标准正态分布,
记为标准正态分布是一种特别重要的它的密度函数经常被使用, 分布。 幻灯片4 密度函数的验证 则有 ( 2) 根据反常积分的运算有能够推出 幻灯片5 标准正态分布的密度函数的性质若随机变量 , X 的密度函数为 则密度函数的性质为: 的图像称为标准正态( 高斯) 曲线幻灯片6 随机变量 由于 由图像可知, 阴影面积为概率值。对同一长度的区间 , 若这区间越靠近 其对应的曲边梯形面积越大。标准正态分布的分布规律时”中间多, 两头少” . 幻灯片7 二、标准正态分布的概率计算 1、分布函数分布函数为幻灯片8 2、标准正态分布表书末附有标准正态分布函数数值表, 有了它, 能够解决标准正态分布的概率计算.表中给的是x > 0时,①(x)的值. 幻灯片9 如果由公式得令则幻灯片10
第2章 随机变量及其分布习题解答
第二章 随机变量及其分布 1、解: 设公司赔付金额为X ,则X 的可能值为; 投保一年内因意外死亡:20万,概率为0.0002 投保一年内因其他原因死亡:5万,概率为0.0010 投保一年内没有死亡:0,概率为1-0.0002-0.0010=0.9988 所以X 2、一袋中有5X 表示取出的三只球中的最大号码,写出随机变量X 的分布律 解:X 可以取值3,4,5,分布律为 10 61)4,3,2,1,5()5(1031)3,2,1,4()4(10 11)2,1,3()3(35 2 435 2 335 2 2=?= === ?==== ?= ==C C P X P C C P X P C C P X P 中任取两球再在号一球为中任取两球再在号一球为号两球为号一球为 也可列为下表 X : 3, 4,5 P :10 6, 103,101 3、设在15只同类型零件中有2只是次品,在其中取三次,每次任取一只,作不放回抽样,以X 表示取出次品的只数,(1)求X 的分布律,(2)画出分布律的图形。 解:任取三只,其中新含次品个数X 可能为0,1,2个。 35 22 )0(315313= ==C C X P 3512)1(3 15213 12=?==C C C X P 35 1)2(3 15 113 22= ?= =C C C X P 再列为下表 X : 0, 1, 2 P : 35 1, 3512,3522 4、进行重复独立实验,设每次成功的概率为p ,失败的概率为q =1-p (0
经验分布函数及其应用
经验分布函数及其应用 经验分布函数定义 定义:设12n x x x ?,,,是总体(离散型、或连续型,分布函数F(x)未知)的n 个独立观测值,按大小顺序可排成12***n x x x ≤≤?≤。若1**k k x x x +<<,则不超过x 的观测值的频率为函数,就等于在n 次重复独立试验中事件{}x ξ≤的频率。 ()110,=,,1,2,,1 1,k k n n x x k x x x k n n x x x F * **+*?≤??<≤=-??>? *?…… 我们称此函数()n F x 为总体的经验分布函数或样本分布函数。 简单性质: 1.对于每一组观测值1,2,i i x i ξ*=*=,……,n ,()n F x *单调,非降,左连 续且在1,2,i x x i =*=,……,n 点有间断点,在每个点的跳跃值都是1 n 。 2.显然 ()01n F x ≤≤,具有分布函数的其他性质。 3.()n F x *为样本1 2n x x x ?,,,的函数,是一统计量,即为一随机变量,由于1 2n x x x ?,,,相互独立且有相同的分布函数()F x ,
因而它等价于n 次独立重复试验的伯努利概型中事件{}x ξ≤发生k 次其余n k -次不发生的额概率,即有: {}{}()()1()k n k k k n n k P F x C F x F x n -??==-??? ? 4.格列汶科定理 设总体ξ的分布函数为()F x ,经验分布函数为 ()n F x *,对于任何实数 x ,记 ()()sup n x n F x F x D -∞<<*+∞=- 则有lim 01n n P D →∞????==?????? 其中n D 也为一统计量用来衡量()n F x *与()F x 之间在所有的x 的值上 的最大差异程度,格列汶科定理证明了统计量n D 以概率为1地收敛于0,也就是如下所要说的经验分布函数的收敛性问题。 经验分布函数的收敛性 经验分布函数在统计中有着非常重要的作用, 是理论分布函数与实际数据间的桥梁, 本科教材中已经指出, 当样本容量足够大时, 经验分布函数依概率收敛于总体分布函数,所以, 统计推断才得以以样本为依据, 而得到合理的结果。而事实上, 经验分布函数与总体分布函数还有更进一步的收敛关系, 下简单介绍之
(完整版)数据分析(梅长林)第1章习题答案
第1章 习 题 一、习题1.1 解:(1)利用题目中的数据,通过SAS 系统proc univariate 过程计算得到: 139.0=x 7.06387S = 49.898312=S 0.142众数= 51.0g 1-= 08192.5=CV 126129.0g 2-=由得到的数据特征可知道,偏度为负,所以呈做偏态, 峰度为负,所以均值两侧的极端值较少。 (2) 139.0=M 31.0=R 0.135Q 1= 5.144Q 3= 5.9R 131=-=Q Q 375.1394 1 2141M 31=++= ∧ Q M Q (3) 通过SAS 系统proc capability 得到直方图,并拟合正态分布曲线:
(4) 通过SAS 系统proc univariate 可以画出茎叶图,从茎叶图可以看出数据大致呈对称分布,由于所给数据都是整数,所以叶所代表的小位数都是0。 (5) 通过SAS 系统proc univariate 过程计算得到: 0.971571W 0= 00()H p P W W =≤= 0.1741 取0.05=α,因α>=0.1742p ,故不能拒绝0H ,认为样本来自正态总体分布。 通过画QQ图和经验分布曲线和理论分布函数曲线,从图中可以看出QQ图近似的在一条直线上,经验分布曲线的拟合程度也相当好,所以可以进一步说明此样本来自正态总体分布。
二、习题1.2 7.8574027=x 1.62568785 S = 2.642860982=S 0.13721437g 1= 20.6898884=CV -1.4238025g 2= 由得到的数据特征可知道,偏度为正,所以呈右偏态,峰度为负,所以均值两侧的极端值较少。 (2)
t分布和标准规定正态分布
数理统计实验 t分布与标准正态分布 院(系): 班级: 成员:
成员: 成员: 指导老师: 日期:
目录 t分布与标准正态分布的关系 (1) 一、实验目的 (1) 二、实验原理 (1) 三、实验内容及步骤 (1) 四、实验器材 (6) 五、实验结果分析 (6) 六、实验结论 (6)
t分布与标准正态分布的关系 一、实验目的 正态分布是统计中一种很重要的理论分布,是许多统计方法的理论基础。正态分布有两个参数,μ和σ,决定了正态分布的本质。为了应用和计算方便,常将一般的正态变量X通过μ变换[(X-μ)/σ]转化成标准正态变量μ,以使原来各种形态的正态分布都转换为μ=0,σ=1的标准正态分布,亦称μ分布。对于标准正态分布来说,μ是数据整体的平均值,σ是整体的标准差。但实际操作过程中,人们往往难以获得μ和σ。因此人们只能通过样本对这两个参数做出估计,用样本平均值和样本标准差代替整体的平均值和标准差,从而得出了t分布。另外从图像的层面说,正态分布的位置和形态只与μ和σ有关,而t分布不只与样本平均值和样本标准差有关,还与自由度相关。通过实验了解t分布与标准正态分布之间的关系。 二、实验原理 运用EXCEL软件验证t分布与标准正态分布的关系,绘制相应的统计图表进行分析。 三、实验内容及步骤 1.打开Excel文件,将“t分布与标准正态分布N(0,1)”合并并居中,黑体,20字号,红色;
2.选中文件,选项,自定义功能区,加载开发工具.在开发工具中插入滚动条,调节滚动条大小; 3.设置A2单元格格式,数字自定义区”!n=#,##0;[红 色]¥-#,##0”.然后左对齐,设置为红色;
统计学常用分布及其分位数
§1、4 常用得分布及其分位数 1、 卡平方分布 卡平方分布、t 分布及F 分布都就是由正态分布所导出得分布,它们与正态分布一起,就是试验统计中常用得分布。 当X 1、X 2、… 、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 得分布称为自由度等于n 得2χ分布,记作Z ~2χ(n),它得分布 密度 p(z )=??? ????>??? ??Γ--,,00,2212122其他z e x n z n n 式中得??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布就是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布得定义以及上述随机变量得相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2、 t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 得分布称为自由度等于n 得t 分布,记作Z ~ t (n ),它得分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布得分布密度也就是偶函数,且当n>30时,t
标准正态分布
标准正态分布 标准正态分布(英语:standard normal distribution,德语Standardnormalverteilung),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。 定义: 标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。 正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是位置参数均数为0, 尺度参数:标准差为1的正态分布 特点: 密度函数关于平均值对称 平均值与它的众数(statistical mode)以及中位数(median)同一数值。 函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。 95.449974%的面积在平均数左右两个标准差的范围内。 99.730020%的面积在平均数左右三个标准差的范围内。 99.993666%的面积在平均数左右四个标准差的范围内。 函数曲线的反曲点(inflection point)为离平均数一个标准差距离的位置。 标准偏差:
深蓝色区域是距平均值小于一个标准差之内的数值范围。在正态分布中,此范围所占比率为全部数值之68%,根据正态分布,两个标准差之内的比率合起来为95%;三个标准差之内的比率合起来为99%。 在实际应用上,常考虑一组数据具有近似于正态分布的概率分布。若其假设正确,则约68.3%数值分布在距离平均值有1个标准差之内的范围,约95.4%数值分布在距离平均值有2个标准差之内的范围,以及约99.7%数值分布在距离平均值有3个标准差之内的范围。称为“68-95-99.7法则”或“经验法则”
实验五 经验分布函数图形的绘制与演示
实验六 经验分布函数图形的绘制与演示 6.1 实验原理 设()F x 是总体X 的分布函数,12,,,n X X X "是来自总体X 的简单随机样本.对任意一个实数x ,定义函数 #()(),i n X x F x x n ≤=?∞<<∞. (6.1) 其中#()i X x ≤表示样本分量12,,,n X X X "中小于或等于x 的个数,或者说,()n F x 是事件“X x ≤”发生的频率.易见)(x F n 满足分布函数的性质(单增、有界、右连续等),故)(x F n 为一分布函数,称)(x F n 为总体X 的经验分布函数.由格列汶科定理知 lim sup ()()0 1.n n x P F x F x →∞?∞<<∞???==???? 该定理说明)(x F n 在整个实数轴上以概率1均匀收敛于()F x .当样本容量n 充分大时,经验分布函数)(x F n 可以作为总体分布函数()F x 的一个良好的近似,这是数理统计学中以样本推断总体的理论依据. 当给定样本值1212(,,,)(,,,)n n X X X x x x =""时,若将12,,,n x x x "从小到大排序:(1)(2)()n x x x ≤≤≤",得到有序样本)()2()1(,,,n x x x ",由定义(6.1)知,)(x F n 的形式为 (1)()(1)()0,,(),,1,2,,1,1,. n k k n x x k F x x x x k n n x x +??=≤<=???>??" (6.2) 这就是根据样本观测值得到的经验分布函数的具体形式. 6.2 实验目的及要求 理解经验分布函数的构成,经验分布函数是样本的函数,随着样本观测值的变化而变化,通过实验学习经验分布函数图形的绘制方法和动态演示过程.具体要求为 1. 任意产生一组随机样本,对该样本从小到大排序; 2. 利用排序后的样本作经验分布函数图形; 3. 让样本动态变化,观察相应的经验分布函数图形的变化,写出实验体会.
概率论中几种常用重要分布
概率论中几种常用的重要的分布 摘要:本文主要探讨了概率论中的几种常用分布,的来源和他们中间的关系。其在实际中的应用。 关键词 1 一维随机变量分布 随机变量的分布是概率论的主要内容之一,一维随机变量部分要介绍六中常 用分布,即( 0 -1) 分布、二项分布、泊松分布、均匀分布、指数分布和正态分布. 下面我们将对这六种分布逐一地进行讨论. 随机事件是按试验结果而定出现与否的事件。它是一种“定性”类型的概念。为了进一步研究有关随机试验的问题,还需引进一种“定量”类型的概念,即,根据试验结果而定取什么值(实值或向量值)的变数。称这种变数为随机变数。本章内将讨论取实值的这种变数—— 一维随机变数。 定义1.1 设X 为一个随机变数,令 ()([(,)])([]),()F x P X x P X x x =∈-∞=-∞ +∞. 这样规定的函数()F x 的定义域是整个实轴、函数值在区间[0,1]上。它是一个普通的函数。成这个函数为随机函数X 的分布函数。 有的随机函数X 可能取的值只有有限多个或可数多个。更确切地说:存在着有限多个值或可数多个值12,,...,a a 使得 12([{,,...}])1P X a a ∈= 称这样的随机变数为离散型随机变数。称它的分布为离散型分布。 【例1】下列诸随机变数都是离散型随机变数。 (1)X 可能取的值只有一个,确切地说,存在着一个常数a ,使([])1P X a ==。称这种随机变数的分布为退化分布。一个退化分布可以用一个常数a 来确定。 (2)X 可能取的值只有两个。确切地说,存在着两个常数a ,b ,使 ([{,}])1P X a b ∈=.称这种随机变数的分布为两点分布。如果([])P X b p ==,那 么,([])1P X a p ===-。因此,一个两点分布可以用两个不同的常数,a b 及一个在区间(0,1)内的值p 来确定。 特殊地,当,a b 依次为0,1时,称这两点分布为零-壹分布。从而,一个零-壹分布可以用一个在区间(0,1)内的值p 来确定。 (3)X 可能取的值只有n 个:12,...,a a (这些值互不相同),且,取每个i a 值
正态分布讲解(含标准表)
2.4正态分布 复习引入: 总体密度曲线:样本容量越大,所分组数越多,各组的频率就越接近于总体在相应各组取值的概率.设想样本容量无限增大,分组的组距无限缩小,那么频率分布直方图就会无限接近于一条光滑曲线,这条曲线叫做总体密度曲线. 总体密度曲线 b 单位 O 频率/组距 a 它反映了总体在各个范围内取值的概率.根据这条曲线,可求出总体在区间(a,b)内取值的概率等于总体密度曲线,直线x=a,x=b及x轴所围图形的面积. 观察总体密度曲线的形状,它具有“两头低,中间高,左右对称”的特征,具有这种特征的总体密度曲线一般可用下面函数的图象来表示或近似表示: 2 2 () 2 , 1 (),(,) 2 x x e x μ σ μσ ? πσ - - =∈-∞+∞ 式中的实数μ、)0 (> σ σ是参数,分别表示总体的平均数与标准差,, ()x μσ ? 的图象为正态分布密度曲线,简称正态曲线. 讲解新课:
一般地,如果对于任何实数a b <,随机变量X 满足 ,()()b a P a X B x dx μσ?<≤=?, 则称 X 的分布为正态分布(normal distribution ) .正态分布完全由参数μ和σ确定,因此正态分布常记作),(2 σ μN .如果随机变量 X 服从正态分布,则记为X ~),(2σμN . 经验表明,一个随机变量如果是众多的、互不相干的、不分主次的偶然因素作用结果之和,它就服从或近似服从正态分布.例如,高尔顿板试验中,小球在下落过程中要与众多小木块发生碰撞,每次碰撞的结果使得小球随机地向左或向右下落,因此小球第1次与高尔顿板底部接触时的坐标 X 是众多随机碰撞的结果,所以它近似服从正态分布.在现实生活中,很多随机变量都服从或近似地服从正态分布.例如长度测量误差;某一地区同年龄人群的身高、体重、肺活量等;一定条件下生长的小麦的株高、穗长、单位面积产量等;正常生产条件下各种产品的质量指标(如零件的尺寸、纤维的纤度、电容器的电容量、电子管的使用寿命等);某地每年七月份的平均气温、平均湿度、降雨量等;一般都服从正态分布.因此,正态分布广泛存在于自然现象、生产和生活实际之中.正态分布在概率和统计中占有重要的地位. 说明:1参数μ是反映随机变量取值的平均水平的特征数,可以用样本均值去佑计;σ是衡量随机变量总体波动大小的特征数,可以用样本标准差去估计. 2.早在 1733 年,法国数学家棣莫弗就用n !的近似公式得到了正态分布.之后,德国数学家高斯在研究测量误差时从另一个角度导出了它,并研究了它的性质,因此,人们也称正态分布为高斯分布. 2.正态分布),(2 σ μN )是由均值μ和标准差σ唯一决定的分布 通过固定其中一个值,讨论均值与标准差对于正态曲线的影响
16种常见概率分布概率密度函数、意义及其应用
目录 1. 均匀分布 (1) 2. 正态分布(高斯分布) (2) 3. 指数分布 (2) 4. Beta分布(:分布) (2) 5. Gamm 分布 (3) 6. 倒Gamm分布 (4) 7. 威布尔分布(Weibull分布、韦伯分布、韦布尔分布) (5) 8. Pareto 分布 (6) 9. Cauchy分布(柯西分布、柯西-洛伦兹分布) (7) 2 10. 分布(卡方分布) (7) 8 11. t分布................................................ 9 12. F分布 ............................................... 10 13. 二项分布............................................ 10 14. 泊松分布(Poisson 分布)............................. 11 15. 对数正态分布........................................
1. 均匀分布 均匀分布X ~U(a,b)是无信息的,可作为无信息变量的先验分布。
2. 正态分布(高斯分布) 当影响一个变量的因素众多,且影响微弱、都不占据主导地位时,这个变量 很可能服从正态分布,记作 X~N (」f 2)。正态分布为方差已知的正态分布 N (*2)的参数」的共轭先验分布。 1 空 f (x ): —— e 2- J2 兀 o' E(X), Var(X) _ c 2 3. 指数分布 指数分布X ~Exp ( )是指要等到一个随机事件发生,需要经历多久时间。其 中,.0为尺度参数。指数分布的无记忆性: Plx s t|X = P{X t}。 f (X )二 y o i E(X) 一 4. Beta 分布(一:分布) f (X )二 E(X) Var(X)= (b-a)2 12 Var(X)二 1 ~2
第三-四章 概率分布练习题
第三-四章 概率与离散变量的概率分布练习题 一、填空 1.用古典法计算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( )。 2.分布函数)(x F 和)(x P 或?)(x 的关系,就像向上累计频数和频率的关系一样。所不同的是,)(x F 累计的是( )。 3.如果A 和B ( ),总有P(A/B)=P 〔B/A 〕=0。 4.若事件A 和事件B 不能同时发生,则称A 和B 是( )事件。 4.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是(1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。 二、单项选择 1.随机试验所有可能出现的结果,称为( D )。A 基本事件; B 样本;C 全部事件;D 样本空间。 2.在次数分布中,频率是指( ) A.各组的频率相互之比 B.各组的分布次数相互之比 C.各组分布次数与频率之比 D.各组分布次数与总次数之比 3.以等可能性为基础的概率是(A )。A 古典概率;B 经验概率;C 试验概率;D 主观概率。 4.古典概率的特点应为( A )。 A 基本事件是有限个,并且是等可能的; B 基本事件是无限个,并且是等可能的; C 基本事件是有限个,但可以是具有不同的可能性; D 基本事件是无限的,但可以是具有不同的可能性。 5.任一随机事件出现的概率为( D )。A 在–1与1之间;B 小于0;C 不小于1;D 在0与1之间。 6.若P (A )=0.2,P(B )=0.6,P (A/B )=0.4,则)(B A P =( D )。A 0.8 B 0.08 C 0.12 D 0.24。 7.若A 与B 是任意的两个事件,且P (AB )=P (A )·P (B ),则可称事件A 与B (C )。 A 等价 B 互不相容 C 相互独立 D 相互对立。 8.若相互独立的随机变量X 和Y 的标准差分别为6与8,则(X +Y )的标准差为(B )。A 7 B 10 C 14 D 无法计算。 9.如果在事件A 和B 存在包含关系A ?B 的同时,又存在两事件的反向包含关系A ?B ,则称事件A 与事件B (A )A 相等 B 互斥 C 对立 D 互相独立 10.二项分布的数学期望为(C )。A n(1-n)p B np(1- p) C np D n(1- p)。 11.关于二项分布,下面不正确的描述是(A )。 A 它为连续型随机变量的分布; B 二项分布的数学期望)(X E =μ=np ,变异数)(X D =2 σ=npq ; C 它的图形当p =0.5时是对称的,当p ≠ 0.5时是非对称的,而当n 愈大时非对称性愈不明显; D 二项分布只受成功事件概率p 和试验次数n 两个参数变化的影响。 12.事件A 在一次试验中发生的概率为 4 1 ,则在3次独立重复试验中,事件A 恰好发生2次的概率为(C )。 A 21 B 161 C 64 3 D 649 13.设随机变量ξ~B ????6,12,则P (ξ=3)的值为( A ) A.516 B.316 C.58 D.716 14.设随机变量ξ ~ B (2,p ),随机变量η ~ B (3,p ),若P (ξ ≥1) =59,则P (η≥1) =( )A.13 B.59 C.827 D.19 27 解析:∵P (ξ≥1) =2p (1-p )+p 2=59, ∴p =13 ,∴P (η≥1) =C 13????13????232+C 23????132????23+C 33????133=1927,故选D. 15.在4次独立重复试验中,随机事件A 恰好发生1次的概率不大于其恰好发生2次的概率,则事件A 在一次试验中发生的概率p 的取值范围是( A ) A .[0.4,1) B .(0,0.6] C .(0,0.4] D .[0.6,1)
利用Excel的NORMSDIST计算正态分布函数表
利用Excel的NORMSDIST函数建立正态 分布表 董大钧,乔莉 理工大学应用技术学院、信息与控制分院,113122 摘要:利用Excel办公软件特有的NORMSDIST函数可以很准确方便的建立正态分布表、查找某分位数点的正态分布概率值,极大的提高了数理统计的效率。该函数可返回指定平均值和标准偏差的正态分布函数,将其引入到统计及数据分析处理过程中,代替原有的手工查找正态分布表,除具有直观、形象、易用等特点外,更增加了动态功能,极大提高了工作效率及准确性。 关键词:Excel;正态分布;函数;统计 引言 正态分布是应用最广泛的连续概率分布,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,某种产品的力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。在科学研究及数理统计计算过程中,人们往往要通过某本概率统计教材附录中的正态分布表去查找,非常麻烦。若手头有计算机,并安装有Excel软件,就可以利用Excel的NORMSDIST( x )函数进行计算某分位数点的正态分布概率值,或建立一个正态分布表,准确又方便。 1 正态分布及其应用 正态分布(normal distribution)又名高斯分布(Gaussian distribution),是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为N(μ,σ2 )。则其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。因其曲线呈钟
课后习题参考答案
习题一 1 设总体X 的样本容量5=n ,写出在下列4种情况下样本的联合概率分布. 1)),1(~p B X ; 2))(~λP X ; 3)],[~b a U X ; 4))1,(~μN X . 解 设总体的样本为12345,,,,X X X X X , 1)对总体~(1,)X B p , 11223344555 11 1 55(1) (,,,,)()(1)(1)i i n x x i i i i x x P X x X x X x X x X x P X x p p p p -==-========-=-∏∏ 其中:5 1 15i i x x ==∑ 2)对总体~()X P λ 11223344555 1 1 555 1 (,,,,)()! ! i x n i i i i i x i i P X x X x X x X x X x P X x e x e x λ λ λλ-==-========== ∏∏ ∏ 其中:5 1 15i i x x ==∑ 3)对总体~(,)X U a b 5 511511,,1,...,5 (,,)()0i i i i a x b i f x x f x b a ==?≤≤=?==-??? ∏∏ ,其他 4)对总体~(,1) X N μ ()() ()2 55 55/2 22 1511 1 1 (,,)()=2exp 2i x i i i i i f x x f x x μπμ-- -===??==-- ??? ∑∏
2 为了研究玻璃产品在集装箱托运过程中的损坏情况,现随机抽取20个集装箱检查其产品损坏的件数,记录结果为:1,1,1,1,2,0,0,1,3,1,0,0,2,4,0,3,1,4,0,2,写出样本频率分布、经验分布函数并画出图形. 解 设(=0,1,2,3,4)i i 代表各箱检查中抽到的产品损坏件数,由题意可统计出如下的样本频率分布表1.1: 经验分布函数的定义式为: ()()() (1)10,(),,=1,2,,1,1,n k k k x x k F x x x x k n n x x +??≤<-??≥?? , 据此得出样本分布函数: 200,00.3,010.65,12()0.8, 230.9,341,4x x x F x x x x ?≤ ?≤ ≤?≤ ≥? 图1.1 经验分布函数 x () n F x
统计学常用分布及其分位数
§1.4 常用的分布及其分位数 1. 卡平方分布 卡平方分布、t 分布及F 分布都是由正态分布所导出的分布,它们与正态分布一起,是试验统计中常用的分布。 当X 1、X 2、…、Xn 相互独立且都服从N(0,1)时,Z=∑i i X 2 的 分布称为自由度等于n 的2χ分布,记作Z ~2χ(n),它的分 布密度 p(z )=???????>??? ??Γ--,,00,2212122其他z e x n z n n 式中的??? ??Γ2n =u d e u u n ?∞+--012,称为Gamma 函数,且()1Γ=1, ?? ? ??Γ21=π。2χ分布是非对称分布,具有可加性,即当Y 与Z 相互独立,且Y ~2χ(n ),Z ~2χ(m ),则Y+Z ~2χ(n+m )。 证明: 先令X 1、X 2、…、X n 、X n+1、X n+2、…、 X n+m 相互独立且都服从N(0,1),再根据2χ分布的定义以及上述随机变量的相互独立性,令 Y=X 21+X 22+…+X 2n ,Z=X 21+n +X 22+n +…+X 2m n +, Y+Z= X 21+X 22+…+X 2n + X 21+n +X 22+n +…+X 2m n +, 即可得到Y+Z ~2χ(n +m )。 2. t 分布 若X 与Y 相互独立,且 X ~N(0,1),Y ~2χ(n ),则Z =n Y X 的分布称为自由度等于n 的t 分布,记作Z ~ t (n ),它的分布密度 P(z)=)()(221n n n ΓΓ+2121+-???? ??+n n z 。 请注意:t 分布的分布密度也是偶函数,且当n>30时,t
概率统计习题 5.2
习题与解答5.2 1. 以下是某工厂通过抽样调查得到的10名工人一周内生产的产品数 149 156 160 138 149 153 153 169 156 156 试由这批数据构造经验分布函数并作图. 解 此样本容量为10,经排序可得有序样本: (1)(2)(3)(4)(5)(6)(7)(8)(9)(10)138,149,153,156,160,169 x x x x x x x x x x ========== 其经验分布函数及其图形分别如下 ()01380.11490.31530.51560.81600.91691n x F ?≤ ?≤=≤?≤ ≤? ≥?,x , , 138x ,, 149x ,, 153x ,, 156x ,, 160x ,, x 169. 2. 下表是经过整理后得到的分组样本: 试写出此分组样本的经验分布函数. 解 样本的经验分布函数为
()037.50.1547.50.3557.50.7567.50.977.51n x x F ?≤ ?≤<=?≤ ?≤ ≥?,, , 37.5x ,, 47.5x , , 57.5x , , 67.5x ,, x 77.5. 3.假若某地区30名2000年某专业毕业生实习满后的月薪数据如下: 909 1086 1120 999 1320 1091 1071 1081 1130 1336 967 1572 825 914 992 1232 950 775 1203 1025 1096 808 1224 1044 871 1164 971 950 866 738 (1)构造该批数据的频率分布表(分6组); (2)画出直方图. 解 此处数据最大观测值为1572,最小观测值为738,故组距近似为 1572736 140,6 d -= = 确定每组区间端点为 ,此处可取 ,于是分组区间为 (](](](](](]735.875875101510151155115512951295143514351575 .,,,,,,,,,, 其频数频率分布表如下:
标准正态分布的密度函数
正态分布 第二章 第七节 一、标准正态分布的密度函数 二、标准正态分布的概率计算 三、一般正态分布的密度函数 四、正态分布的概率计算 幻灯片2 正态分布的重要性正态分布是概率论中最重要的分布, 这可以由 以下情形加以说明: ⑴正态分布是自然界及工程技术中最常见的分布 之一, 大量的随机现象都是服从或近似服从正态分布的. 可以证明, 如果一个随机指标受到诸多因素的影响, 但其中任何一个因素都不起决定性作用, 则该随机指标 一定服从或近似服从正态分布. 这些性质是其它 ⑵正态分布有许多良好的性质, 许多分布所不具备的. ⑶正态分布可以作为许多分布的近似分布. 幻灯片3 -标准正态分布 下面我们介绍一种最重要的正态分布 一、标准正态分布的密度函数 若连续型随机变量X的密度函数为 定义 则称X服从标准正态分布, 记为 标准正态分布是一种特别重要的 它的密度函数经常被使用, 分布。 幻灯片4 密度函数的验证 则有 (2)根据反常积分的运算有 可以推出 幻灯片5 标准正态分布的密度函数的性质
,X的密度函数为 则密度函数的性质为: 的图像称为标准正态(高斯)曲线。 幻灯片6 随机变量 由于 由图像可知,阴影面积为概率值。 对同一长度的区间 ,若这区间越靠近 其对应的曲边梯形面积越大。 标准正态分布的分布规律时“中间多,两头少”. 幻灯片7 二、标准正态分布的概率计算 1、分布函数 分布函数为 幻灯片8 2、标准正态分布表 书末附有标准正态分布函数数值表,有了它,可以解决标准正态分布的概率计算. 表中给的是x > 0时, Φ(x)的值. 幻灯片9 如果 由公式得 令 则 幻灯片10 例1 解 幻灯片11 由标准正态分布的查表计算可以求得, 当X~N(0,1)时, 这说明,X 的取值几乎全部集中在[-3,3]区间内,超出这个范围的可能性仅占不到0.3%. 幻灯片12 三、一般正态分布的密度函数 如果连续型随机变量X的密度函数为 (其中 为参数) 的正态分布,记为 则随机变量X服从参数为 所确定的曲线叫 作正态(高斯)曲线. 幻灯片13
第三-四章概率分布练习题
第三 - 四章 概率与离散变量的概率分布练习题 一、填空 1.用古典法计算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( )。 2.分布函数 F ( x) 和 P( x) 或 ( x) 的关系,就像向上累计频数和频率的关系一样。所不同的是, F ( x) 累计的是( )。 3.如果 A 和 B ( ),总有 P(A/B) = P 〔 B/A 〕= 0。 4.若事件 A 和事件 B 不能同时发生,则称 A 和 B 是( )事件。 4.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红 桃且爱司的概率是( 1/52 )。 二、单项选择 1.随机试验所有可能出现的结果,称为( D )。 A 基本事件; B 样本; C 全部事件; D 样本空间。 2.在次数分布中,频率是指( ) A. 各组的频率相互之比 B. 各组的分布次数相互之比 C.各组分布次数与频率之比 D.各组分布次数与总次数之比 3.以等可能性为基础的概率是( A )。 A 古典概率; B 经验概率; C 试验概率; D 主观概率。 4.古典概率的特点应为( A )。 A 基本事件是有限个,并且是等可能的; B 基本事件是无限个,并且是等可能的; C 基本事件是有限个,但可以是具有不同的可能性; D 基本事件是无限的,但可以是具有不同的可能性。 5.任一随机事件出现的概率为( D )。A 在–1 与 1之间; B 小于 0;C 不小于 1;D 在 0与1之间。 6.若 P ( A )= 0.2,P( B )= 0.6,P ( A/B )= 0.4,则 P( A B) =( D )。 A 0.8 B 0.08 C 0.12 D 0.24 。 7.若 A 与 B 是任意的两个事件,且 P ( AB )= P ( A )· P (B ),则可称事件 A 与B (C )。 A 等价 B 互不相容 C 相互独立 D 相互对立。 8.若相互独立的随机变量 X 和 Y 的标准差分别为 6 与 8,则( X +Y )的标准差为( B )。A 7 B 10 C 14 D 无法计算。 9.如果在事件 A 和 B 存在包含关系 A B 的同时,又存在两事件的反向包含关系 A B A 与事件 B ) ,则称事件 (A A 相等 B 互斥 C 对立 D 互相独立 10.二项分布的数学期望为( C )。A n(1-n)p B np(1- p) C np D n(1- p) 。 11.关于二项分布,下面不正确的描述是( A )。 A 它为连续型随机变量的分布; B 二项分布的数学期望 E(X)= = np ,变异数 D ( X ) = 2 = npq ; C 它的图形当 p = 0.5 时是对称的,当 p ≠ 0.5 时是非对称的,而当 n 愈大时非对称性愈不明显; D 二项分布只受成功事件概率 p 和试验次数 n 两个参数变化的影响。 12.事件 A 在一次试验中发生的概率为 1 , 则在 3 次独立重复试验中,事件 A 恰好发生 2 次的概率为 ( C ) 。 4 A 1 B 1 C 3 D 9 2 16 64 64 13.设随机变量 ξ~ B 6, 1 ,则 P(ξ= 3)的值为 ( A ) A. 5 B. 3 C. 5 D. 7 2 16 16 8 16 5 ,则 P( η≥1) = ( )A. 1 5 8 19 14.设随机变量 ξ~ B(2, p),随机变量 η ~ B(3, p),若 P(ξ≥ 1) =9 3 B.9 C. 27 D. 27 2 5 1 1 1 2 2 2 1 2 2 3 1 3 19 解析: ∵ P(ξ≥ 1) = 2p(1-p)+ p = 9, ∴p = 3 , ∴P(η≥ 1) = C 3 3 3 +C 3 3 3 + C 3 3 = 27,故选 D. 15.在 4 次独立重复试验中,随机事件 A 恰好发生 1 次的概率不大于其恰好发生 2 次的概率,则事件 A 在一次试验中 发生的概率 p 的取值范围是 ( A ) A .[0.4,1) B . (0,0.6] C . (0,0.4] D . [0.6,1)
标准正态分布函数表
函数: 函数的定义通常分为传统定义和近代定义,函数的两个定义本质是相同的,只是叙述概念的出发点不同,传统定义是从运动变化的观点出发,而近代定义是从集合、映射的观点出发。 标准正态分布: 标准正态分布,是一个在数学、物理及工程等领域都非常重要的概率分布,在统计学的许多方面有着重大的影响力。期望值μ=0,即曲线图象对称轴为Y轴,标准差σ=1条件下的正态分布,记为N(0,1)。 定义: 标准正态分布又称为u分布,是以0为均数、以1为标准差的正态分布,记为N(0,1)。 标准正态分布曲线下面积分布规律是:在-1.96~+1.96范围内曲线下的面积等于0.9500,在-2.58~+2.58范围内曲线下面积为0.9900。统计学家还制定了一张统计用表(自由度为∞时),借助该表就可以估计出某些特殊u1和u2值范围内的曲线下面积。 正态分布的概率密度函数曲线呈钟形,因此人们又经常称之为钟形曲线。我们通常所说的标准正态分布是位置参数均数为0, 尺度参数:标准差为1的正态分布(见下图中绿色曲线)。 特点: 密度函数关于平均值对称 平均值与它的众数(statistical mode)以及中位数(median)
同一数值。 函数曲线下68.268949%的面积在平均数左右的一个标准差范围内。 95.449974%的面积在平均数左右两个标准差的范围内。 99.730020%的面积在平均数左右三个标准差的范围内。 99.993666%的面积在平均数左右四个标准差的范围内。 函数曲线的反曲点(inflection point)为离平均数一个标准差距离的位置。 标准偏差: 深蓝色区域是距平均值小于一个标准差之内的数值范围。在正态分布中,此范围所占比率为全部数值之68%,根据正态分布,两个标准差之内的比率合起来为95%;三个标准差之内的比率合起来为99%。 在实际应用上,常考虑一组数据具有近似于正态分布的概率分布。若其假设正确,则约68.3%数值分布在距离平均值有1个标准差之内的范围,约95.4%数值分布在距离平均值有2个标准差之内的范围,以及约99.7%数值分布在距离平均值有3个标准差之内的范围。称为“68-95-99.7法则”或“经验法则”。