经验分布函数和理论分布函数

经验分布函数和理论分布函数
经验分布函数和理论分布函数

第2章 随机变量及其分布习题解答

第二章 随机变量及其分布 1、解: 设公司赔付金额为X ,则X 的可能值为; 投保一年内因意外死亡:20万,概率为0.0002 投保一年内因其他原因死亡:5万,概率为0.0010 投保一年内没有死亡:0,概率为1-0.0002-0.0010=0.9988 所以X 2、一袋中有5X 表示取出的三只球中的最大号码,写出随机变量X 的分布律 解:X 可以取值3,4,5,分布律为 10 61)4,3,2,1,5()5(1031)3,2,1,4()4(10 11)2,1,3()3(35 2 435 2 335 2 2=?= === ?==== ?= ==C C P X P C C P X P C C P X P 中任取两球再在号一球为中任取两球再在号一球为号两球为号一球为 也可列为下表 X : 3, 4,5 P :10 6, 103,101 3、设在15只同类型零件中有2只是次品,在其中取三次,每次任取一只,作不放回抽样,以X 表示取出次品的只数,(1)求X 的分布律,(2)画出分布律的图形。 解:任取三只,其中新含次品个数X 可能为0,1,2个。 35 22 )0(315313= ==C C X P 3512)1(3 15213 12=?==C C C X P 35 1)2(3 15 113 22= ?= =C C C X P 再列为下表 X : 0, 1, 2 P : 35 1, 3512,3522 4、进行重复独立实验,设每次成功的概率为p ,失败的概率为q =1-p (0

经验分布函数及其应用

经验分布函数及其应用 经验分布函数定义 定义:设12n x x x ?,,,是总体(离散型、或连续型,分布函数F(x)未知)的n 个独立观测值,按大小顺序可排成12***n x x x ≤≤?≤。若1**k k x x x +<<,则不超过x 的观测值的频率为函数,就等于在n 次重复独立试验中事件{}x ξ≤的频率。 ()110,=,,1,2,,1 1,k k n n x x k x x x k n n x x x F * **+*?≤??<≤=-??>? *?…… 我们称此函数()n F x 为总体的经验分布函数或样本分布函数。 简单性质: 1.对于每一组观测值1,2,i i x i ξ*=*=,……,n ,()n F x *单调,非降,左连 续且在1,2,i x x i =*=,……,n 点有间断点,在每个点的跳跃值都是1 n 。 2.显然 ()01n F x ≤≤,具有分布函数的其他性质。 3.()n F x *为样本1 2n x x x ?,,,的函数,是一统计量,即为一随机变量,由于1 2n x x x ?,,,相互独立且有相同的分布函数()F x ,

因而它等价于n 次独立重复试验的伯努利概型中事件{}x ξ≤发生k 次其余n k -次不发生的额概率,即有: {}{}()()1()k n k k k n n k P F x C F x F x n -??==-??? ? 4.格列汶科定理 设总体ξ的分布函数为()F x ,经验分布函数为 ()n F x *,对于任何实数 x ,记 ()()sup n x n F x F x D -∞<<*+∞=- 则有lim 01n n P D →∞????==?????? 其中n D 也为一统计量用来衡量()n F x *与()F x 之间在所有的x 的值上 的最大差异程度,格列汶科定理证明了统计量n D 以概率为1地收敛于0,也就是如下所要说的经验分布函数的收敛性问题。 经验分布函数的收敛性 经验分布函数在统计中有着非常重要的作用, 是理论分布函数与实际数据间的桥梁, 本科教材中已经指出, 当样本容量足够大时, 经验分布函数依概率收敛于总体分布函数,所以, 统计推断才得以以样本为依据, 而得到合理的结果。而事实上, 经验分布函数与总体分布函数还有更进一步的收敛关系, 下简单介绍之

(完整版)数据分析(梅长林)第1章习题答案

第1章 习 题 一、习题1.1 解:(1)利用题目中的数据,通过SAS 系统proc univariate 过程计算得到: 139.0=x 7.06387S = 49.898312=S 0.142众数= 51.0g 1-= 08192.5=CV 126129.0g 2-=由得到的数据特征可知道,偏度为负,所以呈做偏态, 峰度为负,所以均值两侧的极端值较少。 (2) 139.0=M 31.0=R 0.135Q 1= 5.144Q 3= 5.9R 131=-=Q Q 375.1394 1 2141M 31=++= ∧ Q M Q (3) 通过SAS 系统proc capability 得到直方图,并拟合正态分布曲线:

(4) 通过SAS 系统proc univariate 可以画出茎叶图,从茎叶图可以看出数据大致呈对称分布,由于所给数据都是整数,所以叶所代表的小位数都是0。 (5) 通过SAS 系统proc univariate 过程计算得到: 0.971571W 0= 00()H p P W W =≤= 0.1741 取0.05=α,因α>=0.1742p ,故不能拒绝0H ,认为样本来自正态总体分布。 通过画QQ图和经验分布曲线和理论分布函数曲线,从图中可以看出QQ图近似的在一条直线上,经验分布曲线的拟合程度也相当好,所以可以进一步说明此样本来自正态总体分布。

二、习题1.2 7.8574027=x 1.62568785 S = 2.642860982=S 0.13721437g 1= 20.6898884=CV -1.4238025g 2= 由得到的数据特征可知道,偏度为正,所以呈右偏态,峰度为负,所以均值两侧的极端值较少。 (2)

《概率论与数理统计》习题随机变量及其分布

第二章 随机变量及其分布 一. 填空题 1. 设随机变量X ~B(2, p), Y ~B(3, p), 若P(X ≥ 1) =9 5 , 则P(Y ≥ 1) = _________. 解. 9 4951)1(1)0(=-=≥-==X P X P 94)1(2 = -p , 3 1=p 2. 已知随机变量X 只能取-1, 0, 1, 2四个数值, 其相应的概率依次为c c c c 162 , 85,43,21, 则c = ______. 解. 2,16321628543211==+++= c c c c c c 3. 用随机变量X 的分布函数F(x)表示下述概率: P(X ≤ a) = ________. P(X = a) = ________. P(X > a) = ________. P(x 1 < X ≤ x 2) = ________. 解. P(X ≤ a) = F(a) P(X = a) = P(X ≤ a)-P(X < a) = F(a)-F(a -0) P(X > a) = 1-F(a) P(x 1 < X ≤ x 2) = F(x 2)-F(x 1) 4. 设k 在(0, 5)上服从均匀分布, 则02442 =+++k kx x 有实根的概率为_____. 解. k 的分布密度为??? ??=0 51 )(k f 其它50≤≤k P{02442 =+++k kx x 有实根} = P{03216162 ≥--k k } = P{k ≤-1或k ≥ 2} =5 3 515 2=?dk 5. 已知2}{,}{k b k Y P k a k X P =-== =(k = 1, 2, 3), X 与Y 独立, 则a = ____, b = ____, 联合概率分布_____, Z = X + Y 的概率分布为_____. 解. 116,132==++ a a a a . 49 36 ,194= =++b b b b (X, Y)

正态分布的数学期望与方差

正态分布的数学期望与方差 正态分布: 密度函数为:分布函数为 的分布称为正态分布,记为N(a, σ2). 密度函数为: 或者 称为n元正态分布。其中B是n阶正定对称矩阵,a是任意实值行向量。 称N(0,1)的正态分布为标准正态分布。 (1)验证是概率函数(正值且积分为1) (2)基本性质: (3)二元正态分布: 其中, 二元正态分布的边际分布仍是正态分布: 二元正态分布的条件分布仍是正态分布:

即(其均值是x的线性函数) 其中r可证明是二元正态分布的相关系数。 (4)矩,对标准正态随机变量,有 (5)正态分布的特征函数 多元正态分布 (1)验证其符合概率函数要求(应用B为正定矩阵,L为非奇异阵,然后进行向量线性变换) (2)n元正态分布结论 a) 其特征函数为: b) 的任一子向量,m≤n 也服从正态分布,分布为其中,为保留B 的第,…行及列所得的m阶矩阵。 表明:多元正态分布的边际分布还是正态分布 c) a,B分别是随机向量的数学期望及协方差矩阵,即 表明:n元正态分布由它的前面二阶矩完全确定 d) 相互独立的充要条件是它们两两不相关 e) 若,为的子向量,其中是,的协方差矩阵,则是,相应分量的协方差构成的相互协方差矩阵。则相互独立的充要条件为=0 f) 服从n元正态分布N(a,b)的充要条件是它的任何一个线性组合服

从一元正态分布 表明:可以通过一元分布来研究多元正态分布 g) 服从n元正态分布N(a,b),C为任意的m×n阶矩阵,则服从m元正态分布 表明:正态变量在线性变换下还是正态变量,这个性质简称正态变量的线性变换不变性 推论:服从n元正态分布N(a,b),则存在一个正交变化U,使得是一个具有独立正态分布分量的随机向量,他的数学期望为Ua,而他的方差分量是B的特征值。 条件分布 若服从n元正态分布N(a,b),,则在给定下,的分布还是正态分布,其条件数学期望: (称为关于的回归) 其条件方差为: (与无关)

二维随机变量及其分布题目

一、单项选择题 1.设随机变量21,X X 独立,且2 1 }1{}0{= ===i i X P X P (2,1=i ),那么下列结论正确的是 ( ) A .21X X = B .1}{21==X X P C .2 1 }{21= =X X P D .以上都不正确 2设X 与Y 相互独立,X 服从参数为12的0—1分布,Y 服从参数为1 3 的0—1分布,则方程 220t Xt Y ++=中t 有相同实根的概率为 (A ) 13 (B )12 (C )16 (D )2 3 [] 3.设二维随机变量(X ,Y )的概率密度为 ()22 ,02,14, (,)0, .k x y x y f x y ?+<<<

实验五 经验分布函数图形的绘制与演示

实验六 经验分布函数图形的绘制与演示 6.1 实验原理 设()F x 是总体X 的分布函数,12,,,n X X X "是来自总体X 的简单随机样本.对任意一个实数x ,定义函数 #()(),i n X x F x x n ≤=?∞<<∞. (6.1) 其中#()i X x ≤表示样本分量12,,,n X X X "中小于或等于x 的个数,或者说,()n F x 是事件“X x ≤”发生的频率.易见)(x F n 满足分布函数的性质(单增、有界、右连续等),故)(x F n 为一分布函数,称)(x F n 为总体X 的经验分布函数.由格列汶科定理知 lim sup ()()0 1.n n x P F x F x →∞?∞<<∞???==???? 该定理说明)(x F n 在整个实数轴上以概率1均匀收敛于()F x .当样本容量n 充分大时,经验分布函数)(x F n 可以作为总体分布函数()F x 的一个良好的近似,这是数理统计学中以样本推断总体的理论依据. 当给定样本值1212(,,,)(,,,)n n X X X x x x =""时,若将12,,,n x x x "从小到大排序:(1)(2)()n x x x ≤≤≤",得到有序样本)()2()1(,,,n x x x ",由定义(6.1)知,)(x F n 的形式为 (1)()(1)()0,,(),,1,2,,1,1,. n k k n x x k F x x x x k n n x x +??" (6.2) 这就是根据样本观测值得到的经验分布函数的具体形式. 6.2 实验目的及要求 理解经验分布函数的构成,经验分布函数是样本的函数,随着样本观测值的变化而变化,通过实验学习经验分布函数图形的绘制方法和动态演示过程.具体要求为 1. 任意产生一组随机样本,对该样本从小到大排序; 2. 利用排序后的样本作经验分布函数图形; 3. 让样本动态变化,观察相应的经验分布函数图形的变化,写出实验体会.

第二章__随机变量及其概率分布_考试模拟题答案

第二章 随机变量及其概率分布 考试模拟题 (共90分) 一.选择题(每题2分共20分) 1.F(X)是随机变量X 的分布函数,则下列结论不正确的是( B ) A.≤0F(x )1≤ B.F(x )=P{X=x } C.F(x )=P{X x ≤} D.F(∞+)=1, F(∞-)=0 解析: A,C,D 都是对于分布函数的正确结论,请记住正确结论!B 是错误的。 2.设随机变量X 的分布函数律为如下表格:F(x)为其分布函数,则F(5)=( C ) A.0.3 B.0.5 C.0.6 D.0.4 解析:由分布函数定义F(5)=P{X ≤5}=P{X=0}+P{X=2}+P{X=4}=0.1+0.2+0.3=0.6 3.下列函数可以作为随机变量分布函数的是( D ) 4x 01≤≤x 2x 10<≤x A.F(x)= B.F(x)= 1 其它 2 其它 -1 x<0 0 x<0 C.F(x)= 2x 10<≤x D.F(x)= 2x 5.00<≤x 1 其它 1 x ≥0.5 解析:由分布函数F(x)性质:01)(≤≤x F ,A,B,C 都不满足这个性质,选D 4 x 31<<-x 4.设X 的密度函数为f(x)= 则P{-2

A. 0 B.83 C. 43 D. 85 解析:P{-2

分布函数

分布函数 分布函数(Cumulative Distribution Function, CDF)是概率统计中重要的函数,正是通过它,可用数学分析的方法来研究随机变量。 1.伯努利分布 伯努利分布(Bernoulli distribution)又叫做两点分布或者0-1分布,是一个离散型概率分布,若伯努利实验成功,则伯努利随机变量取值为1,如果失败,则伯努利随机变量取值为0。并记成功的概率为p,那么失败的概率就是1p -,则数学期望为p,方差为(1) p p -,概率密度函数为 2.二项分布 二项分布即重复n次独立的伯努利试验。在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为1时,二项分布服从0-1分布。假设每次试验的成功概率为p,则二项分布的密度函数为: 二项分布函数的数学期望为np,方差为(1) np p -,记为~(,) X B n p。概率密度分布图如下所示。 3.正态分布 正态分布(Normal distribution)又名高斯分布(Gaussian distribution),若随机变量X服从一个数学期望为μ、标准方差为σ2的高斯分布,记为:X~N(μ,σ2),则其概率密度函数为 正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。通常所说的标准正态分布是μ = 0,σ = 1的正态分布。 分布曲线特征: 图形特征 集中性:正态曲线的高峰位于正中央,即均数所在的位置。 对称性:正态曲线以均数为中心,左右对称,曲线两端永远不与横轴相交。 均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降。 曲线与横轴间的面积总等于1,相当于概率密度函数的函数从正无穷到负无穷积分的概率为1。即频率的总和为100%。

第二章随机变量与分布函数习题

第二章:随机变量与分布函数习题 一、“离散型随机变量与分布函数”习题: 1. 射手对靶子进行射击,用X 表示击中的环数,已知击中一环的概率为0.2,击中两环的概率为0.8;求:(1)X 的分布列及分布函数;(2)()()10,1≤<≥X P X P . 2. 射手对靶子进行射击,一次射击的命中率为0.8,现在连续射击三枪,用X 表示三枪中命中的次数,求:(1)X 的分布列及分布函数;(2)A “至少命中两枪”的概率. 3. 设随机变量X 的分布函数为 ()()???? ???≥<≤<≤--<=≤=31 318.0114.010 x x x x x X P x F 求:X 的分布列. 4. 设随机变量X 的分布函数为 ()??? ? ????? >≤≤<=2120sin 00ππx x x A x x F 求:(1)A =? (2)??? ??<6πx P . 5. 设随机变量X 的分布列为??? ? ??--22121101q q ; 求: (1)q=? (2)X 的分布函数. 6. 某设备由三个独立工作的元件构成,该设备在一次试验中每个元件发生故障的概率为 0.1,求该设备在一次试验在中发生故障的元件数的分布列. 7. 将一颗骰子投掷两次,以X 表示两次所得点数之和、Y 表示两次中所得的小的点数;分别求X 与Y 的分布列. 8. 设随机变量X ~()p B ,2, 随机变量Y ~()p B ,3; 已知()9 5 1=≥X P , 求:()1≥Y P . 二、“连续型随机变量与分布函数”习题: 1. 设()()??? ??<>≥=-00 0,0212 x a x e a x x f a x ; ()?????<<=其他0 0cos 21 2 πx x x f ; ()????? <<-=其他0 22cos 3ππx x x f ; (1) 以上()()()x f x f x f 321,,是否是某随机变量X 的分布密度函数?

正态分布的概率密度、分布函数、数学期望与方差

13 正态分布的概率密度、分布函数、数学期望与方差 一、设随机变量X 服从正态分布)2,1(2N ,求(1))8.56.1(<≤-X P ;(2))56.4(≥X P . 解:(1) )4.22 1 3.1()8.416.2()8.56.1(<-≤ -=<-≤-=<≤-X P X P X P 8950 .09032.019918.0)]3.1(1[)4.2()3.1()4.2(1,01,01,01,0=+-=--=--=ΦΦΦΦ (2) )78.12 1 78.2(1)56.4(1)56.4(<-< --=<-=≥X P X P X P )]78.2(1)78.1(1)]78.2()78.1([11,01,01,01,0ΦΦΦΦ-+-=---= .0402.09973.09625.02=-- 二、已知某种机械零件的直径X (mm )服从正态分布)6.0,100(2N .规定直径在2.1100±(mm ) 之间为合格品,求这种机械零件的不合格品率. 解:设p 表示这种机械零件的不合格品率,则)2.1100(1)2.1100(≤--=>-=X P X P p . 而)26 .0100 2()6.02.16.01006.02.1( )2.1100(≤-≤-=≤-≤-=≤-X P X P X P 1)2(2)]2(1[)2()2()2(-Φ=Φ--Φ=-Φ-Φ= 9544.019772.02=-?= 故0456.09544.01=-=p . 三、测量到某一目标的距离时发生的误差X (m)具有概率密度 3200 )20(22401)(-- = x e x f π 求在三次测量中至少有一次误差的绝对值不超过30m 的概率. 解:三次测量中每次误差绝对值都超过30米可表为 }30{}30{}30{>?>?>=ξξξD 第三次第二次第一次 因为)40,20(~2 N ξ,所以由事件的相互独立性,有 31,01,033)]25 .0(1)25.1([})3030{(})30{()(ΦΦ-+-=>+-<=>=ξξP ξP D P 13025.05069.0)8944.05987.02(3 3 ≈=--= 于是有 86975.013025.01)(1}30{=-=-=