第49讲 直方图和经验分布函数

§6.2直方图和箱线图

在数理统计中,我们常常用图形来直观地显示观察到的数据,以便对总体X的分布有一个

直观、粗略的了解。

四川大学徐小湛本节讲以下图形:

直方图

箱线图(自学)

经验分布函数及其图形

直方图(频率直方图)Histogram

百度传课

我们通过一个例子来说明直方图的作法。 25 19 39 72 49 58 65 75 68 66 61 78 51 60 45 74 73 77 29 16 90 12 64 61 40 57 40 46 81 51 52 58 73 70 87 33 49 61 83 41 52 46 38 77 63 75 61 45 51 62 51 59 66 68 97 53 54 70 54 54 38 50 83 50

最低分和最高分分别是 12 和 97

例1 设有64个学生的考试成绩如下:

四川大学 徐小湛

25 19 39 72 49 58 65 75 68 66 61 78 51 60 45百74度73传7课7

显得杂乱无章

29 16 90 12 64 61 40 57 40 46 81 51 52 58 73 70 87 33 49 61 83 41 52 46 38 77 63 75 61 45 51 62 51 59 66 68 97 53 54 70 54 54 38 50 83 50 四川大学 徐小湛 用Excel 作出数据的条形图(柱形图)(Bar Chart)

四川大学

用Excel将成绩排序:121619252933383839404041454546 464949505051515151525253545454 575858596061616161626364656666 686870707273737475757777788183

83 87 90 97

百度传课12161925 29 33 38 38 39 40 40 41 45454646 49 49 50 50 51 51 51 51 52525354 54 54 57 58 58 59 60 61 61616162 63 64 65 66 66 68 68 70 70727373 74 75 75 77 77 78 81 83 83 87 90 97

下面来分析各分数段得分的人数和频率

将分数分成9段

将区间(9.5, 99.5) 等分成9个子区间

每个区间长(99.5-9.5)/9=10

83 87 90 97

百度传课

分 组 频数 f i

9.5~19.5 3 19.5~29.5 2 29.5~39.5 4 39.5~49.5 9 49.5~59.5 16 59.5~69.5 13 69.5~79.5 11 79.5~89.5 4 89.5~99.5

2

12 16 19 25 29 33 38 38 39 40 40 41 45 45 46 46 49 49 50 50 51 51 51 51 52 52 53 54 54 54 57 58 58 59 60 61 61 61 61 62 63 64 65 66 66 68 68 70 70 72 73 73 74 75 75 77 77 78 81 83 将区间(9.5, 99.5) 等分成 9 个子区间每个区间长 10

3

2 4

9

11

频数直方图

16

13

4

2

百度传课四川大学徐小湛

9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5

百度传课

分组频数f

i 频率f

i

/64

9.5~19.530.0469 19.5~29.520.0313 29.5~39.540.0625 39.5~49.590.1406 49.5~59.5160.2500 59.5~69.5130.2031 69.5~79.5110.1719 79.5~89.540.0625 89.5~99.520.0313四川大学徐小湛

9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5

0.0469

0.0313

0.0625

0.1406

0.2500

0.2031

0.1719

频率直方图

0.0313

矩形面积之和

64 ( f i 9

∑ i =1 64 i i =1

9

?10) = 10 ∑ f 64 = 10 ? 64 = 10 0.0625

不满足规范性

百度传课四川大学徐小湛

分组频数f

i 频率f

i

/64矩形高f i /64/10

9.5~19.530.04690.0047 19.5~29.520.03130.0031 29.5~39.540.06250.0063 39.5~49.590.14060.0141 49.5~59.5160.25000.0250 59.5~69.5130.20310.0203 69.5~79.5110.17190.0172 79.5~89.540.06250.0063 89.5~99.520.03130.0031

0.0047

0.0031 0.0063

0.0141

0.0250

0.0203

0.0172

0.0063

0.0031

矩形面积之和

9 f

i

i=1

64?10

∑ 9

64 i

f

( ?10) = 1 ∑

i =1

1

64

=?64 =1

百度传课

满足规范性

频率直方图

Frequency

histogram

四川大学徐小湛

9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5

9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5 这几个直方图的形状是一样的,

区别只是纵坐标的刻度不一样。

百度传课

分组频数f

i 频率f

i

/64累积频率

9.5~19.530.04690.0469 19.5~29.520.03130.0781 29.5~39.540.06250.1406 39.5~49.590.14060.2813 49.5~59.5160.25000.5313 59.5~69.5130.20310.7344 69.5~79.5110.17190.9063 79.5~89.540.06250.9688 89.5~99.520.0313 1.0000

四川大学徐小湛

0.0469

0.1406

0.0781

0.2813

累积频率直方图

0.9688

1.0000

0.9063

0.7344

0.5313

9.5 19.5 29.5 39.5 49.5 59.5 69.5 79.5 89.5 99.5

Cumulative histogram Frequency histogram

12161925 29 33 38 38 3940 4041 45454646 49 49 50 50 5151 5151 52525354 54 54 57 58 5859 6061 61616162 63 64 65 66 6668 6870 70727373 74 75 75 77 7778 8183 83879097四川大学徐小湛如果不想分得太细,可考虑以下分组:将分数分成5 组:

很差、较差、中等、良好、优秀

组 限 分 组

频数 f i 频率 f i /64 矩形高

f i /64/组距

累积 频率 0~49.5 很差0~49分 18 0.281 0.0057 0.281 49.5~59.5 较差50~59分 16 0.250 0.0250 0.531 59.5~75.5 中等60~75分 21 0.328 0.0205 0.859 75.5~85.5 良好76~85分 6 0.094 0.0094 0.953 85.5~100

优秀86~100分

3 0.047

0.0032

1.000

12 16 19 25 29 33 38 38 39 40 40 41 45 百45度46传4课6

49 49 50 50 51 51 51 51 52 52 53 54 54 54 57 58

58 59 60 61 61 61 61 62 63 64 65 66 66 68 68 70 70 72 73 73 74 75 75 77 77 78 81 83 83 87 90 97

四川大学 徐小湛

0.0057

0.0250

0.0205

0.0094

0.0032

频率直方图

49.5 59.5

75.5 85.5

100

矩形面积之和

0.0057 ? 49.5 + 0.0250 ?10 + 0.0205?16 + 0.0049 ?10 + 0.0032 ?14.5 = 1

Frequency histogram

四川大学 徐小湛

第2章 随机变量及其分布习题解答

第二章 随机变量及其分布 1、解: 设公司赔付金额为X ,则X 的可能值为; 投保一年内因意外死亡:20万,概率为0.0002 投保一年内因其他原因死亡:5万,概率为0.0010 投保一年内没有死亡:0,概率为1-0.0002-0.0010=0.9988 所以X 2、一袋中有5X 表示取出的三只球中的最大号码,写出随机变量X 的分布律 解:X 可以取值3,4,5,分布律为 10 61)4,3,2,1,5()5(1031)3,2,1,4()4(10 11)2,1,3()3(35 2 435 2 335 2 2=?= === ?==== ?= ==C C P X P C C P X P C C P X P 中任取两球再在号一球为中任取两球再在号一球为号两球为号一球为 也可列为下表 X : 3, 4,5 P :10 6, 103,101 3、设在15只同类型零件中有2只是次品,在其中取三次,每次任取一只,作不放回抽样,以X 表示取出次品的只数,(1)求X 的分布律,(2)画出分布律的图形。 解:任取三只,其中新含次品个数X 可能为0,1,2个。 35 22 )0(315313= ==C C X P 3512)1(3 15213 12=?==C C C X P 35 1)2(3 15 113 22= ?= =C C C X P 再列为下表 X : 0, 1, 2 P : 35 1, 3512,3522 4、进行重复独立实验,设每次成功的概率为p ,失败的概率为q =1-p (0

经验分布函数及其应用

经验分布函数及其应用 经验分布函数定义 定义:设12n x x x ?,,,是总体(离散型、或连续型,分布函数F(x)未知)的n 个独立观测值,按大小顺序可排成12***n x x x ≤≤?≤。若1**k k x x x +<<,则不超过x 的观测值的频率为函数,就等于在n 次重复独立试验中事件{}x ξ≤的频率。 ()110,=,,1,2,,1 1,k k n n x x k x x x k n n x x x F * **+*?≤??<≤=-??>? *?…… 我们称此函数()n F x 为总体的经验分布函数或样本分布函数。 简单性质: 1.对于每一组观测值1,2,i i x i ξ*=*=,……,n ,()n F x *单调,非降,左连 续且在1,2,i x x i =*=,……,n 点有间断点,在每个点的跳跃值都是1 n 。 2.显然 ()01n F x ≤≤,具有分布函数的其他性质。 3.()n F x *为样本1 2n x x x ?,,,的函数,是一统计量,即为一随机变量,由于1 2n x x x ?,,,相互独立且有相同的分布函数()F x ,

因而它等价于n 次独立重复试验的伯努利概型中事件{}x ξ≤发生k 次其余n k -次不发生的额概率,即有: {}{}()()1()k n k k k n n k P F x C F x F x n -??==-??? ? 4.格列汶科定理 设总体ξ的分布函数为()F x ,经验分布函数为 ()n F x *,对于任何实数 x ,记 ()()sup n x n F x F x D -∞<<*+∞=- 则有lim 01n n P D →∞????==?????? 其中n D 也为一统计量用来衡量()n F x *与()F x 之间在所有的x 的值上 的最大差异程度,格列汶科定理证明了统计量n D 以概率为1地收敛于0,也就是如下所要说的经验分布函数的收敛性问题。 经验分布函数的收敛性 经验分布函数在统计中有着非常重要的作用, 是理论分布函数与实际数据间的桥梁, 本科教材中已经指出, 当样本容量足够大时, 经验分布函数依概率收敛于总体分布函数,所以, 统计推断才得以以样本为依据, 而得到合理的结果。而事实上, 经验分布函数与总体分布函数还有更进一步的收敛关系, 下简单介绍之

样本及抽样分布知识讲解

第六章 样本及抽样分布 【内容提要】 一、简单随机样本与统计量 1. 总体 用来表征某一随机试验的数量指标X ,其概率分布称为总体的分布。 2. 简单随机样本 在相同条件下,对总体X 进行n 次独立的重复观察,将所得结果12,,...,n X X X 称为从总体X 中抽取的容量为n 的简单随机样本,试验结束后,可得一组数值12,,...,n x x x ,称其为 12,,...,n X X X 的观察值。 注:若12,,...,n X X X 为总体X 的简单随机样本,则12,,...,n X X X 相互独立,且与总体X 同分布。 3. 统计量 设12,,...,n X X X 为总体X 的简单随机样本,12(,,...,)n T g X X X =为样本12,,...,n X X X 的实值函数,且不含任何未知参数,则称12(,,...,)n T g X X X =为一个统计量,将样本值12,,...,n x x x 代入后算出的函数值12(,,...,)n t g x x x =称为该统计量的值。 注:设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,则常用的统计量有: 4. 经验分布函数 设12,,...,n X X X 为总体X 的简单随机样本,12,,...,n x x x 为相应的样本值,将样本值 按由小到大的顺序重新编号12,1r x x x r n ***<

(完整版)数据分析(梅长林)第1章习题答案

第1章 习 题 一、习题1.1 解:(1)利用题目中的数据,通过SAS 系统proc univariate 过程计算得到: 139.0=x 7.06387S = 49.898312=S 0.142众数= 51.0g 1-= 08192.5=CV 126129.0g 2-=由得到的数据特征可知道,偏度为负,所以呈做偏态, 峰度为负,所以均值两侧的极端值较少。 (2) 139.0=M 31.0=R 0.135Q 1= 5.144Q 3= 5.9R 131=-=Q Q 375.1394 1 2141M 31=++= ∧ Q M Q (3) 通过SAS 系统proc capability 得到直方图,并拟合正态分布曲线:

(4) 通过SAS 系统proc univariate 可以画出茎叶图,从茎叶图可以看出数据大致呈对称分布,由于所给数据都是整数,所以叶所代表的小位数都是0。 (5) 通过SAS 系统proc univariate 过程计算得到: 0.971571W 0= 00()H p P W W =≤= 0.1741 取0.05=α,因α>=0.1742p ,故不能拒绝0H ,认为样本来自正态总体分布。 通过画QQ图和经验分布曲线和理论分布函数曲线,从图中可以看出QQ图近似的在一条直线上,经验分布曲线的拟合程度也相当好,所以可以进一步说明此样本来自正态总体分布。

二、习题1.2 7.8574027=x 1.62568785 S = 2.642860982=S 0.13721437g 1= 20.6898884=CV -1.4238025g 2= 由得到的数据特征可知道,偏度为正,所以呈右偏态,峰度为负,所以均值两侧的极端值较少。 (2)

《概率论与数理统计》习题随机变量及其分布

第二章 随机变量及其分布 一. 填空题 1. 设随机变量X ~B(2, p), Y ~B(3, p), 若P(X ≥ 1) =9 5 , 则P(Y ≥ 1) = _________. 解. 9 4951)1(1)0(=-=≥-==X P X P 94)1(2 = -p , 3 1=p 2. 已知随机变量X 只能取-1, 0, 1, 2四个数值, 其相应的概率依次为c c c c 162 , 85,43,21, 则c = ______. 解. 2,16321628543211==+++= c c c c c c 3. 用随机变量X 的分布函数F(x)表示下述概率: P(X ≤ a) = ________. P(X = a) = ________. P(X > a) = ________. P(x 1 < X ≤ x 2) = ________. 解. P(X ≤ a) = F(a) P(X = a) = P(X ≤ a)-P(X < a) = F(a)-F(a -0) P(X > a) = 1-F(a) P(x 1 < X ≤ x 2) = F(x 2)-F(x 1) 4. 设k 在(0, 5)上服从均匀分布, 则02442 =+++k kx x 有实根的概率为_____. 解. k 的分布密度为??? ??=0 51 )(k f 其它50≤≤k P{02442 =+++k kx x 有实根} = P{03216162 ≥--k k } = P{k ≤-1或k ≥ 2} =5 3 515 2=?dk 5. 已知2}{,}{k b k Y P k a k X P =-== =(k = 1, 2, 3), X 与Y 独立, 则a = ____, b = ____, 联合概率分布_____, Z = X + Y 的概率分布为_____. 解. 116,132==++ a a a a . 49 36 ,194= =++b b b b (X, Y)

样本及抽样分布

第六章样本及抽样分布 【基本要求】1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布——2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】4学时 【授课内容】 §6.0 前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性;而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 §6.1 随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几项数量指标X(可以是向量)和该数量指标X在总体的分布情况。在上述例子中X是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X的这样或那样的数值,因而这个数量指标X是一个随机变量(或向量),而X的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标X可能取值的全体组成的集合等同起来。 定义1:把研究对象的全体(通常为数量指标X可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X的分布的研究,所谓总体的分布也就是数量指标X的分布,因此,X的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体X。根据总体中所包括个体的总数,将总体分为:有限总体和无限总体。 例1:考察一块试验田中小麦穗的重量: X=所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

二维随机变量及其分布题目

一、单项选择题 1.设随机变量21,X X 独立,且2 1 }1{}0{= ===i i X P X P (2,1=i ),那么下列结论正确的是 ( ) A .21X X = B .1}{21==X X P C .2 1 }{21= =X X P D .以上都不正确 2设X 与Y 相互独立,X 服从参数为12的0—1分布,Y 服从参数为1 3 的0—1分布,则方程 220t Xt Y ++=中t 有相同实根的概率为 (A ) 13 (B )12 (C )16 (D )2 3 [] 3.设二维随机变量(X ,Y )的概率密度为 ()22 ,02,14, (,)0, .k x y x y f x y ?+<<<

实验五 经验分布函数图形的绘制与演示

实验六 经验分布函数图形的绘制与演示 6.1 实验原理 设()F x 是总体X 的分布函数,12,,,n X X X "是来自总体X 的简单随机样本.对任意一个实数x ,定义函数 #()(),i n X x F x x n ≤=?∞<<∞. (6.1) 其中#()i X x ≤表示样本分量12,,,n X X X "中小于或等于x 的个数,或者说,()n F x 是事件“X x ≤”发生的频率.易见)(x F n 满足分布函数的性质(单增、有界、右连续等),故)(x F n 为一分布函数,称)(x F n 为总体X 的经验分布函数.由格列汶科定理知 lim sup ()()0 1.n n x P F x F x →∞?∞<<∞???==???? 该定理说明)(x F n 在整个实数轴上以概率1均匀收敛于()F x .当样本容量n 充分大时,经验分布函数)(x F n 可以作为总体分布函数()F x 的一个良好的近似,这是数理统计学中以样本推断总体的理论依据. 当给定样本值1212(,,,)(,,,)n n X X X x x x =""时,若将12,,,n x x x "从小到大排序:(1)(2)()n x x x ≤≤≤",得到有序样本)()2()1(,,,n x x x ",由定义(6.1)知,)(x F n 的形式为 (1)()(1)()0,,(),,1,2,,1,1,. n k k n x x k F x x x x k n n x x +??" (6.2) 这就是根据样本观测值得到的经验分布函数的具体形式. 6.2 实验目的及要求 理解经验分布函数的构成,经验分布函数是样本的函数,随着样本观测值的变化而变化,通过实验学习经验分布函数图形的绘制方法和动态演示过程.具体要求为 1. 任意产生一组随机样本,对该样本从小到大排序; 2. 利用排序后的样本作经验分布函数图形; 3. 让样本动态变化,观察相应的经验分布函数图形的变化,写出实验体会.

第二章__随机变量及其概率分布_考试模拟题答案

第二章 随机变量及其概率分布 考试模拟题 (共90分) 一.选择题(每题2分共20分) 1.F(X)是随机变量X 的分布函数,则下列结论不正确的是( B ) A.≤0F(x )1≤ B.F(x )=P{X=x } C.F(x )=P{X x ≤} D.F(∞+)=1, F(∞-)=0 解析: A,C,D 都是对于分布函数的正确结论,请记住正确结论!B 是错误的。 2.设随机变量X 的分布函数律为如下表格:F(x)为其分布函数,则F(5)=( C ) A.0.3 B.0.5 C.0.6 D.0.4 解析:由分布函数定义F(5)=P{X ≤5}=P{X=0}+P{X=2}+P{X=4}=0.1+0.2+0.3=0.6 3.下列函数可以作为随机变量分布函数的是( D ) 4x 01≤≤x 2x 10<≤x A.F(x)= B.F(x)= 1 其它 2 其它 -1 x<0 0 x<0 C.F(x)= 2x 10<≤x D.F(x)= 2x 5.00<≤x 1 其它 1 x ≥0.5 解析:由分布函数F(x)性质:01)(≤≤x F ,A,B,C 都不满足这个性质,选D 4 x 31<<-x 4.设X 的密度函数为f(x)= 则P{-2

A. 0 B.83 C. 43 D. 85 解析:P{-2

第二章随机变量与分布函数习题

第二章:随机变量与分布函数习题 一、“离散型随机变量与分布函数”习题: 1. 射手对靶子进行射击,用X 表示击中的环数,已知击中一环的概率为0.2,击中两环的概率为0.8;求:(1)X 的分布列及分布函数;(2)()()10,1≤<≥X P X P . 2. 射手对靶子进行射击,一次射击的命中率为0.8,现在连续射击三枪,用X 表示三枪中命中的次数,求:(1)X 的分布列及分布函数;(2)A “至少命中两枪”的概率. 3. 设随机变量X 的分布函数为 ()()???? ???≥<≤<≤--<=≤=31 318.0114.010 x x x x x X P x F 求:X 的分布列. 4. 设随机变量X 的分布函数为 ()??? ? ????? >≤≤<=2120sin 00ππx x x A x x F 求:(1)A =? (2)??? ??<6πx P . 5. 设随机变量X 的分布列为??? ? ??--22121101q q ; 求: (1)q=? (2)X 的分布函数. 6. 某设备由三个独立工作的元件构成,该设备在一次试验中每个元件发生故障的概率为 0.1,求该设备在一次试验在中发生故障的元件数的分布列. 7. 将一颗骰子投掷两次,以X 表示两次所得点数之和、Y 表示两次中所得的小的点数;分别求X 与Y 的分布列. 8. 设随机变量X ~()p B ,2, 随机变量Y ~()p B ,3; 已知()9 5 1=≥X P , 求:()1≥Y P . 二、“连续型随机变量与分布函数”习题: 1. 设()()??? ??<>≥=-00 0,0212 x a x e a x x f a x ; ()?????<<=其他0 0cos 21 2 πx x x f ; ()????? <<-=其他0 22cos 3ππx x x f ; (1) 以上()()()x f x f x f 321,,是否是某随机变量X 的分布密度函数?

(完整版)样本及抽样分布.doc

第六章样本及抽样分布 【基本要求】 1、理解总体、个体和样本的概念; 2、理解样本均值、样本方差和样本矩的概念并会计算; 3、理解统计量的概念,掌握几种常用统计量的分布及其结论; 4、理解分位数的概念,会计算几种重要分布的分位数。 【本章重点】样本均值、样本方差和样本矩的计算;抽样分布—— 2 分布,t分布, F分布;分位数的理解和计算。 【本章难点】对样本、统计量及分位数概念的理解;样本矩的计算。 【学时分配】 4 学时 【授课内容】 §6.0前言 前面五章我们研究了概率论的基本内容,从中得知:概率论是研究随机现象统计规律性的一 门数学分支。它是从一个数学模型出发(比如随机变量的分布)去研究它的性质和统计规律性; 而我们下面将要研究的数理统计,也是研究大量随机现象的统计规律性,并且是应用十分广泛的 一门数学分支。所不同的是数理统计是以概率论为理论基础,利用观测随机现象所得到的数据来 选择、构造数学模型(即研究随机现象)。其研究方法是归纳法(部分到整体)。对研究对象的客观规律性做出种种合理性的估计、判断和预测,为决策者和决策行动提供理论依据和建议。数理 统计的内容很丰富,这里我们主要介绍数理统计的基本概念,重点研究参数估计和假设检验。 § 6.1随机样本 1

一、总体与样本 1.总体、个体 在数理统计学中,我们把所研究的全部元素组成的集合称为总体;而把组成总体的每个元素称为个体。 例如:在研究某批灯泡的平均寿命时,该批灯泡的全体就组成了总体,而其中每个灯泡就是 个体;在研究我校男大学生的身高和体重的分布情况时,该校的全体男大学生组成了总体,而每 个男大学生就是个体。 但对于具体问题,由于我们关心的不是每个个体的种种具体特性,而仅仅是它的某一项或几 项数量指标 X ( 可以是向量 ) 和该数量指标X在总体的分布情况。在上述例子中 X 是表示灯泡的寿命或男大学生的身高和体重。在试验中,抽取了若干个个体就观察到了X 的这样或那样的数值,因而这个数量指标X 是一个随机变量(或向量),而 X 的分布就完全描写了总体中我们所关心的那个数量指标的分布状况。由于我们关心的正是这个数量指标,因此我们以后就把总体和数量指标 X 可能取值的全体组成的集合等同起来。 定义 1:把研究对象的全体(通常为数量指标X 可能取值的全体组成的集合)称为总体;总体中的每个元素称为个体。 我们对总体的研究,就是对相应的随机变量X 的分布的研究,所谓总体的分布也就是数量指 标 X 的分布,因此, X 的分布函数和数字特征分别称为总体的分布函数和数字特征。今后将不区分总体与相应的随机变量,笼统称为总体 X 。根据总体中所包括个体的总数,将总体分为:有限总体 和无限总体。 例 1:考察一块试验田中小麦穗的重量: X =所有小麦穗重量的全体(无限总体);个体——每个麦穗重x 2

第三-四章 概率分布练习题

第三-四章 概率与离散变量的概率分布练习题 一、填空 1.用古典法计算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( )。 2.分布函数)(x F 和)(x P 或?)(x 的关系,就像向上累计频数和频率的关系一样。所不同的是,)(x F 累计的是( )。 3.如果A 和B ( ),总有P(A/B)=P 〔B/A 〕=0。 4.若事件A 和事件B 不能同时发生,则称A 和B 是( )事件。 4.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是(1/4 );在一副扑克牌中单独抽取一次,抽到一张红桃且爱司的概率是( 1/52 )。 二、单项选择 1.随机试验所有可能出现的结果,称为( D )。A 基本事件; B 样本;C 全部事件;D 样本空间。 2.在次数分布中,频率是指( ) A.各组的频率相互之比 B.各组的分布次数相互之比 C.各组分布次数与频率之比 D.各组分布次数与总次数之比 3.以等可能性为基础的概率是(A )。A 古典概率;B 经验概率;C 试验概率;D 主观概率。 4.古典概率的特点应为( A )。 A 基本事件是有限个,并且是等可能的; B 基本事件是无限个,并且是等可能的; C 基本事件是有限个,但可以是具有不同的可能性; D 基本事件是无限的,但可以是具有不同的可能性。 5.任一随机事件出现的概率为( D )。A 在–1与1之间;B 小于0;C 不小于1;D 在0与1之间。 6.若P (A )=0.2,P(B )=0.6,P (A/B )=0.4,则)(B A P =( D )。A 0.8 B 0.08 C 0.12 D 0.24。 7.若A 与B 是任意的两个事件,且P (AB )=P (A )·P (B ),则可称事件A 与B (C )。 A 等价 B 互不相容 C 相互独立 D 相互对立。 8.若相互独立的随机变量X 和Y 的标准差分别为6与8,则(X +Y )的标准差为(B )。A 7 B 10 C 14 D 无法计算。 9.如果在事件A 和B 存在包含关系A ?B 的同时,又存在两事件的反向包含关系A ?B ,则称事件A 与事件B (A )A 相等 B 互斥 C 对立 D 互相独立 10.二项分布的数学期望为(C )。A n(1-n)p B np(1- p) C np D n(1- p)。 11.关于二项分布,下面不正确的描述是(A )。 A 它为连续型随机变量的分布; B 二项分布的数学期望)(X E =μ=np ,变异数)(X D =2 σ=npq ; C 它的图形当p =0.5时是对称的,当p ≠ 0.5时是非对称的,而当n 愈大时非对称性愈不明显; D 二项分布只受成功事件概率p 和试验次数n 两个参数变化的影响。 12.事件A 在一次试验中发生的概率为 4 1 ,则在3次独立重复试验中,事件A 恰好发生2次的概率为(C )。 A 21 B 161 C 64 3 D 649 13.设随机变量ξ~B ????6,12,则P (ξ=3)的值为( A ) A.516 B.316 C.58 D.716 14.设随机变量ξ ~ B (2,p ),随机变量η ~ B (3,p ),若P (ξ ≥1) =59,则P (η≥1) =( )A.13 B.59 C.827 D.19 27 解析:∵P (ξ≥1) =2p (1-p )+p 2=59, ∴p =13 ,∴P (η≥1) =C 13????13????232+C 23????132????23+C 33????133=1927,故选D. 15.在4次独立重复试验中,随机事件A 恰好发生1次的概率不大于其恰好发生2次的概率,则事件A 在一次试验中发生的概率p 的取值范围是( A ) A .[0.4,1) B .(0,0.6] C .(0,0.4] D .[0.6,1)

样本与抽样分布

第六章样本与抽样分布 §6.1 数理统计的基本概念 一.数理统计研究的对象 例:有一批灯泡,要从使用寿命这个数量指标来看其质量,设寿命用X表示。 (1)若规定寿命低于1000小时的产品为次品。此问题是求P(X 1000)=F(10000),求F(x)? (2)从平均寿命、使用时数长短差异来看其质量,即求E(x)?、D(x)?。 要解决二个问题

1.试验设计抽样方法。 2.数据处理或统计推断。 方法具有“从局部推断总体”的特点。 二.总体(母体)和个体 1.所研究对象的全体称为总体,把组成总体的每一个对象成员(基本单元)称为个体。 说明: (1)对总体我们关心的是研究对象的某一项或某几项数量指标(或属性指标)以及他们在整体中的分布。所以总体是个体的数量指标的全体。 (2)为研究方便将总体与一个R.V X

对应(等同)。 a.总体中不同的数量指标的全体, 即是R.V.X的全部取值。 b.R.V X的分布即是总体的分布 情况。 例:一批产品是100个灯泡,经测试其寿命是: 1000小时1100小时 1200小时 20个30个50个 X 1000 1100 1200 P 20/100 30/100

50/100 (设X表示灯泡的寿命)可知R.V.X的分布律, 就是总体寿命的分布,反之亦然。 常称总体X,若R.VX~F(x),有时也用F(x)表示一个总体。 (3)我们对每一个研究对象可能要观测两个或多个数量指标,则可用多维随机向量(X,Y,Z, …)去描述总体。 2.总体的分类 有限总体 无限总体

三.简单随机样本. 1.定义6.1 :从总体中抽得的一部分个体组成的集合称为子样(样本),取得的个体叫样品,样本中样品的个数称为样本容量(也叫样本量)。每个样品的测试值叫观察值。 取得子样的过程叫抽样。 样本的双重含义: (1)随机性: 用(X 1,X 2, ……X n) n维随机向量表 示。 X i表示第i个被抽到的个体,是随机变量。(i=1,2,…n)

课后习题参考答案

习题一 1 设总体X 的样本容量5=n ,写出在下列4种情况下样本的联合概率分布. 1)),1(~p B X ; 2))(~λP X ; 3)],[~b a U X ; 4))1,(~μN X . 解 设总体的样本为12345,,,,X X X X X , 1)对总体~(1,)X B p , 11223344555 11 1 55(1) (,,,,)()(1)(1)i i n x x i i i i x x P X x X x X x X x X x P X x p p p p -==-========-=-∏∏ 其中:5 1 15i i x x ==∑ 2)对总体~()X P λ 11223344555 1 1 555 1 (,,,,)()! ! i x n i i i i i x i i P X x X x X x X x X x P X x e x e x λ λ λλ-==-========== ∏∏ ∏ 其中:5 1 15i i x x ==∑ 3)对总体~(,)X U a b 5 511511,,1,...,5 (,,)()0i i i i a x b i f x x f x b a ==?≤≤=?==-??? ∏∏ ,其他 4)对总体~(,1) X N μ ()() ()2 55 55/2 22 1511 1 1 (,,)()=2exp 2i x i i i i i f x x f x x μπμ-- -===??==-- ??? ∑∏

2 为了研究玻璃产品在集装箱托运过程中的损坏情况,现随机抽取20个集装箱检查其产品损坏的件数,记录结果为:1,1,1,1,2,0,0,1,3,1,0,0,2,4,0,3,1,4,0,2,写出样本频率分布、经验分布函数并画出图形. 解 设(=0,1,2,3,4)i i 代表各箱检查中抽到的产品损坏件数,由题意可统计出如下的样本频率分布表1.1: 经验分布函数的定义式为: ()()() (1)10,(),,=1,2,,1,1,n k k k x x k F x x x x k n n x x +

概率统计习题 5.2

习题与解答5.2 1. 以下是某工厂通过抽样调查得到的10名工人一周内生产的产品数 149 156 160 138 149 153 153 169 156 156 试由这批数据构造经验分布函数并作图. 解 此样本容量为10,经排序可得有序样本: (1)(2)(3)(4)(5)(6)(7)(8)(9)(10)138,149,153,156,160,169 x x x x x x x x x x ========== 其经验分布函数及其图形分别如下 ()01380.11490.31530.51560.81600.91691n x F

()037.50.1547.50.3557.50.7567.50.977.51n x x F

连续型随机变量的分布与例题讲解

连续型随机变量的分布 (一)连续型随机变量及其概率密度函数 1.定义:对于随机变量X 的分布函数 F(X) ,若存在非负函数f(x), 使对于 任意的实数 x,有F ( x)x f(x) 称为 X f (t)dt ,则称X为连续性随机变量, 的概率密度函数,简称概率密度。 注: F(x)表示曲线下x 左边的面积,曲线下的整个面积为1。 2 .密度函数f(x) 的性质:注: f( x)不是概率。 1) f( x)≥ 0 + f ( x) dx = 1 2) ò-x 2 3)P{x 1 < X ? x 2 }òx1 f (x) dx = F (x 2 ) - F (x 1 ) 特别地,连续型随机变量在某一点的概率为零,即 P{ X = x} = 0. (但 { X=x} 并不一定是不可能事件) 因此P(a≤X ≤ b)= P(a< X

第三-四章概率分布练习题

第三 - 四章 概率与离散变量的概率分布练习题 一、填空 1.用古典法计算概率.在应用上有两个缺点:①它只适用于有限样本点的情况;②它假设( )。 2.分布函数 F ( x) 和 P( x) 或 ( x) 的关系,就像向上累计频数和频率的关系一样。所不同的是, F ( x) 累计的是( )。 3.如果 A 和 B ( ),总有 P(A/B) = P 〔 B/A 〕= 0。 4.若事件 A 和事件 B 不能同时发生,则称 A 和 B 是( )事件。 4.在一副扑克牌中单独抽取一次,抽到一张红桃或爱司的概率是( 1/4 );在一副扑克牌中单独抽取一次,抽到一张红 桃且爱司的概率是( 1/52 )。 二、单项选择 1.随机试验所有可能出现的结果,称为( D )。 A 基本事件; B 样本; C 全部事件; D 样本空间。 2.在次数分布中,频率是指( ) A. 各组的频率相互之比 B. 各组的分布次数相互之比 C.各组分布次数与频率之比 D.各组分布次数与总次数之比 3.以等可能性为基础的概率是( A )。 A 古典概率; B 经验概率; C 试验概率; D 主观概率。 4.古典概率的特点应为( A )。 A 基本事件是有限个,并且是等可能的; B 基本事件是无限个,并且是等可能的; C 基本事件是有限个,但可以是具有不同的可能性; D 基本事件是无限的,但可以是具有不同的可能性。 5.任一随机事件出现的概率为( D )。A 在–1 与 1之间; B 小于 0;C 不小于 1;D 在 0与1之间。 6.若 P ( A )= 0.2,P( B )= 0.6,P ( A/B )= 0.4,则 P( A B) =( D )。 A 0.8 B 0.08 C 0.12 D 0.24 。 7.若 A 与 B 是任意的两个事件,且 P ( AB )= P ( A )· P (B ),则可称事件 A 与B (C )。 A 等价 B 互不相容 C 相互独立 D 相互对立。 8.若相互独立的随机变量 X 和 Y 的标准差分别为 6 与 8,则( X +Y )的标准差为( B )。A 7 B 10 C 14 D 无法计算。 9.如果在事件 A 和 B 存在包含关系 A B 的同时,又存在两事件的反向包含关系 A B A 与事件 B ) ,则称事件 (A A 相等 B 互斥 C 对立 D 互相独立 10.二项分布的数学期望为( C )。A n(1-n)p B np(1- p) C np D n(1- p) 。 11.关于二项分布,下面不正确的描述是( A )。 A 它为连续型随机变量的分布; B 二项分布的数学期望 E(X)= = np ,变异数 D ( X ) = 2 = npq ; C 它的图形当 p = 0.5 时是对称的,当 p ≠ 0.5 时是非对称的,而当 n 愈大时非对称性愈不明显; D 二项分布只受成功事件概率 p 和试验次数 n 两个参数变化的影响。 12.事件 A 在一次试验中发生的概率为 1 , 则在 3 次独立重复试验中,事件 A 恰好发生 2 次的概率为 ( C ) 。 4 A 1 B 1 C 3 D 9 2 16 64 64 13.设随机变量 ξ~ B 6, 1 ,则 P(ξ= 3)的值为 ( A ) A. 5 B. 3 C. 5 D. 7 2 16 16 8 16 5 ,则 P( η≥1) = ( )A. 1 5 8 19 14.设随机变量 ξ~ B(2, p),随机变量 η ~ B(3, p),若 P(ξ≥ 1) =9 3 B.9 C. 27 D. 27 2 5 1 1 1 2 2 2 1 2 2 3 1 3 19 解析: ∵ P(ξ≥ 1) = 2p(1-p)+ p = 9, ∴p = 3 , ∴P(η≥ 1) = C 3 3 3 +C 3 3 3 + C 3 3 = 27,故选 D. 15.在 4 次独立重复试验中,随机事件 A 恰好发生 1 次的概率不大于其恰好发生 2 次的概率,则事件 A 在一次试验中 发生的概率 p 的取值范围是 ( A ) A .[0.4,1) B . (0,0.6] C . (0,0.4] D . [0.6,1)

第二章 随机变量及其分布习题

第二章 随机变量及其分布习题 一 、填空题 1. 设随机变量ξ的分布律为N a K P = =)(ξ(K=1,2, N ),则常数=a 。 2. 盒内有5个零件,其中2件次品,从中任取3件,用ξ表示取出的次品数,则ξ的概率 分布为 。 3.设)(x F 是离散型随机变量的分布函数,若______)(==b P ξ,则 )()()(a F b F b a P -=<<ξ成立。 4.设离散型随机变量ξ的分布函数为 ? ?≥+<≤-<≤--<=2 2132 1110)(x b a x a x a x x F ,且2 1)2(= =ξP ,则___________________,______, 的分布律为ξ==b a 5. 设连续型随机变量ξ的概率密度为??? ??≤>=-0 0)(2x x ke x f x 则 ____)2(____,)2(____,)21(___,=<===≤<=ξξξP P P k 6. 设5个晶体管中有2个次品,3个正品,如果每次从中任取1个进行测试,测试后的产品不放回,直到把2个次品都找到为止,则需要进行的测试次数ξ是一个随机变量,则 ________)2(______,)5(=≤==ξξP P 7. 设随机变量ξ的概率密度为8 )1(2)(--=x ke x f (+∞<<∞-x ),则=k 。 8. 两个随机变量ηξ,相互独立的充要条件是______ 9. 设连续型随机变量ξ的概率密度为?? ?<≥=-0 )(x x e x f x ,则ξ的函数ξη=的概率密度________)(=y η? 10. 设随机变量ξ的概率密度为

?? ?>><<=其他 ) 0,0(,10)(k b x kx x f b , 且________________,,75.0)2 1 (===> b k P 则ξ 二 、选择题 1 .k k p x P 2 )(= =ξ)2,1( =k 为一随机变量ξ的分布律的必要条件是( ) (A )k x 非负 (B )k x 为整数 (C )20≤≤k p (D )2≥k p 2 . 若函数)(x f y =是一随机变量ξ的概率密度,则( )一定成立 (A ))(x f 的定义域为[0,1] (B ))(x f 的值域为[0,1] (C) )(x f 非负 (D) )(x f 在) ,(∞∞-内连续 3.如果)(x F 是( ),则)(x F 一定不可以是连续型随机变量的分布函数( ) (A )非负函数 (B )连续函数 (C )有界函数 (D )单调减少函数 4.下列函数中,( )可以作为连续型随机变量的分布函数 (A))(x F = ?? ?≥<0 1 0x x e x (B )G(x)= ?? ?≥<-0 1 0x x e x (C)=Φ)(x ???≥-<010 x e x x (D) H(x)= ???≥+<-0 100 x e x x 5 . 设)(ηξ, 的联合概率密度为??? ??≤+=其他 11 ),(22y x y x f π 则ηξ与为( )的随机变量 (A )独立同分布 (B )独立不同分布 (C )不独立同分布 (D )不独立也不同分布 三、计算题

相关文档
最新文档