概率论与数理统计课本_百度文库

概率论与数理统计课本_百度文库
概率论与数理统计课本_百度文库

第二章随机变量及其分布第一节随机变量及其分布函数

一、随机变量

随机试验的结果是事件,就“事件”这一概念而言,它是定性的。要定量地研究随机现象,事件的数量化是一个基本前提。很自然的想法是,既然试验的所有可能的结果是知道的,我们就可以对每一个结果赋予一个相应的值,在结果(本事件)数值之间建立起一定的对应关系,从而对一个随机试验进行定量的描述。

例2-1 将一枚硬币掷一次,观察出现正面H、反面T的情况。这一试验有两个结果:“出现H”或“出现T”。为了便于研究,我们将每一个结果用一个实数来代表。比如,用数“1”代表“出现H”,用数“0”代表“出现T”。这样,当我们讨论试验结果时,就可以简单地说成结果是1或0。建立这种数量化的关系,实际上就相当于引入一个变量X,对于试验的两个结果,将X的值分别规定为1或0。如果与样本空间 { } {H,T}联系起来,那么,对于样本空间的不同元素,变量X可以取不同的值。因此,X是定义在样本空间上的函数,具体地说是

1,当 H

X X( )

0,当 T

由于试验结果的出现是随机的,因而X(ω)的取值也是随机的,为此我们称

X( )X(ω)为随机变量。

例2-2 在一批灯泡中任意取一只,测试它的寿命。这一试验的结果(寿命)本身就是用数值描述的。我们以X记灯泡的寿命,它的取值由试验的结果所确定,随着试验结果的不同而取不同的值,X是定义在样本空间 {t|t 0}上的函数

X X(t) t,t

因此X也是一个随机变量。一般地有

定义2-1 设 为一个随机试验的样本空间,如果对于 中的每一个元素 ,都有一个实数X( )与之相对应,则称X为随机变量。

一旦定义了随机变量X后,就可以用它来描述事件。通常,对于任意实数集合L,X在

L上的取值,记为{X L},它表示事件{ |X( ) L},即

{X L} { |X( ) L}

例2-3 将一枚硬币掷三次,观察出现正、反面的情况。设X为“正面出现”的次数,则X是一个随机变量。显然,X的取值为0,1,2,3。X的取值与样本点之间的对应关系如表2-1所示。

表2-1

表2-1

从上表中可以看出,事件{X=0}={TTT},{X=1}={HTT,THT,TTH},{X=2}={HHT,HTH,THH},{X=3}={HHH},由古典概型的概率计算公式得

P{X=0}=1/8,P{X=0}=1/8,P{X=1}=3/8,P{X=3}=1/8。

例2-4 设一袋中共有4个白球5个黑球,随机地摸出4球,用X表示摸出的 4球中“白球的数目”,则X是一个随机变量。显然X的取值为0,1,2,3,4,而且{X≤3}表示摸出的4球中“最多有3个白球”的事件,{X>31}表示摸出的4球中“白球数大于3”的事件,此时当然有{X>3}={X=4}。因此有P{X≤3}=1-P{X>3}=1-

P{X=4}

404= 1C4C5/C9=125/126。

由此可见,在随机试验中引入随机变量,对随机事件的研究就可以转化为对随机变量的研究。随机变量在试验前只能知道它的取值范围,但不能预言它取什么值,它随试验结果的不同而取不同的值;随机变量取某些值或某一区间都表示随机事件,因而具有确定的概率。

二、分布函数

设X是一个随机变量,对于任一实数X,相应事件“{X≤x}”的概率P{X≤x}是存在的。只要给出P{X≤x}的值,就可以由此计算出X在任意区间(a,b)的概率

P{a

{a

而且{X≤a}{X≤b}

(2-1)由概率的性质知P{a

的分布函数的概念。

定义2-2 设X是一个随机变量,x是任意实数,函数由此可见,概率P{X≤x}成为计算任何我们感兴趣的概率的基础。为此我们引入随机变量

F(x)=P{X≤x},

称为随机变量X的分布函数。

由上述定义及(2-1)式立即得到 (-∞

P{a

特别需要强调的是,分布函数的概念看起来很抽象,实际上它却有明确的概率意义。分布函数F(x)是一种概率:对于任一实数x,{X≤x}是一个随机事件,而分布函数F(x)正是这一事件的概率。换言之,F(x)表示X落入区间(-∞,x]这一事件的概率。

分布在函数F(x)具有以下性质:

(1)单调性:当a≤b,则F(a)≤F(b);

(2)有界性:0≤F(x)≤1;

(3)F(-∞)=limF(x)=0,F(+∞)=limF(x)=1; x→-∞x→+∞

(4)F(x+0)=F(x),即F(x)是右连续的。

0 X x

图2-1

性质(1)与性质(2)显然成立,性质(4)的证明从略,性质(3)我们不作严格证明,只从几何上加以说明。在图2-1中,若将区间(-∞,x]的端点x沿数轴无限向左移动(即x→-∞)时,则“随机变量X落入在x左边”这一事件趋于不可能事件,从而其概率趋于0,即F(-∞)=0;又若将区间(-∞,x]的端点x沿数轴无限向右移动(即x→+∞),则“随机变量X落入在x左边”这一事件趋于必然事件,从而其概率趋于1,即F(+∞)=1。有了分布函数,关于随机变量X的许多概率都能方便算出。比如

P{X=a}=F(a)-F(a-0)

P{X

P{X>a}=1-F(a)

P{X≥a}=1-F(a-0)

综上所述,分布函数是一种分析性质良好的函数,便于处理,而且给定了分布函数就能算出各种事件的概率。因此引进分布函数使许多概率问题得于简化并且归结为函数的计算,这样就能利用数学分析的许多结果,这是引进随机变量的好处之一。

第二节离散型随机变量

随机变量按其取值情况分为两种类型:如果随机变量所有可能的取值为有限个或可列多个,则称它为离散型随机变量;否则称它为非离散型随机变量。在非离散型随机变量中最常见是连续型随机变量。

一、分布律

研究随机变量的变化规律,不仅要知道它所有可能的取值,更重要的是掌握它取每个值的概率。例如,若随机变量X为某射手打靶命中的环数,X的所有可能取值为0,1,2,…,

10。可是任何一个射手都可能取得这些值,如果我们还知道命中各环的概率

p0,p1,p2, ,p10,那么就能全面地了解该射手的射击水平。一般地我们有

定义2-3 设离散型随机变量X所有可能的取值为x1,x2, ,而且X取各值的概率为p{X=xi}=pi,

则称(2-4)式为X的分布律或概率分布。

分布律也可以用表格的形式表示如下:

i=1,2, (2-4)

由概率的基本性质知道,任一个离散型随机变量X的分布律具有下列基本性质:(1)非负性:Pk≥0,k=1,2,

(2)规范性:∑pk=1

k=1

另外,由定义2-2可知,离散型随机变量X的分布函数

F(x)=P{X≤x}=

xk≤x

∑P(X=x

k

)

(2.5)

例2-5 将一枚硬币掷三次,设X为正面出现的次数,求X的分布律及其分布函数解由于X的取值为0,1,2,3,因此X为一个离散随机变量。由例2-3知 X 的分布律为

显然,X的分布满足分布律的两个基本性质。由(2-5)式得X的分布函数

?0,?1/8,??

F(x)=?1/8+3/8+3/8,

?1/8+3/8+3/8,???1/8+3/8+3/8+1/8,

x<00≤x<11≤x<2 2≤x<3x≥3

?0,

?1/8,??

F(x)=?4/8,

?7/8,???1,

x<00≤x<11≤x<2 2≤x<3x≥3

图2-2

从图形2-2可以看出,函数F(x)是一个单调、有界、右连续的跳跃函数,x

=0,1,2,3为函数的跳跃点,其跃度为随机变量X取该点值的概率。

例2-6 一战士连续地向一目标射击,每次射中目标的概率都是p,设X为首次命中目标所需的射击次数,求X的分布律。

解因为X可能的取值为1,2,…,所以X是一个离散型随机变量。记Ai为第i 次击

中目标的事件,由于各次射击是相互独立地进行,因此有

P{X=1}=P(A1)=p

P{X=2}P(1,2)=(1-p)p

P(X=k)=P(12 k-1Ak)=(1-p)k-1p

从而知X的分布律为

P{X=k}=qk-1p,

其中q=1-p。 k=1,2,

这个分布称为几何分布。容易验证,几何分布满足分布律的两个基本性质。

总之,求离散型随机变量分布律,首先要找出它的一切可能的取值,然后计算出相应的概率。

二、常用的离散型分布

下面我们介绍最常用的几种离散型分布。

(1)两点分布

如果离散型随机变量X的分布律为

其中0

显然,两点分布满足分布律的两个基本性质。

贝努里试验的分布律服从两点分布。比如,掷一枚硬币出现正面的次数;从一批产品中任取一件产品的次品数;一次射击命中目标的次数等等,都服从两点分布。

(2)二项分布

如果离散型随机变量X的分布律

kkn-kP{X=k}=Cnpq, k=0,1, ,n

其中0

显然,P{X=k}≥0,k=0,1, ,而且

∑P{X=k}=∑C

k=0k=0nnknpkqn-k=1

因此二项分布满足分布律的两个基本性质。

特别,当n=1时二项分布化为

P{X=k}=pkq1-k, k=0,1

这就是两点分布。可见,两点分布是二项分布的特例。

比如,重复掷一枚硬币n次,出现正面的次数;n重贝努里试验的分布律服从二项分布。

从一批产品中有放回地抽取n次(每次任取一件),抽得产品的次品数;n次射击命中目标

的次数等等,都服从二项分布。

(3)泊松(Poisson)分布如果离散型随机变量X的分布律

P{X=k}=

λk

k!

e-λ,

k=0,1,2,

其中λ>0,则称X服从参数为λ的泊松分布,记为X~p(λ)。

显然,P{X=k}≥0,k=0,1,2, ,而且

∑P{X=k}=∑

k=0

k=0

∞∞

λk

k!

e

-

=1

因此泊松分布满足分布律的两个基本性质。

泊松分布是一种重要的分布。实践证明,在工业,农业,医学及公共事业中,许多随机变量都服从泊松分布。比如,铸件表面的气孔数、电镀件表面的缺陷数、布匹上的疵点数、一段时间里纺纱机上的纱线的断头数等都服从泊松分布。此外,放射性物质在一段时间内放射的粒子数、电话交换台在一定时间内接到电话的呼叫数、公共汽车站上一段时间内来到的乘客批数也服从泊松分布。

例2-7 对上海一公汽车站的容流进行调查,统计了某天上午10 : 30至10 : 47左右每隔20秒钟来到的乘客批数(每批可能有数人同时来到),共得230个记录。这里分别计算了来到0批、1批、2批、3批、4批及4批以上乘客的记录次数,结果列于表2-2中,其相应的频率与λ=0.87的泊松分布符合得很好。

表2-2

三、二项分布与泊松分布的关系

虽然泊松分布本身是一种非常重要的分布,但有趣的是,历史上它却是作为二项分布的近似在1837年由法国数学家泊松(Poisson)引入的。

例2-8 某保险公司发现索赔要求中有5%是因被盗而提出的。现在知道1989年中,该公司共收到10个索赔要求,试求其中包含5个或5个以上被盗索赔的概率。

记X为10个索赔中所包含的被盗索赔的个数,容易知道,X服从二项分布

b(10,0.05)。对所求概率,可以使用计算器来完成,但这里我们关心的问题是,应该用怎

样的泊松分布来作它的近似计算?也就是说,应如何决定它的参数λ?

下面介绍一个有名的定理。

定理2-1(泊松定理)在贝努里试验中,用pn表示事件A在试验中出现的概率,它与试验的次数有关。如果npn→λ,则当n→∞时,有

limCpq

n→∞

knknn-kn

=

λk

k!

e-λ

(2-6)

证记λln=npn,qn=1-p,则

kkn-k

limCnpnqnn→∞

n(n-1) (n-k+1)?λn??λn?

= ? 1-?

k!n??n??

kn-k

n

-k

1??2??k-1??λn??λn?

= 1-? 1-? 1-? 1-? 1-? k!?n??n??n??n??n?对于任意固定的k,当n→∞时

k

limλkn=λ n→∞

λkn?

k?λ?

lim 1-n?=e-λ n→∞n??

n

12k-1lim(1-)(1-) (1-)=1 n→∞nnn

?λ?

lim 1-n?n→∞n??

因此有

k

n

kn

n-kn

-k

=1

limCpq

n→∞

=

λk

k!

e-λ

因此,当n很大,且p很小时,由(2-6)式得下列近似公式

Cpq

其中np≈λ。

kn

kn-k

λk

k!

e-λ

实验证明,当n≥10,且p≤0.1时,按泊松分布计算的结果与按二项分布计算的结果很接近。

在例2-8中的随机变量X~b(10,0.05),因此应取λ≈10?0.05=0.5,用p(0.5)来近似b(10,0.05),从图2-3中可以看出两者的近似程度,而且所求概率

P{X≥5}=1-∑P{X=k}。易算出,二项分布及

k=0

4

其泊松分布的近似值分别为0.000064和0.000172,两者误差几乎等于0.0001。图

2-3

第三节连续型随机变量

一、连续型随机变量

离散型随机变量的取值是有限个或可列多个;而连续型随机变量将取值于整个实数轴或某个区间。两者虽然都是随机变量,但在处理方法及某些性质方面,它们之间确实存在较大的差异。

例2-9 一个靶子是半径为2米的圆盘,设击中靶子任一同心圆盘上的点的概率与该圆盘的面积成正比,并设射击都能中靶,以X表示弹着点与圆心的距离,试求随机变量X的分布函数。

解若x<0,则P{X≤x}=0,于是

F(x)=P{X≤x}=0

2若0≤x≤2,由题意,P{0≤X≤x}=kx,k是一个常数。为了确定k的值,取x=2,有P{0≤X≤2}=k22,但已知P{0≤X≤2},故得k=1/4,即P{0≤X≤2}=x2/4,于是

F(x)=P{X≤x}=P{X<0}+P{0≤X≤x}=x2/4

若x≥2时,由题意{X≤x}是一个必然事件,于是

F(x)=P{X≤x}=1

综上所述,即得X的分布函数为

x<0?0,?F(x)=?x2/4,0≤x<2

?1,x≥2?

另外,容易看出上例中的分布函数F(x),对任意x可以写成形式

F(x)=?f(t)dt -∞x

其中

?x/2,f(x)=??0,0≤x≤2其它

这就是说,F(x)正好是非负可积函数f(x)在区间(-∞,x]上的积分,在这种情况我们称X为连续型随机变量。下面我们给出连续性随机变量的精确定义。

定义2-4 设F(x)为随机变量X的分布函数,若存在非负可积函数f(x),使对于任意实数x

xF(x)=?-∞f(t)dt (2-7)

则称X为连续型随机变量,其中函数f(x)称为X的概率密度函数,简称密度函数。由上述定义知道,连续型随机变量的分布函数F(x)是连续函数,概率密度函数f(x)具有下列性质:

(1)非负性:f(x)≥0;

(2)规范性:?∞

-∞f(x)dx=F(∞)=1;

(3)P{x1

x1f(x)dx;

(4)若f(x)在点x处连续,则F'(x)=f(x)。

性质(2)表明,介于曲线y=f(x)与x轴之间的面积等于1,如图2-4所示。性质(3)表明,X落在区间(x1,x2)的概率P{x1

图2-4 图2-5

应该指出的是,对于任意指定的实数x0,由于

P{X=x0}≤{x0-?x

x0-?xf(x)dx

0≤P{X=x0}≤lim?

所以x0?x→0x0-?xf(x)dx=0

P{X=x0}=0

这表明,连续型随机变量X取任意个别值x0的概率为零。因此在计算概率时,不必区分区间是开区间还是闭区间,即

P{x1

=P{x1

在这里,事件P{X=x0}并非不可能事件,而P{X=x0}=0。就是说,不可能事件的概率等于零,但概率等于零的事件未必是不可能事件。

例2-10 设连续型随机变量X的密度函数

?Ae-3x,x≥0 f(x)=?x<0?0,

(1)确定常数A;(2)求概率P{X>0.1};(3)求X的分布函数。解(1)由密度函数的规范性得

∞0∞?-∞f(x)dx=?0dx+?Ae-3x

dx=-∞0A=1 3

故A=3,A=3,于是X的密度函数为

?3e-3x,x≥0 f(x)=?x<0?0,

(2)P{X>0.1}=?∞

0.13e-3xdx=e-0.3≈0.7408。

(3)当x<0时,F(x)=

当x≥00时,F(x)=?x-∞f(x)dx=?0dx=0。 -∞x?x

-∞

0f(x)dx x

0=f?0dx+?3e-3xdx=1-e-3x。 -∞

故有

?1-e-3x,F(x)=??0,

二、常用的连续型分布x≥0 x<0

下面我们介绍几种重要的连续型分布。

(1)均匀分布

设连续随机变量X具有密度函数

?1,a≤x≤b? f(x)=?b-a?其它?0,

则称X在[a,b]上服从均匀分布,记为X~U[a,b]。

在区间[a,b]上服从均匀分布的随机变量XX,具有下述意义的等可能性,即它落在区间[a,b]中任意等长度的子区间内的可能性相等,或者说它落在子区间内的概率只依赖于区间的长度而与子区间的位置无关。事实上,对于长度l的子区间[c,c+1],a≤c≤c+1

P{c≤X≤c+l}=?c+l

cf(x)dx=?c+lc1ldx= b-ab-a

设X~U[a,b],由均匀分布的定义得X的分布函数为

?0,?x-a?F(x)=?,b-a???1,

f(x)及F(x)的图形分别如图2-6,2-7所示。

xb

图2-6 图2-7

例2-11 设电阻R是一个随机变量,它均匀地分布在900欧—1100欧,求R的概率密度及R落在950欧~1050欧的概率。

解按题意,R的密度函数为

1?,?f(x)=?1100-900?0,?

从而有 a

P{950≤R≤1050}=?

(2)指数分布

设连续随机变量X具有密度函数 10509501=0.5 1100-900

?λe-λx,x≥0 f(x)=?x<0?0,

其中λ>0,则称X服从参数为λ的指数分布,记为X~E(λ)。

容易求得,指数分布的分布函数为

?1-e-λx,x≥0, F(x)=?0,x<0?

指数分布在实践中有许多应用。有许多种“寿命”分布,如无线电元件的寿命,电话的通话时间,随机的服务时间以及动物的寿命都近似地服从指数分布。(3)正态分布

设连续随机变量X具有密度函数

?(x-μ)2?f(x)=exp?-?,22σ2πσ??1-∞

2其中μ,σ(σ>0)为常数,则称X服从参数为μ,σ的正态分布,记为X~N(μ,σ)可以证明,正态分布的密度函数曲线具有下列特征:

①关于X=μ左右对称;

②当x=μ时,取得最大值f(μ)=1

2πσ

③在x=μ±σ处有拐点,且在(μ-σ,μ+σ)凸弧;在(-∞,μ-σ)与(μ+σ,∞)凹弧。

④以x轴为渐近线。

因此,f(x)是一条“中间高,两边低,左右对称”的钟形曲线。

正态分布的分布函数为;

?(t-μ)2?F(x)=exp?-?dt,2?-∞2σ?2?1x-∞

f(x)、F(x)的图形分别如图2-8、图2-9所示。

特别当μ=0,σ=1时,称X服从标准正态分布,其密度函数与分布函数分别用

图2-8 图2-9 Φ(x),Φ(x)表示,即

φ(x)=2??x2??exp?-?,2π????1-∞

定理2-1

证因为?t2?φ(x)=exp?-?dt,?-∞2?2? φ(-x)=1-φ(x) 1x-∞

?t2?φ(-x)=exp?-?dt?-∞2π?2?1-x(令t=-u) ?u2? =-exp?-?du ?+∞2π?2?1x ?u2? =exp?-?du ?+∞π?2?1x

=1

2π?

1+∞x?u2?exp?-?du ?2?x

所以?u2?=1-?-?du=1-φ(x) ?-∞2π?2?Φ(-x)=1-Φ(x)。

2定理2-2 若X~N(μ,σ),则

Y=

证因为Y的分布函数 X-μσ~N(0,1) (2-10)

?X-μ?F(x)=P{Y≤x}=P?≤x?=P{X≤μ+σx}

?σ?

=

令12?μ+σx-∞?(t-u)2?exp?-dt 2?2σ??t-μ

σ=u,得

u2

F(x)=exp{-du=φ(x) ?-∞22π1x

所以

Y=X-μ

σ~N(0,1)

于是,若X~N(μ,σ2),则X的分布函数

?X-μx-μ??x-μ?F(x)=P{X≤x}=P?≤=φ ??σσσ????

?X-μ?F(x)=φ ?(2-11) σ??

从而对任意区间[x1,x2]有(2-11)

P{x1≤X≤x2}=F(x2)-F(x1)

?x-μ??x1-μ?=φ 2?-φ ? σσ????

为了方便计算,人们编制了正态分布表。当x>0时,Φ(x)的值可以直接从表查到;当x<0时,Φ(x)的值可以由(2-9)式得到;对一般的正态分布函数的值可以通过(2-11)式算出。

对于标准正态分布,我们引入上α分位点定义。设X~N(0,1),若Z.满足

P{X>Z.}=α,0<α<1

则称点Z.为标准正态分布上α分位点。如图2-10所示。例如

Z0.025=1.96,Z0.001=3.10

注意Φ(Z.)=1-α。

例2-12 若X~N(2,0.5),则 2

P{1

?2.5-2??1-2?=φ ?-φ ??0.5??0.5?

=φ(1)-φ(-2)

=φ(1)-[1-φ(2)]

=0.8413-1+0.9772

=0.8185

例2-13 若X~N(μ,σ),则对任意整数k,有 2

P{μ-kσ

图2-10

特别图2-11

P{μ-σ

=2×0.8413-1=0.6826

P{μ-2σ

=2×0.9772-1=0.9544

p{μ-3σ

=2×0.99865-1=0.9973

这表明,如果X~N(μ,σ2),那么X的取值落入区间{μ-3σ

例2-14 设某机器生产的螺栓的长度X(cm)服从正态分布N(10.5,0.04),并规定螺栓的长度在范围(10.3, 10.8)内为合格品,求螺栓的合格率。

解螺栓的合格率为

P{10.3≤X≤10.8}

?10.8-10.5??10.3-10.5?=Φ ?-Φ ? 0.20.2????

=Φ(1.5)-Φ-1

=Φ(1.5)+Φ(1)-1

=0.9332+0.8413-1

=0.7745

正态分布是所有分布中最重要的一种分布,这有实践与理论两方面的原因。实践方面的原因在于其常见性,如产品的长度、宽度、高度、质量指标;人体的身高、体重;测量的误差等,都近似地服从正态分布。事实上如果影响某一随机变量的因素很多,而每一个因素都不起决定性作用,且这些影响是可以迭加的,那么这一随机变量就近似的服从正态分布,这就是概率论中有名的中心极限定理。从理论方面来说,正态分布可以导出一些其它的分布,而某些分布在一定条件下又可以用正态分布来近似。因此正态分布不仅在实践中有广泛的应用,而且在理论研究也具有重要的地位。

第四节多维随机变量

上面讨论的只是一个随机变量的情况。在许多实际问题中,

随机试验的结果同时需要两

个或两个以上的随机变量来描述。例如,炮弹命中的位置需要用一对随机变量:横坐标X与纵坐标Y来描述;正弦交流电压需要用振幅X1、频率X2、相位X3三个随机变量来描述等等。一般地,如果X1,X2, ,Xn都是定义在同一个样本空间Ω上的n个随机变量,则把这n个随机变量的整体

(X1,X2, ,Xn)

称为n维随机变量或n维随机向量。

需要强调的是,多维随机变量的性质不仅与各个随机变量有关,而且还依赖于它们之间的相互关系。因此,逐个研究各个随机变量的性质是不够的,还需要将它们作为一个整体来进行研究。

由于二维随机变量比较容易理解与表达,因此我们主要讨论二维随机变量。设(X,Y)是一个二维随机变量,x,y是任意二个实数,二元函数

F(x,y)=P{X≤x} (Y≤y)=P{X≤x,Y≤y}

称为(X,Y)的(联合)分布函数。(2-12)

需要强调的是,与一维随机变量的分布函数类似,分布函数F(x,y)的值恰好是(X,Y)取值于区域{-∞

联合分布函数具有下列性质:

(1)单调性:若x1≤x2,则F(x1,y)≤F(x2,y),若y1≤y2,则F(x,y1)≤F(x,y2);(2)有界性:0≤F(x,y)≤1;

(3)F(-∞,y)=0,F(x,-∞)=0,F(-∞,-∞)=0,F(+∞,+∞)=1;

(4)F(x+0,y)=F(x,y),F(x,y+0)=F(x,y)即F(x,y)关于x与y右连续。在给定了联合分布函数之后,就可以求出(X,Y)落在任一个区域的概率。特别对区域

{x1

P{x1

=F(x2,y2)-F(x2,y1)-F(x1,y2)+F(x1,y1)

图2-12 图2-13

(X,Y)作为一个整体,具有联合分布函数F(x,y),而X与Y作为单个的随机变量也分别有他们的分布函数,分别记为FX(x)、FY(y),依次称FX(x)、FY(y)关于X 和Y的边缘分布函数。

由(X,Y)的联合分布函数F(x,y),可以得到关于X与Y的边缘分布函数。事实上,由于{Y<+∞}是必然事件,故

{X≤x}={X≤x} {Y<+∞}={X≤x,Y<+∞}

于是

FX(x)=P{X≤x}=P{X≤x,Y<+∞}=F(x,++∞)

FX(x)=F(x,+∞)

同理

(2-13)(2-14)

FY(y)=F(+∞,y)

二维随机变量有离散型与连续型之分。如果二维随机变量的所有可能的取值是有限组或可列无限组,则称它为离散型二维随机变量,否则称它为非离散型二维随机变量。在非离散型二维随机变量中最常见的是连续型二维随机变量。

一、离散型二维随机变量

与离散型一维随机变量一样,要描述离散型二维随机变量的分布,我们不仅关心它所有可能的取值,而且更关心这些取值的概率。设(X,Y)为离散型二维随机变量,如果它所有可能的取值为(xi,yi),i,j=1,2, ,且

P{X=xi,Y=yi}=Pij,

有时也将(X,Y)的联合分布律写成表:

i,j=1,2, ,

(2-15)

则称(2-15)式为(X,Y)的联合分布律或联合概率分布。

易见,pij>0;

∑∑p

i=1j=1

ij

=1

记X与Y的各自分布律为

P{X=xi}=pi?,

i=1,2,

(2-16)(2-17)

P{X=xj}=p?j,

j=1,2,

则依次称(2-16)式与(2-17)式为(X,Y)关于X和关于Y的边缘分布律或边缘概率分布。由联合分布律可以导出边缘分布律。事实上根据概率的可加性得

pi.=P{X=xi}=P{X=xi,Ω}=P{X=xi, (Y=yj)}

j=1

?∞?

=P? (X=xi,Y=yj)?

?j=1?

= =

同理

∑P{(X=x,Y=y

i

j=1∞

j

)}

∑p

J=1

ij

,i=1,2,

p.j=∑pij,

i=1

j=1,2,

例2-15 设袋中有两只白球和三只黑球,分别采用放回摸球与不放回摸球两种方式,规定随机变量

?1,第一次摸到白球X=?

0,第一次摸到黑球?

表示。

?1,第二次摸到白球

X=?

0,第二次摸到黑球?

则用放回摸球与不放回摸球两种方式下(X,Y)的分布律与边缘分布,分别由表2-3和表2-4

表2-3

相关主题
相关文档
最新文档