第八讲 概率与统计模型

第八讲 概率与统计模型
第八讲 概率与统计模型

第八讲 概率与统计模型

一、

曲线拟合

所谓曲线拟合是指从自变量和因变量的实现点列中得到反映自变量和因变量的函数关系。如下图蓝色点表明的是某个函数关系式,现需要知道有如此曲线表现的函数。

曲线拟合可以视为函数求值的逆运算,函数求值在已知函数关系式时带入自变量的值就可以得到对应的因变量,而曲线拟合恰好相反。要注意的是曲线拟合在大多数情况下只能得到反映大致的函数关系的表达式,而不能得到精确的关系式。如已知某个地区的温度C 与一种植物的生长速度V 之间有线性的关系(设为b aC V +=),为了确定两者之间的确切关系时,需要知道两组实际数据2,1),,(=i v c i i ,这样通过求解线性方程组

??

?+=+=b ac v b

ac v 22

11 可以求出),(b a 的值。但是在实际问题中,由于测量的误差或者计算过程中的问题,给出来的数据可能不止两对,n i v c i i ,,2,1),,( =,这样如果还是将给出的数据带入方程中得到的是一个超定方程组,该方程组未必有解!从而就产生了如何确定系数的问题,曲线拟合方法就是解决这种问题的方法。

与曲线拟合相平行的另一个问题是插值问题,插值就是利用给出的一些数据作为提示,要得到一些未知点处的函数值。在这里我们将两个问题整合起来,因为在通过曲线拟合得到反映规律的曲线后将需要求值的点带入即可以得到函数值。

曲线拟合的基本方法如下: (1) 确定自变量与因变量,

(2) 确定自变量与因变量之间的函数关系类型(即自变量与因变量之间的粗略关系式,

含有参数)

(3) 选择合适的曲线拟合方法(其中使用最多的是最小二乘法) (4) 使用MATLAB 后者其他计算软件求解

最小二乘法简介

设自变量为x ,因变量为y ,给出的数据对一共有n 组n i y x i i ,,2,1),,( =,因变量和自变量之间的函数关系式为),,,(1m a a x f y =,其中m a a ,,1 为待定系数,为确定待定系数的值,利用下面的思想:待定系数的确定应当最大程度的反映所给出数据的真实性,因此待定系数的确定应当使得由函数关系式所得到的函数值与已知的数值之间的误差最小,即

])),,,((min[arg ),,(1

21**1

∑=-=n

k m k k m

a a x f y a a 。

在函数拟合中,最简单的拟合是线性拟合,即用一个最合适的直线来近似描述函数关系。但是要注意的是,用直线来描述函数关系的误差可能较大,因此在实践中应当先考察函数点列的分布,与一些已知函数的特征相比较,可以先考察一个函数族:如三角函数族,指数函数族等,通过不同函数族的拟合后比较拟合的效果,而选择其中的最合适的。

曲线拟合的一些技巧

在曲线拟合的过程中有几个关键的地方:一是确定自变量和因变量之间的函数关系类型,使用最多的是线性函数(确定线性函数的曲线拟合也称为线性拟合),在得到函数关系类型时可以先通过机理分析或者量纲分析、比例分析得到粗略的关系式,也可以先画出图形,考察图形的形状选择适当的函数作为拟合的目标;二是选择合适的拟合方法,常用的拟合方法是最小二乘法,但是往往有的时候需要采用其他方法,如多项式拟合等,拟合方法的选择以最适合(偏差最小为标准),可能会出现这样的情况函数的表现是分段的,此时可以先尝试用分段插值的方法考察函数的性质;三是在使用MATLAB 等工具求解时,注意可以先将需要拟合的函数化简,通常线性拟合是最准确并且速度是最快的,因此对于可以化为线性拟合的问题尽量用线性拟合的方法做;四是为了检验曲线拟合的有效性,可以在所给出的数据中预留几个数据,如给出50组数据,可以仅用其中的45个进行拟合,而将剩下的5个用于拟合曲线的检验。

曲线拟合举例:录像机计数器模型

在录像机计数器模型中,我们已经得到计数器读数n 与录像带转过的时间t 之间的函数关系为bn an t +=2

,其中b a ,为待定系数,为了确定这两个系数,可以用足够多的测试数

取其中的一部分数据进行拟合(184,40,20,0 =t ),而将余下的数据作为检验数据用,拟合得到2

6

1045.1,1061.2--?=?=b a ,检验发现拟合的效果相当好。

在得到了拟合函数关系式后,可以利用该关系式求任何计数器读数对应的录像时间。

二、

概率模型

概率模型一 报童问题

问题重述:报童每天清晨从报社购进报纸零售,晚上将没有卖掉的报纸退回。设报纸每份的购进价格为a ,零售价格为b ,退回价格为c 。报童应当如何确定每天购进报纸的数量以获得最大的收入?

模型分析:报童面临的问题是两个矛盾的进货方式:(1)进货太多,报纸不能完全卖出,将要赔钱;(2)进货太少,报纸不够卖,丧失了赚钱的机会。影响最终收入的两个因素:进货量n 与报纸的需求量r 。其中进货量是需要做出的决策变量,而需求量不是报童所能够控制的,是受到很多因素的影响(人流量、天气、行人对报纸的亲睐程度、其他报童的竞争),需求量是预先无法决定的,因此是一个不确定量,是一个随机变量。 模型建立与求解:

(1) 决策变量:进货量n ;

(2) 目标函数:收入G 与进货量之间的函数关系

??

?

≤---->-==n

r r n c b r b a n

r n b a n G G )

)(()()()( (3) 需求量的分布:假设需求量r 的分布函数为 ,2,1,0),()(===k k f k r P 。 (4) 优化模型:)(max n G 。但是注意到)(n G 是一个随机目标,因此求其最大值是没

有意义的,需要对优化目标函数进行修改。修改的结果应当使得目标函数的最大值有意义,最典型的是化为确定函数,与随机变量相对应的确定函数是该随机变量的数学期望(可以理解为平均收入)。因此优化目标函数用期望收入)(n G 代替。下面主要是要计算)(n G (注意到报纸的份数取值为整数):

∑∑∞

+==-+

----=1

)()()()])(()[()(n r n

r r nf b a r f r n c b r b a n G

该问题很难求解,为了求解的需要将上述函数进行连续化,注意到离散求和的连续化为积分形式:

??∞

+-+----=1

)()()()])(()[()(n n

dr r nf b a dr r f r n c b r b a n G

问题可以变形为)(max n G ,这是一个单变量无约束的函数最值问题,按照计算规则,由

0)(='n G 可以得到最终解

)()()()()()()()()()()()()(0

=-+--=-+-----='????∞

n

n

n

n

dr r f b a dr r f c b dr

r f b a n nf b a dr r f c b n nf b a n G

得到

c b b a dr

r f dr r f n

n

--=??∞

)()(0,即有c a b a dr r f n

--=?0

)(。 从该结果发现最佳的订货数可以由上式决定的分位数得到。

问题讨论:报童问题是一个订货销售问题的缩影,现实生活中的其他问题,如衣服销售问题等都可以用报童问题相同的方法解决。在衣服销售问题中,往往有折价销售的情况出现,可以考虑有折价销售情况下的最佳订货量问题。

比如某衣服零售商每个季度从批发商处进一批衣服进行销售(假设这些衣服的质地,使用季节完全相同),设每件衣服的购进价格为a ,零售价格为b ,在每个季度末,如果有未销售完的衣服,零售商将以价格c 进行折价销售,折价销售接受后的衣服将由批发商以价格d 回收。请确定零售商每个季度的进货数量以获得最大的收入?

概率模型二 轧钢中的浪费

问题重述:将粗大的钢坯制成合格的钢材需要两道工序:粗轧(热轧),形成刚才的雏形;精轧(冷轧),得到规定长度的成品材料。由于受到环境、技术等因素的影响,得到钢材的长度是随机的,大体上呈正态分布,其均值可以通过调整轧机设定,而均方差是由设备的精度决定,不能随意改变。如果粗轧后的钢材长度大于规定长度,精轧时要把多余的部分切除,造成浪费;而如果粗轧后的钢材长度小于规定长度,则造成整根钢材浪费。如何调整轧机使得最终的浪费最小。 模型假设:

(1) 成品材料的规定长度已知为l (2) 粗轧后的钢材长度的均方差为σ

(3) 粗轧后的钢材长度的均值m 可以通过调整轧机设定 (4) 粗轧后的钢材的长度服从正态分布),(2σm N

问题分析:精轧后的钢材长度记为X ,按照题意,),(~2σm N X 。在轧钢过程中产生的浪费由两种情况构成:若l X >,则浪费量为l X -;若l X <,则浪费量为X 。注意到当

m 很大时,l X >的可能性增加,浪费量同时增加;而当m 很小时,l X <的可能性增加,

浪费量也增加,因此需要确定一个合适的m 使得总的浪费量最小。

模型建立与求解: (1) 决策变量:m ; (2) 决策函数:总的浪费量。

关键在于总的浪费量的计算。按照概率论知识,X 的密度函数为

22)(21)(σσ

πm x e

x f --

=

总的平均浪费长度为(该式可以修正)

lp m l X lP X E dx x p l dx x xp dx x xp dx x p l x W l

l l

-=>-=-=

+-=????∞

+∞∞

-∞

-∞)()()()()()()(

其中)(

1)(σ

m

l l X P p -Φ-=>=,)(?Φ为标准正态分布的累计分布函数。

考察一下上式W 表示的含义:表示每粗轧一根钢材的平均浪费量,这是从最终的产量分析浪费量;但是从一个工厂自身的发展看,工厂追求的是效益,即生产一根成品钢材浪费的平均长度来衡量,因此需要把目标函数修改为

)

()

(l X P m W J >=。

因此总的目标函数变形为l m l m

p

lp

m J --Φ-=-=

)

(1σ

,决策目标为)(min m J 。

这是一个单变量的无约束最小值问题,由0)(='m J 得到:

0)]())(1[(]

1[1)(2

=---Φ-Φ-=

'σ?σσm l m m l m J , 即

σ

m

l -应当是方程

σ

?l

x x x =+Φ-)()(1的解,其中)(??是标准正态分布的密度函数。

为了求解该方程,可以先根据标准正态分布的函数表现将)

()

(1)(x x x F ?Φ-=制成表格或

者绘制图形后再求解,或者利用数值求解的方法计算。

举例:若2.0,2==σl ,可以计算得到45.0=m 。 模型的改进及其他相关问题:

(1) 在建立目标函数时,可以考虑这样的问题,从理论上讲,当粗轧出的钢材超过l 时,

并非是全部浪费,最终的浪费量为l l X X ]/[-,因此从全面的分析角度看,应当把这多余的钢材长度进行多次的采用。但是在实际生产过程中是不会出现这种问题的,通常σ>>l ,这样可以时的多余的部分不可能太多。同时0

(2) 在实际生活中,粗轧的钢材往往有多种用途,即当有另外的要求l l <1时,1l X <得

部分可以降级使用。(这种情况下的建模问题留做作业)

概率模型三 航空公司的预订票策略 问题重述:

在激烈的市场竞争中,航空公司为了争取更多的客源开展了预订票业务。公司承诺,预先订购机票的乘客如果没有按时登机,可以不加任何费用乘坐下一班机或者退票;也可以订票时

只定座位,到登机时才付款。这里我们考虑预订票的费用在登机前支付的情形。开展预订票业务时,对于一次航班,若公司限制预订票的数量恰好等于飞机的容量,可能会有一些定了机票的乘客不能按时到达致使飞机不满员飞行而利润降低甚至亏本;而如果不限制预订票的数量,当持票按时前来登机的乘客超过飞机的容量时,必然会引起那些不能飞走的乘客的抱怨,公司不论什么方式补救,也会导致声誉受损和议定的经济损失,如客源减少、公司无偿提供食宿、付给一定的赔偿金等。所以航空公司需要综合考虑经济利益和社会声誉,确定预订票数量的最佳限额。

问题分析:

关键的问题是如何度量公司的经济利益,社会声誉。收益=机票收入-飞行费用-赔偿金;社会声誉用持票按时前来登机,但因为满员不能飞走的乘客限制在一定数量为标准。在这两个指标中,预订票的乘客是否按时前来登机是随机的。因此决策目标是两个指标的平均值,决策变量是预订票数量的险恶。

模型假设:

(1) 飞机的容量是常数n ,机票的价格为常数g ,飞行费用为常数r ,r 与乘客数量无

关,机票的价格按照n r g λ/=制订,其中1<λ称为利润调节因子,如6.0=λ表示飞机60%的满员率就不会亏本。

(2) 预订票数量的限额为常数)(n m m >,每位乘客不能按时前来登机的概率为p ,每

位乘客是否按时前来登机是相互独立的。

(3) 每位被挤掉的乘客获得的赔偿金为常数b 。

模型建立:

(1) 公司的经济利益用公司的平均利润G 来衡量。当m 个预订机票的乘客中有k 位乘客

不能按时前来登机时的收益为,

??

?

>-----≤---=n

k m b n k m r ng n k m r g k m G )()( 而按照假设2,不按时前来登机的乘客数K 服从二项分布),(p m B :

k m k

k m k p p C k K P p --===)1()( 因此平均利润为∑∑-=--=--+

----=

m

n m k k

n m k k

p

r g k m p

b n k m r ng m G ])[(])()[()(1

注意到

m p kp

m

k k

=∑=0

,因此有∑--=--+--=1

)()

()(n m k k

p

n k m b g r qmg m G 。

(2) 公司从社会声誉和经济利益两个方面考虑,应该要求被挤掉的乘客不要太多,而随

机量不能进行控制,转而用被挤掉的乘客数不超过若干人的概率作为度量指标。设

)(m P j 表示m 个订票的乘客中有超过j 个人被挤掉的概率,

∑---==

1

)(j n m k k

j p m P (因为被挤掉的乘客人数超过j 等价于m 位预订机票的乘客中不能按时前

来登机的人数不超过1---j n m 人)。显然0)(=+j n P j 。

(3) 公司的决策目标是在保持社会声誉的前提下使得公司获得的经济利益最大,因此可

以用)(m P j 不超过某个给定值作为约束条件,而以)(m G 作为单目标函数求解。

(4) 为了减少)(m G 中的参数,以

1])()1([1)()(1

---+-==∑--=n m k k p n k m g b qm n r m G m J λ

作为新的目标函数,其中g b /是赔偿金占机票价格的比例。 约束条件为

α≤=

∑---=1

)(j n m k k

j p

m P

其中α是预先确定的小于1的正数。 模型求解:

该约束决策问题没有解析解,当给定g b p n /,,,λ时,只能用数值计算的方法求解。

三、 随机模拟方法

在一些涉及随机现象的实际问题,无法用解析的方法求解,此时可以使用随机模拟的方法求解。所谓随机模拟,又称为仿真,就是在随机的现象中产生一系列满足分布假设的随机数,再利用现象内在的规律讨论相关问题。

例:考虑下面一个超市收费口的情形。假设只有一个收银员收费,顾客到来间隔时间θ服从参数为0.1的指数分布;收银员对顾客的服务时间η服从]15,4[上的均匀分布;排队按先到先服从规则,对队长没有限制。假设时间以分钟为单位,对上述模型模拟在开始收银后300分钟内的情形,得到下列数据(300分钟内共有多少顾客到来,已经服务了多少顾客,有顾客在等待,顾客的平均等待时间)

收银模型的全过程: (1) 开始计数;

(2) 第一个顾客到达,记录到达的时间,收银员开始服务,记录服务时间;在此期间,

可能有新的顾客达到等待,记录第二个顾客到达的时间和等待时间(第二个顾客的等待时刻=接受服务的时刻-到达时刻=前一个顾客离开的时刻-到达时刻);

(3) 顾客接受完服务后离开。

注:在此过程中,由两个因素是随机的,一个是每个顾客达到收银台的时间,另一个是该顾客接受服务的时间。该问题是排队问题的一种特殊情形,可以用解析的方法求解,但是比较复杂,这里主要介绍用随机模拟的方法求解。

在计算机模拟程序中三个主要方面及其产生和处理方法:

(1) 根据适当的方式产生随机数; (2) 模拟模型的动态运行情形;

(3) 根据模型的运行过程,统计出关心的数量指标。

这里将结合实际的单服务员的例子介绍随机模拟的基本方法。 模拟过程中用到的几个变量:

i —接受服务的顾客数

i x —第i 个顾客达到时刻与第1-i 个顾客到来的时刻差 i y —第i 个顾客接受服务的时间 i c —第i 个顾客到来的时刻

i b —第i 个顾客接受服务的时刻 i e —第i 个顾客结束服务的时刻 i w —第i 个顾客等待的时间

wait —累计等待时间

waita —平均等待时间(=累计等待时间/接受服务的顾客总数)

按照变量之间的联系,有下列的关系:

j i x x c ++= 1,其中k x 为随机变量 )0}(,max{01==-e e c b i i i

i i i y b e +=,其中k y 为随机变量 i i i c b w -=

模拟框图如下:

说明:

在随机数的产生中,可以充分利用一些计算软件自带的随机数产生命令,如MATLAB 中的均匀分布产生,正态分布产生等等;如果没有一些分布的自动生成命令,可以利用均匀分布产生所需要的分布,如])1,0([~U ξ,则λξη/)ln(-=服从参数为λ的指数分布。

附录:上述模型的MATLAB 程序

function f=sim(n) x(1)=exprnd(0.1); c(1)=x(1);b(1)=x(1); y(1)=rand(1)*11+4; e(1)=b(1)+y(1); wait=0; sto=b(1); i=2;

while(sto<=n) x(i)=exprnd(0.1); c(i)=c(i-1)+x(i); b(i)=max(c(i),e(i-1)); y(i)=rand(1)*11+4; e(i)=b(i)+y(i); wait=wait+b(i)-c(i); sto=b(i); i=i+1; end i=i-1 waita=wait/i

概率统计公式、符号汇总表

《概率统计》公式、符号汇总表及各章要点 (共3页) 第一章 第二、三章 一维随机变量及分布:X , i P , )(x f X , )(x F X 二维随机变量及分布:),(Y X , ij P , ),(y x f , ),(y x F *注意分布的非负性、规范性 (1)边缘分布:∑=j ij i p P ,? +∞ ∞ -=dy y x f x f X ),()( (2)独立关系:J I IJ P P P Y X =?独立与 或)()()(y f x f y x f Y X =, ),,(11n X X Λ与),,(21n Y Y Λ独立),,(11n X X f Λ?与),,(21n Y Y g Λ独立 (3)随机变量函数的分布(离散型用列表法) 一维问题:已知X 的分布以及)(X g Y =,求Y 的分布-------连续型用分布函数法 二维问题:已知),(Y X 的分布,求Y X Z +=、{}Y X M ,m ax =、{}Y X N ,m in =的分布- M 、N 的分布---------连续型用分布函数法 第四章 (1)期望定义:离散:∑=i i i p x X E )( 连续:???+∞∞-+∞ ∞-+∞∞-==dxdy y x xf dx x xf X E ),()()( 方差定义:)()(]))([()(222X E X E X E X E X D -=-= 离散:∑-=i i i p X E x X D 2))(()( 连续:?+∞ ∞--=dx x f X E x X D X )())(()(2 协方差定义:)()()())]())(([(),(Y E X E XY E Y E Y X E X E V X COV -=--= 相关系数定义:) ()(),(Y D X D Y X COV XY = ρ

概率统计公式大全(复习重点)

第一章随机事件和概率 (1)排列组合公式 )! ( ! n m m P n m- =从m个人中挑出n个人进行排列的可能数。 )! (! ! n m n m C n m- =从m个人中挑出n个人进行组合的可能数。 (2)加法和乘法原理加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由m种方法完成,第二种方法可由n种方法来完成,则这件事可由m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由m种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。 (3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个) 顺序问题 (4)随机试验和随机事件如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。试验的可能结果称为随机事件。 (5)基本事件、样本空间和事件在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质: ①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用ω来表示。 基本事件的全体,称为试验的样本空间,用Ω表示。 一个事件就是由Ω中的部分点(基本事件ω)组成的集合。通常用大写字母A,B,C,…表示事件,它们是Ω的子集。 Ω为必然事件,?为不可能事件。 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。 (6)事件的关系与运算①关系: 如果事件A的组成部分也是事件B的组成部分,(A发生必有事件B发生):B A? 如果同时有B A?,A B?,则称事件A与事件B等价,或称A等于B:A=B。 A、B中至少有一个发生的事件:A B,或者A+B。 属于A而不属于B的部分所构成的事件,称为A与B的差,记为A-B,也可表示为A-AB或者B A,它表示A发生而B不发生的事件。 A、B同时发生:A B,或者AB。A B=?,则表示A与B不可能同时发生,称 事件A与事件B互不相容或者互斥。基本事件是互不相容的。 Ω-A称为事件A的逆事件,或称A的对立事件,记为A。它表示A不发生的

概率论与数理统计习题及答案

概率论与数理统计习题及答案 习题一 1.见教材习题参考答案. 2.设A,B,C为三个事件,试用A,B,C (1)A发生,B,C都不发生; (2)A与B发生,C (3)A,B,C都发生; (4)A,B,C (5)A,B,C都不发生; (6)A,B,C (7)A,B,C至多有2个发生; (8)A,B,C至少有2个发生. 【解】(1)A BC(2)AB C(3)ABC (4)A∪B∪C=AB C∪A B C∪A BC∪A BC∪A B C∪AB C∪ABC=ABC (5) ABC=A B C(6) ABC (7) A BC∪A B C∪AB C∪AB C∪A BC∪A B C∪ABC=ABC=A∪B∪C (8) AB∪BC∪CA=AB C∪A B C∪A BC∪ABC 3.. 4.设A,B为随机事件,且P(A)=0.7,P(A-B)=0.3,求P(AB). 【解】P(AB)=1-P(AB)=1-[P(A)-P(A-B)] =1-[0.7-0.3]=0.6 5.设A,B是两事件,且P(A)=0.6,P(B)=0.7, (1)在什么条件下P(AB (2)在什么条件下P(AB) 【解】(1)当AB=A时,P(AB)取到最大值为0.6. (2)当A∪B=Ω时,P(AB)取到最小值为0.3. 6.设A,B,C为三事件,且P(A)=P(B)=1/4,P(C)=1/3且P(AB)=P(BC)=0, P(AC)=1/12,求A,B,C至少有一事件发生的概率. 【解】P(A∪B∪C)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(AC)+P(ABC)

= 14+14+13-112=34 7. 52张扑克牌中任意取出13张,问有5张黑桃,3张红心,3张方块,2张梅花的概率是多少? 【解】 p =5332 131313131352C C C C /C 8. (1) 求五个人的生日都在星期日的概率; (2) 求五个人的生日都不在星期日的概率; (3) 求五个人的生日不都在星期日的概率. 【解】(1) 设A 1={五个人的生日都在星期日},基本事件总数为75,有利事件仅1个,故 P (A 1)= 517=(17 )5 (亦可用独立性求解,下同) (2) 设A 2={五个人生日都不在星期日},有利事件数为65,故 P (A 2)=5567 =(67)5 (3) 设A 3={五个人的生日不都在星期日} P (A 3)=1-P (A 1)=1-( 17 )5 9..见教材习题参考答案. 10.一批产品共N 件,其中M 件正品.从中随机地取出n 件(n

数学建模案例分析—主成分分析的应用--概率统计方法建模

§8 主成分分析的应用 主成分分析的基本思想是通过构造原变量的适当的线性组合,以产生一系列互不相关的新变量,从中选出少数几个新变量并使它们尽可能多地包含原变量的信息(降维),从而使得用这几个新变量替代原变量分析问题成为可能。即在尽可能少丢失信息的前提下从所研究的m 个变量中求出几个新变量,它们能综合原有变量的信息,相互之间又尽可能不含重复信息,用这几个新变量进行统计分析(例如回归分析、判别分析、聚类分析等等)仍能达到我们的目的。 设有n 个样品,m 个变量(指标)的数据矩阵 (1)1112 1(2)21222()12m m n m n n n nm x x x x x x x x X x x x x ??? ?? ? ? ? ?== ? ? ? ? ????? 寻找k 个新变量12,,,()k y y y k m ≤ ,使得 1、1122,(1,2,,)l l l lm m y a x a x a x l k =+++= 2、12,,k y y y 彼此不相关 这便是主成分分析。主成分的系数向量12(,,,)l l l lm a a a a = 的分量lj a 刻划出第j 个变量关于第l 个主成分的重要性。 可以证明,若12(,,,)T m x x x x = 为m 维随机向量,它的协方差矩阵V 的m 个特征值为 120m λλλ≥≥≥≥ ,相应的标准正交化的特征向量为12,,,m u u u ,则 12(,,,)T m x x x x = 的第i 主成分为(1,2,,)T i i y u x i m == 。 称1 / m i j j λλ =∑为主成分(1,2,,)T i i y u x i m == 的贡献率, 1 1 /k m j j j j λλ ==∑∑为主成分 12,,k y y y 的累计贡献率,它表达了前k 个主成分中包含原变量12,,,m x x x 的信息量大 小,通常取k 使累计贡献率在85%以上即可。当然这不是一个绝对不变的标准,可以根据实 际效果作取舍,例如当后面几个主成分的贡献率较接近时,只选取其中一个就不公平了,若都选入又达不到简化变量的目的,那时常常将它们一同割舍。 计算步骤如下: 1、由已知的原始数据矩阵n m X ?计算样本均值向量12?(,,,)T m x x x x μ== ; 其中1 1(1,2,,)n i ij j x x i m n ===∑

最新高考-2018年高考数学概率统计的解题技巧 精品

第八讲 概率统计的解题技巧 【命题趋向】概率统计命题特点: 1.在近五年高考中,新课程试卷每年都有一道概率统计解答题,并且这五年的命题趋势是一道概率统计解答题逐步增加到一道客观题和一道解答题;从分值上看,从12分提高到17分;由其是实施新课标考试的省份, 增加到两道客观题和一道解答题.值得一提的是此累试题体现了考试中心提出的“突出应用能力考查”以及“突出新增加内容的教学价值和应用功能”的指导思想,在命题时,提高了分值,提高了难度,并设置了灵活的题目情境,如测试成绩、串联并联系统、计算机上网、产品合格率、温度调节等,所以在概率统计复习中要注意全面复习,加强基础,注重应用. 2.就考查内容而言,用概率定义(除法)或基本事件求事件(加法、减法、乘法)概率,常以小题形式出现;随机变量取值-取每一个值的概率-列分布列-求期望方差常以大题形式出现.概率与统计还将在选择与填空中出现,可能与实际背景及几何题材有关. 【考点透视】 1.了解随机事件的发生存在着规律性和随机事件概率的意义. 2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率. 3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率. 4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 【例题解析】 考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P (A )=) ()(I card A card =n m ; 等可能事件概率的计算步骤: ① 计算一次试验的基本事件总数n ; ② 设所求事件A ,并计算事件A 包含的基本事件的个数m ; ③ 依公式()m P A n =求值; ④ 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的 概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”: ① 求概率的步骤是:

数学建模案例分析消费分布规律的分类概率统计方法建模

§7 消费分布规律的分类 为研究辽宁、浙江、河南、甘肃、青海5省份在某年城镇居民生活消费的分布规律,需要用调查资料对这5个省分类.数据见下表: 其中,X 1:人均粮食支出; X 2:人均副食品支出; X 3:人均烟、酒、茶支出; X 4:人均其它副食品支出; X 5:人均衣着商品支出; X 6:人均日用品支出; X 7:人均燃料支出; X 8:人均非商品支出. 在科学研究、生产实践、社会生活中,经常会遇到分类的问题.例如,在考古学中,要将某些古生物化石进行科学的分类;在生物学中,要根据各生物体的综合特征进行分类;在经济学中,要考虑哪些经济指标反映的是同一种经济特征;在产品质量管理中,要根据各产品的某些重要指标而将其分为一等品,二等品等等. 这些问题可以用聚类分析方法来解决. 聚类分析的研究内容包括两个方面,一是对样品进行分类,称为Q 型聚类法,使用的统计量是样品间的距离;二是对变量进行分类,称为R 型聚类法,使用的统计量是变量间的相似系数. 设共有n 个样品,每个样品i x 有p 个变量,它们的观测值可以表示为 n i x x x x pi i i i ,,2,1),,,,(21 == 一、样品间的距离 下面介绍在聚类分析中常用的几种定义样品i x 与样品j x 间的距离. 1、 Minkowski 距离 m m p k kj ki j i x x x x d 11 ][),(∑=-= 2、绝对值距离 ∑=-=p k kj ki j i x x x x d 1),( 3、欧氏距离 21 21][),(∑=-=p k kj ki j i x x x x d 二、变量间的相似系数 相似系数越接近1,说明变量间的关联程度越好.常用的变量间的相似系数有 1、 夹角余弦

概率论与数理统计课本_百度文库

第二章随机变量及其分布第一节随机变量及其分布函数 一、随机变量 随机试验的结果是事件,就“事件”这一概念而言,它是定性的。要定量地研究随机现象,事件的数量化是一个基本前提。很自然的想法是,既然试验的所有可能的结果是知道的,我们就可以对每一个结果赋予一个相应的值,在结果(本事件)数值之间建立起一定的对应关系,从而对一个随机试验进行定量的描述。 例2-1 将一枚硬币掷一次,观察出现正面H、反面T的情况。这一试验有两个结果:“出现H”或“出现T”。为了便于研究,我们将每一个结果用一个实数来代表。比如,用数“1”代表“出现H”,用数“0”代表“出现T”。这样,当我们讨论试验结果时,就可以简单地说成结果是1或0。建立这种数量化的关系,实际上就相当于引入一个变量X,对于试验的两个结果,将X的值分别规定为1或0。如果与样本空间 { } {H,T}联系起来,那么,对于样本空间的不同元素,变量X可以取不同的值。因此,X是定义在样本空间上的函数,具体地说是 1,当 H X X( ) 0,当 T 由于试验结果的出现是随机的,因而X(ω)的取值也是随机的,为此我们称 X( )X(ω)为随机变量。 例2-2 在一批灯泡中任意取一只,测试它的寿命。这一试验的结果(寿命)本身就是用数值描述的。我们以X记灯泡的寿命,它的取值由试验的结果所确定,随着试验结果的不同而取不同的值,X是定义在样本空间 {t|t 0}上的函数 X X(t) t,t 因此X也是一个随机变量。一般地有 定义2-1 设 为一个随机试验的样本空间,如果对于 中的每一个元素 ,都有一个实数X( )与之相对应,则称X为随机变量。 一旦定义了随机变量X后,就可以用它来描述事件。通常,对于任意实数集合L,X在 L上的取值,记为{X L},它表示事件{ |X( ) L},即 。 {X L} { |X( ) L} 例2-3 将一枚硬币掷三次,观察出现正、反面的情况。设X为“正面出现”的次数,则X是一个随机变量。显然,X的取值为0,1,2,3。X的取值与样本点之间的对应关系如表2-1所示。 表2-1 表2-1

高中数学概率统计

第八讲 概率统计 【考点透视】 1.了解随机事件的发生存在着规律性和随机事件概率的意义. 2.了解等可能性事件的概率的意义,会用排列组合的基本公式计算一些等可能性事件的概率. 3.了解互斥事件、相互独立事件的意义,会用互斥事件的概率加法公式与相互独立事件的概率乘法公式计算一些事件的概率. 4.会计算事件在n 次独立重复试验中恰好发生k 次的概率. 5. 掌握离散型随机变量的分布列. 6.掌握离散型随机变量的期望与方差. 7.掌握抽样方法与总体分布的估计. 8.掌握正态分布与线性回归. 【例题解析】 考点1. 求等可能性事件、互斥事件和相互独立事件的概率 解此类题目常应用以下知识: (1)等可能性事件(古典概型)的概率:P (A )=) ()(I card A card =n m ; 等可能事件概率的计算步骤: ① 计算一次试验的基本事件总数n ; ② 设所求事件A ,并计算事件A 包含的基本事件的个数m ; ③ 依公式()m P A n =求值; ④ 答,即给问题一个明确的答复. (2)互斥事件有一个发生的概率:P (A +B )=P (A )+P (B ); 特例:对立事件的概率:P (A )+P (A )=P (A +A )=1. (3)相互独立事件同时发生的概率:P (A ·B )=P (A )·P (B ); 特例:独立重复试验的概率:P n (k )=k n k k n p p C --)1(.其中P 为事件A 在一次试验中发生的概率,此式为二项式[(1-P)+P]n 展开的第k+1项. (4)解决概率问题要注意“四个步骤,一个结合”:

① 求概率的步骤是: 第一步,确定事件性质???????等可能事件 互斥事件 独立事件 n 次独立重复试验 即所给的问题归结为四类事件中的某一种. 第二步,判断事件的运算???和事件积事件 即是至少有一个发生,还是同时发生,分别运用相加或相乘事件. 第三步,运用公式()()()()()()()()(1) k k n k n n m P A n P A B P A P B P A B P A P B P k C p p -?=???+=+???=??=-??等可能事件: 互斥事件: 独立事件: n 次独立重复试验:求解 第四步,答,即给提出的问题有一个明确的答复. 例1.在五个数字12345,,,,中,若随机取出三个数字,则剩下两个数字都是奇数的概率是 (结果用数值表示). [考查目的]本题主要考查概率的概念和等可能性事件的概率求法. [解答过程]0.3提示:1335C 33.54C 10 2P ===? 例2.一个总体含有100个个体,以简单随机抽样方式从该总体中抽取一个容量为5的样本,则指定的某个个体被抽到的概率为 . [考查目的]本题主要考查用样本分析总体的简单随机抽样方式,同时考查概率的概念和等可能性事件的概率求法. 用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法. [解答过程]1.20 提示:51.10020P == 例3从自动打包机包装的食盐中,随机抽取20袋,测得各袋的质量分别为(单位:g ): 492 496 494 495 498 497 501 502 504 496 497 503 506 508 507 492 496 500 501 499 根据的原理,该自动包装机包装的袋装食盐质量在497.5g~501.5g 之间的概率约为__________. [考查目的]本题主要考查用频率分布估计总体分布,同时考查数的区间497.5g~501.5的意义和概率的求法.

概率论与数量统计-公式

第1章随机事件及其概率 (1)排列组合公式 从m 个人中挑出n 个人进行排列的可能数。 从m 个人中挑出n 个人进行组合的可能数。 (2)加法和乘法原理 加法原理(两种方法均能完成此事):m+n 某件事由两种方法来完成,第一种方法可由m 种方法完成,第二种方法可由n 种方法来完成,则这件事可由m+n 种方法来完成。乘法原理(两个步骤分别不能完成这件事):m×n 某件事由两个步骤来完成,第一个步骤可由m 种方法完成,第二个步骤可由n 种方法来完成,则这件事可由m×n 种方法来完成。(3)一些常见排列重复排列和非重复排列(有序)对立事件(至少有一个)顺序问题 (4)随机试验和随机事件 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 (5)基本事件、样本空间和事件 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如下性质: ①每进行一次试验,必须发生且只能发生这一组中的一个事件;②任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用来表示。 基本事件的全体,称为试验的样本空间,用表示。 一个事件就是由中的部分点(基本事件)组成的集合。通常用大写字母A,B,C,…表示事件,它们是的子集。为必然事件,?为不可能事件。 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理,必然事件(Ω)的概率为1,而概率为1的事件也不一定是必然事件。(6)事件的关系与运算 ①关系: 如果事件A 的组成部分也是事件B 的组成部分,(A 发生必有事件B 发生):如果同时有, ,则称事件A 与事件B 等价,或称A 等于B : A=B 。 A、B 中至少有一个发生的事件:A B ,或者A +B 。 属于A 而不属于B 的部分所构成的事件,称为A 与B 的差,记为A-B ,也 可表示为A-AB 或者 ,它表示A 发生而B 不发生的事件。 A、B 同时发生:A B ,或者AB 。A B=?,则表示A 与B 不可能同时发 生,称事件A 与事件B 互不相容或者互斥。基本事件是互不相容的。

《概率论与数理统计》课程自学指导书

《概率论与数理统计》课程自学指导书 前言 . . 《概率论与数理统计》是城市规划专业和地理信息系统专业的专业必修课。《概率统计》教材系统阐述了概率论和数理统计的基本内容、理论和应用方法。概率统计是研究随机现象客观规律的数学学科,它的应用非常广泛,并具有独特的思维和方法。通过概率论的学习能使学生了解概率与数理统计的基本概念和基本理论,初步掌握处理随机现象的基本思想和方法,培养学生运用概率统计方法分析和解决实际问题的能力。通过本课程的学习,能够为学生学习后继课程及进一步提高打下必要的数学基础。其内容可分为三大部分。第一部分概率论部分,包括第一、二、三、四、五章。作为基础知识,为读者提供了必要的理论基础。第二部分数理统计部分,包括第六、七、八、九章,主要讲述参数估计和假设检验,并介绍了方差分析和回归分析。第三部分随机过程部分,主要讨论了平稳随机过程,还介绍了马尔可夫过程。 本指导书是作为函授学员在集中授课后,指导自学而编制的。内容较为简明扼要。主要是为了让学员能够抓住要领,掌握重点,理解难点,从而达到能够融会贯通、灵活掌握概率统计的基本概念、基本理论从而解决实际问题的目的。 本指导书的主要参考书目: 1. 景泰等编。概率论与数理统计.上海科学技术文献出版社,1991. 2. 玉麟主编。概率论与数理统计.复旦大学出版社,1995。 3.大茵,陈永华编。概率论与数理统计。浙江大学出版 社.1996 本课程的考核内容以教学大纲为依据,注重基本概念、基本理论的掌握和应用的考核。主要考核方式为笔试。 第一章概率论的基本概念 一、内容概述 # 本章介绍了概率论的基本概念:随机试验、样本空间、随机事件、频率与概率,讨论研究等可能概型问题、条件概率及独立性问题。 二、教学目的要求 # (1) 理解并掌握概率论的基本概念。

等可能事件与抛掷硬币试验

第八讲等可能事件与抛掷硬币试验 1.知道,但何以知道? 我们知道,如果随意抛掷一枚硬币,则硬币正面朝上和反面朝上的可能性相等。因此我们说,抛掷硬币时,硬币正面朝上和反面朝上是等可能事件。我们又知道,如果随意抛掷一枚骰子,则骰子六个面朝上的可能性相等,因此我们说,抛掷骰子时,骰子的六个面朝上是等可能事件。但我们想过没有,人们是何以知道这些结论的呢? 现在有三个选择项: A.是由硬币(骰子也一样)几何形状的对称性和物理质地的均匀性想当然地得到的; B.是布丰、德.摩根等人抛掷硬币试验的结果(虽然没有他们抛掷骰子的记载); C.是利用概率论公式,通过计算得到的。 你将作何选择? 2.考古的与历史的证据——答案初现 人类很早以前就已经发现抛掷骰子时各面朝上的等可能性,并利用这种等可能性做各种游戏:我国山东青州出土的战国时代(公元前475年至前221年)齐墓中就发现陪葬的骰子。又据文献记载,古罗马(公元前27年至公元446年)人已利用骰子进行占卜和赌博。 而概率论的产生,始于1654年法国数学家帕斯卡(1623—1662)和费尔马(1601—1665)在来往书信中讨论的关于抛掷骰子游戏的数学问题。此后经许多数学家的大量工作,概率论的内容逐渐充实,到1812年法国数学家拉普拉斯的著作《概率分析理论》问世,所谓古典概率的理论结构已经完成。 至于抛掷硬币试验,重要的抛掷硬币试验的年代无法考证,但著名的抛掷硬币试验者的生卒年代可以考证:布丰(1707—1788),德.摩根(1803—1871),皮尔逊(1857—1936),费勒(1906—1970)。 从时间先后不难发现:人类先有对等可能性的认识,在此基础上建立了古典概率理论,然后才有抛掷硬币的试验。 3.逻辑——至少应有一个“先验的”概率 不妨从逻辑角度再作一次推演。大数思想表明:“当随机试验次数达到大数次时,事件的频率逐渐稳定于它的概率。”因此,至少有一个随机事件的概率是未经试验而预先知道的,这个概率必定不是试验的结果(即用频率估计)。而这正是抛掷硬币时,硬币正、反面朝上

概率统计公式大全汇总

第一章
n Pm ?
随机事件和概率
(1)排列 组合公式
n Cm ?
m! (m ? n)!
从 m 个人中挑出 n 个人进行排列的可能数。
m! 从 m 个人中挑出 n 个人进行组合的可能数。 n!(m ? n)!
(2)加法 和乘法原 理
加法原理(两种方法均能完成此事) :m+n 某件事由两种方法来完成,第一种方法可由 m 种方法完成,第二种方法可由 n 种 方法来完成,则这件事可由 m+n 种方法来完成。 乘法原理(两个步骤分别不能完成这件事) :m×n 某件事由两个步骤来完成, 第一个步骤可由 m 种方法完成, 第二个步骤可由 n 种 方法来完成,则这件事可由 m×n 种方法来完成。 重复排列和非重复排列(有序) 对立事件(至少有一个) 顺序问题 如果一个试验在相同条件下可以重复进行,而每次试验的可能结果不止一个,但 在进行一次试验之前却不能断言它出现哪个结果,则称这种试验为随机试验。 试验的可能结果称为随机事件。 在一个试验下,不管事件有多少个,总可以从其中找出这样一组事件,它具有如 下性质: ①每进行一次试验,必须发生且只能发生这一组中的一个事件; ②任何事件,都是由这一组中的部分事件组成的。 这样一组事件中的每一个事件称为基本事件,用 ? 来表示。 基本事件的全体,称为试验的样本空间,用 ? 表示。 一个事件就是由 ? 中的部分点(基本事件 ? )组成的集合。通常用大写字母 A, B,C,…表示事件,它们是 ? 的子集。 ? 为必然事件,? 为不可能事件。 不可能事件(?)的概率为零,而概率为零的事件不一定是不可能事件;同理, 必然事件(Ω )的概率为 1,而概率为 1 的事件也不一定是必然事件。 ①关系: 如果事件 A 的组成部分也是事件 B 的组成部分, (A 发生必有事件 B 发生) :
(3)一些 常见排列 (4)随机 试验和随 机事件
(5)基本 事件、样本 空间和事 件
(6)事件 的关系与 运算
A? B
如果同时有 A ? B , B ? A ,则称事件 A 与事件 B 等价,或称 A 等于 B:A=B。 A、B 中至少有一个发生的事件:A ? B,或者 A+B。 属于 A 而不属于 B 的部分所构成的事件,称为 A 与 B 的差,记为 A-B,也可表 示为 A-AB 或者 A B ,它表示 A 发生而 B 不发生的事件。
1 / 33

概率论与数理统计教学大纲

《概率论与数理统计》教学大纲 编写人:刘雅妹审核:全焕 一、课程性质与任务 概率论与数理统计是研究随机现象客观规律的数学学科,是高等学校本科各专业的一门重要的基础理论课。本课程的任务是使学生掌握概率论与数理统计的基本概念,了解它的基本理论和方法,从而使学生初步掌握处理随机现象的基本思想和方法,培养学生运用概率统计方法分析和解决、处理实际不确定问题的基本技能和基本素质,它是为培养我国现代建设所需要的高质量、高素质专门人才服务的。 二、教学基本要求 本课程按要求不同,分深入理解、牢固掌握、熟练应用,其中概念、理论用“理解”、“了解”表述其要求的强弱,方法运算用“会”或“了解”一词表述。 〈一〉、随机事件与概率 ⒈理解随机实验,样本空间和随机事件的概念,掌握事件的关系与运算。 ⒉理解概率的定义,掌握概率的基本性质,能计算古典概型和几何概型的概率,能用概率的基本性质计算随机事件的概率。 3.理解条件概率的概念,掌握概率的乘法公式。

⒋理解全概率公式和贝叶斯公式,能计算较复杂随机事件的概率。 ⒌理解事件的独立性概念,能应用事件的独立性进行概率计算。 6.理解随机实验的独立性概念,掌握n重贝努里实验中有关随机事件的概率计算。 〈二〉、一维随机变量及其概率分布 ⒈理解一维随机变量及其概率分布的概念. 2.理解随机变量分布函数的概念,了解分布函数的性质,会计算与随机变量有关的事件的概率. 3.理解离散型随机变量及概率分布的概念.掌握0-1分布、二项分布、泊松分布及其它们的应用。 4.理解连续型随机变量及其概率密度的概念,掌握均匀分布、指数分布、正态分布及其它们的应用。 5.会求简单的随机变量的函数的分布。 〈三〉、二维随机变量及其分布 ⒈了解二维(多维)随机变量的概念。 ⒉了解二维随机变的联合分布函数及其性质;了解二维离散型随机变的联合概率分布及其性质;了解二维连续型随机变量的联合概率密度函数及其性质,并会用这些性质计算有关事件的概率。 3.掌握二维离散型与二维连续型随机变量的边缘分布的计算,了解条件分布及其计算。 4.理解随机变量独立性的概念,掌握运用随机变量独立性进行概率计算。

第八讲 概率与统计模型

第八讲 概率与统计模型 一、 曲线拟合 所谓曲线拟合是指从自变量和因变量的实现点列中得到反映自变量和因变量的函数关系。如下图蓝色点表明的是某个函数关系式,现需要知道有如此曲线表现的函数。 曲线拟合可以视为函数求值的逆运算,函数求值在已知函数关系式时带入自变量的值就可以得到对应的因变量,而曲线拟合恰好相反。要注意的是曲线拟合在大多数情况下只能得到反映大致的函数关系的表达式,而不能得到精确的关系式。如已知某个地区的温度C 与一种植物的生长速度V 之间有线性的关系(设为b aC V +=),为了确定两者之间的确切关系时,需要知道两组实际数据2,1),,(=i v c i i ,这样通过求解线性方程组 ?? ?+=+=b ac v b ac v 22 11 可以求出),(b a 的值。但是在实际问题中,由于测量的误差或者计算过程中的问题,给出来的数据可能不止两对,n i v c i i ,,2,1),,( =,这样如果还是将给出的数据带入方程中得到的是一个超定方程组,该方程组未必有解!从而就产生了如何确定系数的问题,曲线拟合方法就是解决这种问题的方法。 与曲线拟合相平行的另一个问题是插值问题,插值就是利用给出的一些数据作为提示,要得到一些未知点处的函数值。在这里我们将两个问题整合起来,因为在通过曲线拟合得到反映规律的曲线后将需要求值的点带入即可以得到函数值。 曲线拟合的基本方法如下: (1) 确定自变量与因变量, (2) 确定自变量与因变量之间的函数关系类型(即自变量与因变量之间的粗略关系式, 含有参数) (3) 选择合适的曲线拟合方法(其中使用最多的是最小二乘法) (4) 使用MATLAB 后者其他计算软件求解

概率论与数理统计A、B教学大纲(新教材)

概率论与数理统计A、B教学大纲(自编教材) 课程名称:概率论与数理统计A、B 课程编码:A 112012,B112013 学分:A (4), B(3) 总学时:A (64), B(48) 适用专业:相关专业本科 先修课程:高等数学A 选用教材:昆明理工大学自编教材,概率论与数理统计 一、课程的性质、目的和任务 概率论与数理统计是研究随机现象客观规律的数学学科,是工科专业的基础课,通过本课程的学习,使学生掌握概率和数理统计的基本概念,了解它的基本理论和方法,培养学生分析和解决实际问题的能力。 二、教学内容与要求 (一)随机事件和概率 1、机事件的概念,理解样本空间的概念,掌握事件之间的关系与运算。 2、概率的定义,掌握概率的基本性质与应用这些性质进行概率计算。 3、条件概率的概念,掌握概率的加法公式、乘法公式、全概率公式、贝叶斯公式以及 应用这些公式进行概率计算。 4、事件的独立性概念,掌握应用事件独立性进行概率计算。 (二)一维随机变量及其分布 1、随机变量的概念。 2、随机变量分布函数的概念及性质,理解离散型随机变量的分布律及其性质,理解连 续型随机变量的概率密度及其性质,会应用概率分布计算有关事件的概率。 3、二项分布、泊松分布、正态分布、均匀分布和指数分布。 4、简单随机变量函数的概率分布。 (三)二维随机向量 1、二维随机变量的概念。 2、二维随机变量的联合分布函数及其性质、理解二维离散型随机变量的联合分布律及其 性质和二维连续型随机变量的联合概率密度及其性质,并会用它们计算有关事件的概率。

3、二维随机变量的边缘分布。 4、随机变量独立性的概念,掌握应用随机变量的独立性进行概率计算。 5、两个独立随机变量的简单函数的分布。 (四)随机变量的数字特征 1、数学期望和方差的概念,掌握它们的性质与计算。 2、二项分布、泊松分布、均匀分布、指数分布和正态分布的数学期望和方差。 3、算随机变量函数的数学期望。 4、矩、协方差和相关系数的概念和性质,并会计算。 5、切比雪夫不等式。 6、切比雪夫大数定律和伯努利大数定律。 7、独立同分布的中心极限定理和棣莫弗-拉普拉斯中心极限定理。 (五)数理统计学的基本概念 1、总体、个体、简单随机样本和统计量的概念,掌握样本均值、样本方差及样本矩的计 算。 2、X2分布、t分布和F分布的定义及性质,了解分位数的概念并会查表计算。 3、正态总体的某些常用统计量的分布。 (六)参数估计 1、点估计的概念。 2、掌握矩估计法(一阶、二阶)和极大似然估计法。 3、理解估计量的评选标准中的无偏性、有效性。 4、理解区间估计的概念。 5、会求单个正态总体的均值和方差的置信区间。 6、会求两个正态总体的均值差和方差比的置信区间。 (以上48学时适用) (七)假设检验 1、理解显著性检验的基本思想,掌握假设检验的基本步骤,了解假设检验可能产生的两 类错误。 2、掌握单个及两个正态总体的均值和方差的假设检验。 3、了解总体分布假设的X2检验法。

概率论与数理统计-朱开永--同济大学出版社习题一答案

概率论与数理统计-朱开永--同济大学出版社习题一答案

2 习 题 一 1.下列随机试验各包含几个基本事件? (1)将有记号b a ,的两只球随机放入编号为Ⅰ,Ⅱ,Ⅲ 的盒子里(每个盒子可容纳两个球) 解:用乘法原理,三个盒子编号为Ⅰ,Ⅱ,Ⅲ看作不动物,。两个球看作是可动物,一个一个地放入盒中;a 球可放入的任一个,其放法有 3 1 3 =C 种,b 球也可放入三个盒子的任一个,其放法有 3 13=C 种,由乘法原理知:这件事共有的方法数为11339 C C ?=种。 (2)观察三粒不同种子的发芽情况。 解:用乘法原理,三粒种子,每一粒种子按发芽与否是两种不同情况(方法)。三粒种子发芽共有8 12121 2 =??C C C 种不同情况。 (3)从五人中任选两名参加某项活动。 解:从五人中任选两名参加某项活动,可不考虑任选的两人的次序, 所以此试验的基本事件个数 10 2 5 ==C n 。

3

4 则,A B AB U 各表示什么事件?B A 、之间有什么关系? 解: 设k A =“五件中有k 件是不合格品” = B “五 件都是合格品”。此随机试验E 的样本空间可以写成:{}1 2 3 4 5 ,,,,,S A A A A A B = 而 1 2 345 A A A A A A =U U U U ,A B S ∴=U φ =AB ,A 与B 是互为对立事件。 3. 随机抽验三件产品,设A 表示“三件中至少有一件是废品”,设B 表示“三件中至少有两件是废品”,C 表示“三件都是正品”,问 ,,,,A B C A B AC U 各表示什么事件? 解: =A “三件都是正品”,=B “三件中至多有一件废品”, = C “三件中至少有一件废品”, , A B A AC φ ==U . 4. 对飞机进行两次射击,每次射一弹,设1 A 表示“第一次射击击中飞机”,2 A 表示“第二次射 击击中飞机”,试用2 1 ,A A 及它们的对立事件表示 下列各事件: = B “两弹都击中飞机”; = C “两弹都没击中飞

论同一律在日常生活中的运用

论同一律在日常生活中的运用 内容摘要:逻辑思维的三大基本规律在日常生活中的运用,同一律应该算是最基本、应用范围最广的一条规律······首先我们要了解什么是同一律。所谓同一律,是指在同一时间、同一关系下,对同一对象的同一方面的思维过程中,每一思想必须与其自身保持同一······“同一律的作用,主要是保持思维具有确定性。” 关键词:同一律、“偷换概念”与“转移论题”、语言层次论、同一律的作用 在日常生活中,涉猎最广的莫过于逻辑思维的运用了,无论是科学论证,抑或是言语表达中,我们时时刻刻都在运用着逻辑思维去分析、解决问题。但是,相信对很多人而言,逻辑学理论就像身边的阳光、空气一样,看不见、摸不着,但又时时刻刻在运用。或许我们能用常识来判断“鲁迅的作品不是一天能读完的,《祝福》是鲁迅的作品,所以《祝福》也不是一天能够读完的。”这句话是错的,但如果要用专业准确的逻辑学术语来表述,相信对很多人来说都有一定难度。逻辑思维的三大基本规律在日常生活中的运用,同一律应该算是最基本、应用范围最广的一条规律,就拿上述例子在说,“鲁迅的作品”是一个集合的概念,包含他所创作的所有作品,但《祝福》只是其作品中的一部,是一个子概念,这里犯了替换概念的错误,将范围从大缩到小。下面就跟大家详细探讨下同一律在日常生活中的运用。 首先我们要了解什么是同一律。所谓同一律,是指在同一时间、同一关系下,对同一对象的同一方面的思维过程中,每一思想必须与

其自身保持同一。简言之,就是要始终如一。这里面包含两层含义:一是论证的每一个思想必须是在同一条件下,不能转换前置条件;二是,每一个论证的思想必须有确定的内容,并且不能偷换概念。在语文科目的学习中我们常常会被要求用词造句,比如老师要求学生用“难过”一词造句,学生如是造“涨大水了,我家门前的河很难过。”这里学生的造句表面上看来符合语法习惯,语义也通顺,但是他违反了逻辑思维中同一律的规则,暗中偷换概念,“难过”本是用来形容人的思想感情,但“河难过”却是指“难以通过”,学生在无意间犯了偷换概念的错误。 其次,我们要了解什么样的情况下会违反同一律的逻辑思维规则,常见的违反同一律的错误有哪些?对于上述的两个例子,从大的方面来讲,都是犯了偷换概念的错误,没有保持概念的逻辑同一,在同一条件下、同一前提下,暗中偷换了概念,致使逻辑错误的产生。在同一的逻辑思维中,经常会出现另一种错误,就是转移论题,即人们在运用判断进行推理和论证时没有保持判断的同一,中途以其他判断取代了原来的判断。例如,有人向执法人员质疑乱罚款的问题,执法人员说:“罚款本身不是目的,严格执法是为了维护人民的合法权益。”很明显,大众质疑的不是罚款的意义何在,而在于罚款的公正、公平的实施情况,但执法人员中途转移论题,将话题引到罚款的意义上,于是违反了同一律中必须保证每一思想都在同一情况下进行讨论的前提。 下面我们来探讨下“偷换概念”、“转移论题”中常见的一些问题。

概率论与数理统计

数三《概率论与数理统计》教学大纲 教材:四川大学数学学院邹述超、何腊梅:《概率论与数理统计》,高等教育出版社出,2002年8月。 参考书:袁荫棠:《概率论与数理统计》(修订本),中国人民大学出版社。 四川大学数学学院概率统计教研室:《概率论与数理统计学习指导》 总学时:60学时,其中:讲课50学时,习题课10学时。 学分:3学分。 说明: 1.生源结构:数三的学生是由高考文科生和一部分高考理科生构成。有些专业全是文科生或含极少部分理科生(如:旅游管理,行政管理),有些专业约占1/4~1/3的理科生(国贸,财政学,经济学),有些专业全是理科生(如:国民经济管理,金融学)。 2.高中已讲的内容:高中文、理科都讲了随机事件的概率、互斥事件的概率、独立事件的概率,即教材第一章除条件概率以及有关的内容以外,其余内容高中都讲了。高中理科已讲离散型随机变量的概率分布(包括二项分布、几何分布)和离散型随机变量的期望与方差,统计基本概念、频率直方图、正态分布、线性回归。而高中文科则只讲了一点统计基本概念、频率直方图、样本均值和样本方差的简单计算。 3.基本要求:学生的数学基础差异大,不同专业学生对数学课重视程度的差异大,这就给讲授这门课带来一定的难度,但要尽量做到“分层次”培养学生。高中没学过的内容要重点讲解,学过的内容也要适当复习或适当增加深度。讲课时,既要照顾数学基础差的学生,多举基本例子,使他们掌握大纲要求的基本概念和方法;也要照顾数学基础好的学生,使他们会做一些综合题以及简单证明题。因为有些专业还要开设相关的后继课程(如:计量经济学),将用到较多的概率统计知识;还有一部分学生要考研,数三的概率考研题往往比数一的难。 该教材每一章的前几节是讲述基本概念和方法,习题(A)是针对基本方法的训练而编写的,因此,这一部分内容须重点讲解,并要求学生必须掌握;每一章的最后一节是综合例题,习题(B)具有一定的综合性和难度,可以选讲部分例题,数学基础好的学生可选做(B)题。 建议各章学时分配(+号后面的是习题课学时): 第一章随机事件及其概率 一、基本内容 随机事件的概念及运算。概率的统计定义、古典定义及公理化定义。概率的基本性质、加法公式、条件概率与乘法公式、全概率公式、贝叶斯公式。事件的独立性,独立随机试验、

相关文档
最新文档