数学建模算法方差分析

数学建模算法方差分析
数学建模算法方差分析

第十一章 方差分析

我们已经作过两个总体均值的假设检验,如两台机床生产的零件尺寸是否相等,病人和正常人的某个生理指标是否一样。如果把这类问题推广一下,要检验两个以上总体的均值彼此是否相等,仍然用以前介绍的方法是很难做到的。而你在实际生产和生活中可以举出许多这样的问题:从用几种不同工艺制成的灯泡中,各抽取了若干个测量其寿命,要推断这几种工艺制成的灯泡寿命是否有显著差异;用几种化肥和几个小麦品种在若干块试验田里种植小麦,要推断不同的化肥和品种对产量有无显著影响。

可以看到,为了使生产过程稳定,达到优质、高产,需要对影响产品质量的因素进行分析,找出有显著影响的那些因素,除了从机理方面进行研究外,常常要作许多试验,对结果作分析、比较,寻求规律。用数理统计分析试验结果、鉴别各因素对结果影响程度的方法称为方差分析(Analysis Of Variance ),记作ANOV A 。

人们关心的试验结果称为指标,试验中需要考察、可以控制的条件称为因素或因子,因素所处的状态称为水平。上面提到的灯泡寿命问题是单因素试验,小麦产量问题是双因素试验。处理这些试验结果的统计方法就称为单因素方差分析和双因素方差分析。 §1 单因素方差分析

只考虑一个因素A 对所关心的指标的影响,A 取几个水平,在每个水平上作若干个试验,试验过程中除A 外其它影响指标的因素都保持不变(只有随机因素存在),我们的任务是从试验结果推断,因素A 对指标有无显著影响,即当A 取不同水平时指标有无显著差别。

A 取某个水平下的指标视为随机变量,判断A 取不同水平时指标有无显著差别,相当于检验若干总体的均值是否相等。

1.1 数学模型

设A 取r 个水平r A A A ,,,21 ,在水平i A 下总体i x 服从正态分布),(2

i N ,

r i ,,1 ,这里2, i 未知,i 可以互不相同,但假定i x 有相同的方差。又设在每个水平i A 下都作了n 次独立试验,即从中抽取容量为n 的样本,记作n j x ji ,,1, ,

ji x 服从),(2 i N ,n j r i ,,1,,,1 且相互独立。将这些数据列成下表(单因

素试验数据表)的形式:

1A 2A …r A

111x 12x …r x 1 221x 22x …r x 2

n 1n x 2n x …nr x

将第i 列称为第i 组数据。判断A 的r 个水平对指标有无显著影响,相当于要作以下的假设检验

r H 210:;r H ,,,:211 不全相等

由于ji x 的取值既受不同水平i A 的影响,又受i A 固定下随机因素的影响,所以将它分解为

ji i ji x ,r i ,,1 ,n j ,,1 (1)

其中),0(~2

N ji ,且相互独立。记

r

i i r 1

1 , i i ,r i ,,1 (2)

是总均值,i 是水平i A 对指标的效应。由(1)

、(2)模型可表为

n j r i N x ji r i i ji

i ji ,,1,,,1),,0(~0

21

(3) 原假设为(以后略去备选假设)

0:210 r H (4)

1.2 统计分析 记

n j ji i x n x 11, r i r i n

j ji i x rn x r x 111

11 (5)

i x 是第i 组数据的组平均值,x 是总平均值。考察全体数据对x 的偏差平方和

r i n

j ji x x S 11

2)( (6)

经分解可得

r i n

j i ji r i i x x x x n S 11

21

2

)()(

r

i i A x x n S 1

2)( (7)

r

i n

j i ji E x x S 11

2)((8)

E A S S S (9)

A S 是各组均值对总方差的偏差平方和,称为组间平方和;E S 是各组内的数据对均值偏差平方和的总和。A S 反映A 不同水平间的差异,E S 则表示在同一水平下随机误差的

大小。

对E S 和A S 作进一步分析可得

2)1( n r ES E (10)

r

i i A n r ES 1

22

)1( (11)

当0H 成立时

2)1( r ES A (12)

可知若0H 成立,A S 只反映随机波动,而若0H 不成立,那它就还反映了A 的不同水平

的效应i 。单从数值上看,当0H 成立时,由(10)、(12)对于一次试验应有

1)]

1(/[)

1/( n r S r S E A

而当0H 不成立时这个比值将远大于1。当0H 成立时,该比值服从自由度11 r n ,

)1(2 n r n 的F 分布,即

))1(,1(~)]

1(/[)1/( n r r F n r S r S F E A (13)

为检验0H ,给定显著性水平 ,记F 分布的 1分位数为))1(,1(1 n r r F ,检

验规则为

))1(,1(1 n r r F F 时接受0H ,否则拒绝。

以上对S S S E A ,,的分析相当于对组间、组内等方差的分析,所以这种假设检验方法称方差分析。

1.3 方差分析表

最后一列给出的概率相当于1 。

方差分析一般用的显著性水平是:取01.0 ,拒绝0H ,称因素A 的影响(或A 各水平的差异)非常显著;取01.0 ,不拒绝0H ,但取05.0 ,拒绝0H ,称因素A 的影响显著;取05.0 ,不拒绝0H ,称因素A 无显著影响。

1.4 Matlab 实现

Matlab 统计工具箱中单因素方差分析的命令是anoval ,用法为: p=anoval(x)

返回值p 是一个概率,当p 时接受0H ,x 为r n 的数据矩阵(如上面的单因素试验数据表形式),x 的每一列是一个水平的数据。另外,还给出一个方差表和一个Box 图。

例1 为考察5名工人的劳动生产率是否相同,记录了每人4天的产量,并算出其平均值,如下表。你能从这些数据推断出他们的生产率有无显著差别吗?

工人 1A 2A 3A 4A 5A 天

1 256 254 250 248 236

2 242 330 277 280 252

3 280 290 230 305 220

4 298 29

5 302 289 252

平均产量 269.00 292.25 264.75 280.50 240.00 解 编写程序如下:

x=[256 254 250 248 236 242 330 277 280 252 280 290 230 305 220 298 295 302 289 252]; p=anova1(x)

求得05.01109.0 p ,故接受0H ,即5名工人的生产率没有显著差异。方差表对应于上面的单因素方差分析表的5~1列,262.2 F 是)15,4(F 分布的p 1分位数,可以验证

fcdf(2.262,4,15)=0.8891=1-p Box 图反映了各组数据的特征。

注:接受0H ,是将5名工人的生产率作为一个整体进行假设检验的结果,并不表明取其中2个工人的生产率作两总体的均值检验时,也一定接受均值相等的假设。实际上,读者可以用ttest2对本题作520: H 的检验,看看会得到什么结果。 1.5 非均衡数据的方差分析

上面所讨论的情况是r 个样本的容量即各组数据个数相等,称为均衡数据。若各组数据个数不等,称非均衡数据。非均衡数据的方差分析,其数学模型和统计分析的思路和方法与上面一样。

anova1也能处理非均衡数据,与处理均衡数据的区别仅在于数据输入的不同: p=anova1(x,group)

x 为数组,从第1组到第r 组数据依次排列;group 为与x 同长度的数组,标志x 中数据的组别(在与x 第i 组数据相对应的位置处输入整数),,2,1(r i i )。

例2 用4种工艺生产灯泡,从各种工艺制成的灯泡中各抽出了若干个测量其寿命,结果如下表,试推断这几种工艺制成的灯泡寿命是否有显著差异。

工艺 1A 2A 3A 4A 序号

1 1620 1580 1460 1500

2 1670 1600 1540 1550

3 1700 1640 1620 1610

4 1750 1720 1680

5 1800 解 编写程序如下:

x=[1620 1580 1460 1500 1670 1600 1540 1550 1700 1640 1620 1610 1750 1720 1680 1800];

x=[x(1:4),x(16),x(5:8),x(9:11),x(12:15)];

g=[ones(1,5),2*ones(1,4),3*ones(1,3),4*ones(1,4)]; p=anova1(x,g)

求得 0.01

工艺 1A 2A 3A 4A

均值 1708 1635 1540 1585

虽然1A 的均值最大,但要判断它与其它几种有显著差异,尚需作两总体均值的假

设检验。用ttest2检验的结果如下:

原假设 21 31 41

h 0 1 1 p 0.1459 0.0202 0.0408

即1A 与43,A A 有显著差异()05.0 ,但与2A 无显著差异,要想进一步比较优

劣,应增加试验数据。

以上作的几个两总体均值的假设检验,是多重比较的一部分。一般多重比较要对所有r 个总体作两两对比,分析相互间的差异。根据问题的具体情况可以减少对比次数。 §2 双因素方差分析

如果要考虑两个因素B A ,对指标的影响,B A ,各划分几个水平,对每一个水平组合作若干次试验,对所得数据进行方差分析,检验两因素是否分别对指标有显著影响,或者还要进一步检验两因素是否对指标有显著的交互影响。

2.1 数学模型

设A 取r 个水平r A A A ,,,21 ,B 取s 个水平s B B B ,,,21 ,在水平组合),(i j B A 下总体ij x 服从正态分布),(2 ij N ,s i ,,1 ,r j ,,1 。又设在水平组合

),(i j B A 下作了t 个试验,所得结果记作ijk x ,ijk x 服从),(2 ij N ,s i ,,1 ,

r j ,,1 ,t k ,,1 ,且相互独立。将这些数据列成下表的形式:

1A 2A …r A

1B t x x 11111 t x x 12121 …rt r x x 111 2B t x x 21211 t x x 22221 …rt r x x 212

s B t s s x x 111 t s s x x 221 …srt sr x x 1

将ijk x 分解为

ijk ij ijk x ,s i ,,1 ,r j ,,1 ,t k ,,1 (14)

其中),0(~2

N ijk ,且相互独立。记

s i r j ij rs 11

1 , ? r

j ij i r 11 , ?i i

? s

i ij j s 1

1 , ?j j ,i j ij ij (15)

是总均值,j 是水平j A 对指标的效应,i 是水平i B 对指标的效应,ij 是水平j A 与i B 对指标的交互效应。模型表为

t k r j s i N x ijk

r

j s i s i r

j ij ij i j ijk ij j i ijk ,,1,,,1,,,1),,0(~0

,0,021

111 (16) 原假设为

),,1(0:01r j H j

),,1(0:02s i H i

),,1,,,1(0:03r j s i H ij

2.2 无交互影响的双因素方差分析

如果根据经验或某种分析能够事先判定两因素之间没有交互影响,每组试验就不必重复,即可令1 t ,过程大为简化。 2.3 Matlab 实现

统计工具箱中用anova2作双因素方差分析。命令为 p=anova2(x,reps)

其中x 不同列的数据表示单一因素的变化情况,不同行中的数据表示另一因素的变化情况。如果每种行—列对(“单元”)有不止一个的观测值,则用参数reps 来表明每个“单元”多个观测值的不同标号,即reps 给出重复试验的次数t 。下面的矩阵中,列因素有3种水平,行因素有两种水平,但每组水平有两组样本,相应地用下标来标识:

232222

212

231221211132122112131121111x x x x x x x x x x x x 例3 一火箭使用了4种燃料,3种推进器作射程试验,每种燃料与每种推进器的

否有显著差异?交互作用是否显著?

解 编写程序如下: clc,clear

x0=[58.2,52.6 56.2,41.2 65.3,60.8 49.1,42.8 54.1,50.5 51.6,48.4 60.1,58.3 70.9,73.2 39.2,40.7 75.8,71.5 58.2,51.0 48.7,41.4]; x1=x0(:,1:2:5);x2=x0(:,2:2:6); for i=1:4

x(2*i-1,:)=x1(i,:); x(2*i,:)=x2(i,:); end

p=anova2(x,2)

求得p=0.0035 0.0260 0.001,表明各试验均值相等的概率都为小概率,故可拒绝均值相等假设。即认为不同燃料(因素A )、不同推进器(因素B )下的射程有显著差异,交互作用也是显著的。

习 题 十 一

1. 将抗生素注入人体会产生抗生素与血浆蛋白质结合的现象,以致减少了药效。下表列出5种常用的抗生素注入到牛的体内时,抗生素与血浆蛋白质结合的百分比。试在水平t x x 11111 下检验这些百分比的均值有无显著的差异。设各总体服从正态分布,

小块,对种子和化肥的每一种组合种植3小块田,产量如下表所示(单位公斤),问品

前面我们讲过曲线拟合问题。曲线拟合问题的特点是,根据得到的若干有关变量的一组数据,寻找因变量与(一个或几个)自变量之间的一个函数,使这个函数对那组数据拟合得最好。通常,函数的形式可以由经验、先验知识或对数据的直观观察决定,要作的工作是由数据用最小二乘法计算函数中的待定系数。从计算的角度看,问题似乎已经完全解决了,还有进一步研究的必要吗?

从数理统计的观点看,这里涉及的都是随机变量,我们根据一个样本计算出的那些系数,只是它们的一个(点)估计,应该对它们作区间估计或假设检验,如果置信区间太大,甚至包含了零点,那么系数的估计值是没有多大意义的。另外也可以用方差分析方法对模型的误差进行分析,对拟合的优劣给出评价。简单地说,回归分析就是对拟合问题作的统计分析。

具体地说,回归分析在一组数据的基础上研究这样几个问题:

(i )建立因变量y 与自变量m x x x ,,,21 之间的回归模型(经验公式);

(ii )对回归模型的可信度进行检验;

(iii )判断每个自变量),,2,1(m i x i 对y 的影响是否显著;

(iv )诊断回归模型是否适合这组数据; (v )利用回归模型对y 进行预报或控制。 §1 多元线性回归

回归分析中最简单的形式是x y 10 ,y x ,均为标量,10, 为回归系数,称一元线性回归。它的一个自然推广是x 为多元变量,形如

m m x x y 110 (1)

2 m ,或者更一般地

)()(110x f x f y m m (2)

其中),,(1m x x x ,),,1(m j f j 是已知函数。这里y 对回归系数

),,,(10m 是线性的,称为多元线性回归。不难看出,对自变量x 作变量代

换,就可将(2)化为(1)的形式,所以下面以(1)为多元线性回归的标准型。

1.1 模型

在回归分析中自变量),,,(21m x x x x 是影响因变量y 的主要因素,是人们能控制或能观察的,而y 还受到随机因素的干扰,可以合理地假设这种干扰服从零均值的正态分布,于是模型记作

)

,0(~2

110

N x x y m m (3) 其中 未知。现得到n 个独立观测数据),,,(1im i i x x y ,m n n i ,,,1 ,由(3)

n

i N x x y i i

im m i i ,,1),,0(~2

110 (4) 记

nm n m x x x x X

1

111

11,

n y y Y 1 (5)

T n ][1

,T m ][10

(4)表为

),0(~2

N X Y (6) 1.2 参数估计

用最小二乘法估计模型(3)中的参数 。 由(4)式这组数据的误差平方和为

n

i T i X Y X Y Q 1

2)()()( (7)

求 使)( Q 最小,得到 的最小二乘估计,记作

?,可以推出 Y X X X T T 1)(?

(8) 将

?代回原模型得到y 的估计值 m

m x x y ????110 (9) 而这组数据的拟合值为 ??X Y

,拟合误差Y Y e ? 称为残差,可作为随机误差 的估计,而

n i n

i i i i

y

y e Q 1

1

22

)?( (10) 为残差平方和(或剩余平方和),即)?(

Q 。 1.3 统计分析

不加证明地给出以下结果:

(i )

?是 的线性无偏最小方差估计。指的是 ?是Y 的线性函数; ?的期望等于

;在 的线性无偏估计中,

?的方差最小。 (ii )

?服从正态分布 ))(,(~?12 X X N T

(11) (iii )对残差平方和Q ,2

)1( m n EQ ,且 )1(~2

2 m n Q

(12) 由此得到2

的无偏估计

22?1

m n Q

s (13) 2s 是剩余方差(残差的方差)

,s 称为剩余标准差。 (iv )对总平方和

n

i i

y y

S 1

2)(进行分解,有

U Q S , n

i i y y

U 1

2)?( (14) 其中Q 是由(10)定义的残差平方和,反映随机误差对y 的影响,U 称为回归平方和,

反映自变量对y 的影响。

1.4 回归模型的假设检验

因变量y 与自变量m x x ,,1 之间是否存在如模型(1)所示的线性关系是需要检验

的,显然,如果所有的|?|j

),,1(m j 都很小,y 与m x x ,,1 的线性关系就不明显,所以可令原假设为

),,1(0:0m j H j

当0H 成立时由分解式(14)定义的Q U ,满足

)1,(~)

1/(/

m n m F m n Q m

U F (15)

在显著性水平 下有 1分位数)1,(1 m n m F ,若)1,(1 m n m F F ,接

受0H ;否则,拒绝。

注意 拒绝0H 只说明y 与m x x ,,1 的线性关系不明显,可能存在非线性关系,如平方关系。

还有一些衡量y 与m x x ,,1 相关程度的指标,如用回归平方和在总平方和中的比值定义

S

U

R

2 (16) ]1,0[ R 称为相关系数,R 越大,y 与m x x ,,1 相关关系越密切,通常,R 大于0.8

(或0.9)才认为相关关系成立。

1.5 回归系数的假设检验和区间估计

当上面的0H 被拒绝时,j 不全为零,但是不排除其中若干个等于零。所以应进一步作如下m 个检验),,1(m j :

0:)(0 j j H

由(11)式,),(~?2jj

j j c N ,jj c 是1)( X X T 对角线上的元素,用2s 代替2 ,由(11)~(13)式,当)

(0j H 成立时

)1(~)

1/(/?

m n t m n Q c t jj j j (17)

对给定的 ,若)1(||2

1

m n t

t j ,接受)

(0j H ;否则,拒绝。

(17)式也可用于对j 作区间估计(m j ,,1,0 ),在置信水平 1下,j 的置信区间为

])1(?,)1(?[2

12

1jj j

jj j

c s m n t c s m n t

(18)

其中1

m n Q

s 。

1.6 利用回归模型进行预测 当回归模型和系数通过检验后,可由给定的),,(0010m x x x 预测0y ,0y 是随机的,显然其预测值(点估计)为

m

m x x y 001100???? (19) 给定 可以算出0y 的预测区间(区间估计),结果较复杂,但当n 较大且i x 0接近平均值i x 时,0y 的预测区间可简化为

]?,?[2

102

10s u y

s u y

(20)

其中2

1

u

是标准正态分布的2

1

分位数。 对0y 的区间估计方法可用于给出已知数据残差i i i y

y e ? ),,1(n i 的置信区间,i e 服从均值为零的正态分布,所以若某个i e 的置信区间不包含零点,则认为这个数据是异常的,可予以剔除。

1.7 Matlab 实现

Matlab 统计工具箱用命令regress 实现多元线性回归,用的方法是最小二乘法,用法是:

b=regress(Y ,X)

其中Y ,X 为按(5)式排列的数据,b 为回归系数估计值m

?,,?,?10 。 [b,bint,r,rint,stats]=regress(Y ,X,alpha)

这里Y ,X 同上,alpha 为显著性水平(缺省时设定为0.05),b,bint 为回归系数估计值和它们的置信区间,r,rint 为残差(向量)及其置信区间,stats 是用于检验回归模型的统

计量,有三个数值,第一个是2

R (见(16)式),第二个是F (见(15)式),第3个是与F 对应的概率p , p 拒绝0H ,回归模型成立。

残差及其置信区间可以用rcoplot(r,rint)画图。

例1 合金的强度y 与其中的碳含量x 有比较密切的关系,今从生产中收集了一批

数据如下表:

x 0.10 0.11 0.12 0.13 0.14 0.15 0.16 0.17 0.18 y 42.0 41.5 45.0 45.5 45.0 47.5 49.0 55.0 50.0 试先拟合一个函数)(x y ,再用回归分析对它进行检验。

解 先画出散点图: x=0.1:0.01:0.18;

y=[42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0]; plot(x,y,'+')

可知y 与x 大致上为线性关系。 设回归模型为

x y 10 (21) 用regress 和rcoplot 编程如下: clc,clear

x1=[0.1:0.01:0.18]';

y=[42,41.5,45.0,45.5,45.0,47.5,49.0,55.0,50.0]'; x=[ones(9,1),x1];

[b,bint,r,rint,stats]=regress(y,x); b,bint,stats,rcoplot(r,rint) 得到

b =27.4722 137.5000 bint =18.6851 36.2594 75.7755 199.2245

stats =0.7985 27.7469 0.0012

即4722.27?0 ,5000.137?1 ,0

? 的置信区间是[18.6851,36.2594],1? 的置信区间是[75.7755,199.2245];7985.02

R ,7469.27 F ,0012.0 p 。

可知模型(21)成立。

观察命令rcoplot(r,rint)所画的残差分布,除第8个数据外其余残差的置信区间均包含零点,第8个点应视为异常点,将其剔除后重新计算,可得

b =30.7820 109.3985 bint =26.2805 35.2834 76.9014 141.8955

stats =0.9188 67.8534 0.0002 应该用修改后的这个结果。

例 2 某厂生产的一种电器的销售量y 与竞争对手的价格1x 和本厂的价格2x 有关。下表是该商品在10个城市的销售记录。

1x 元 120 140 190 130 155 175 125 145 180 150

2x 元 100 110 90 150 210 150 250 270 300 250 Y 个 102 100 120 77 46 93 26 69 65 85

y 与1x 和2x 的关系式,对得到的模型和系数进行检验。若某市本

厂产品售价160(元),竞争对手售价170(元),预测商品在该市的销售量。

解 分别画出y 关于1x 和y 关于2x 的散点图,可以看出y 与2x 有较明显的线性关系,而y 与1x 之间的关系则难以确定,我们将作几种尝试,用统计分析决定优劣。

设回归模型为

22110x x y (22)

编写如下程序:

x1=[120 140 190 130 155 175 125 145 180 150]'; x2=[100 110 90 150 210 150 250 270 300 250]'; y=[102 100 120 77 46 93 26 69 65 85]'; x=[ones(10,1),x1,x2];

[b,bint,r,rint,stats]=regress(y,x); b,bint,stats 得到

b =66.5176 0.4139 -0.2698 bint =-32.5060 165.5411 -0.2018 1.0296 -0.4611 -0.0785

stats =0.6527 6.5786 0.0247

可以看出结果不是太好:0247.0 p ,取05.0 时回归模型(22)可用,但取

01.0 则模型不能用;6527.02 R 较小;1

0?,? 的置信区间包含了零点。下面将试图用21,x x 的二次函数改进它。

1.8 多项式回归

如果从数据的散点图上发现y 与x 呈较明显的二次(或高次)函数关系,或者用线性模型(1)的效果不太好,就可以选用多项式回归。

1.8.1一元多项式回归

一元多项式回归可用命令polyfit 实现。

例3 将17至29岁的运动员每两岁一组分为7组,每组两人测量其旋转定向能力,以考察年龄对这种运动能力的影响。现得到一组数据如下表: 年龄 17 19 21 23 25 27 29 第一人 20.48 25.13 26.15 30.0 26.1 20.3 19.35 第二人 24.35 28.11 26.3 31.4 26.92 25.7 21.3 试建立二者之间的关系。

解 数据的散点图明显地呈现两端低中间高的形状,所以应拟合一条二次曲线。 选用二次模型

0122a x a x a y (23)

编写如下程序:

x0=17:2:29;x0=[x0,x0];

y0=[20.48 25.13 26.15 30.0 26.1 20.3 19.35... 24.35 28.11 26.3 31.4 26.92 25.7 21.3]; [p,s]=polyfit(x0,y0,2); p 得到

p =-0.2003 8.9782 -72.2150

即2003.02 a ,9782.81 a ,2150.720 a 。 上面的s 是一个数据结构,用于计算函数值,如 [y,delta]=polyconf(p,x0,s);y

得到y 的拟合值,及预测值y 的置信区间半径delta 。

182022242628

10

15

20

25

30

35

在画面中绿色曲线为拟合曲线,它两侧的红线是y 的置信区间。你可以用鼠标移动图中的十字线来改变图下方的x 值,也可以在窗口内输入,左边就给出y 的预测值及其置信区间。通过左下方的Export 下拉式菜单,可以输出回归系数等。这个命令的用法与下面将介绍的rstool 相似。

1.8.2多元二项式回归

统计工具箱提供了一个作多元二项式回归的命令rstool ,它也产生一个交互式画面,并输出有关信息,用法是

rstool(x,y,model,alpha)

其中输入数据x,y 分别为m n 矩阵和n 维向量,alpha 为显著性水平 (缺省时设定为0.05),model 由下列4个模型中选择1个(用字符串输入,缺省时设定为线性模型): linear(线性):m m x x y 110

purequadratic(纯二次): m

j j jj

m m x x x y 1

2110

interaction (交叉):

m

k j k j jk

m m x x x x y 1110

quadratic(完全二次):

m

k j k j jk

m m x x x x y ,1110

我们再作一遍例2 商品销售量与价格问题,选择纯二次模型,即

2

222211122110x x x x y (24)

编程如下:

x1=[120 140 190 130 155 175 125 145 180 150]'; x2=[100 110 90 150 210 150 250 270 300 250]'; y=[102 100 120 77 46 93 26 69 65 85]'; x=[x1 x2];

rstool(x,y,'purequadratic')

140160180-100

0100200300150200250

得到一个如图所示的交互式画面,左边是1(=151)固定时的曲线)1及其置信区间,右边是2x (=188)固定时的曲线)(2x y 及其置信区间。用鼠标移动图中的十字线,或在图下方窗口内输入,可改变21,x x 。图左边给出y 的预测值及其置信区间,就用这种画面可以回答例2提出的“若某市本厂产品售价160(元),竞争对手售价170(元),预测该市的销售量”问题。

图的左下方有两个下拉式菜单,一个菜单Export 用以向Matlab 工作区传送数据,包括beta(回归系数),rmse (剩余标准差),residuals(残差)。模型(24)的回归系数和剩余标准差为

beta =-312.5871 7.2701 -1.7337 -0.0228 0.0037 rmse =16.6436

另一个菜单model 用以在上述4个模型中选择,你可以比较一下它们的剩余标准差,会发现以模型(24)的rmse=16.6436最小。 §2 非线性回归和逐步回归

本节介绍怎样用Matlab 统计工具箱实现非线性回归和逐步回归。 2.1 非线性回归

非线性回归是指因变量y 对回归系数m ,,1 (而不是自变量)是非线性的。Matlab 统计工具箱中的nlinfit ,nlparci ,nlpredci ,nlintool ,不仅给出拟合的回归系数,而且可以给出它的置信区间,及预测值和置信区间等。下面通过例题说明这些命令的用法。

例4 在研究化学动力学反应过程中,建立了一个反应速度和反应物含量的数学模型,形式为

3

322115

3

241x x x x x y

其中51,, 是未知的参数,321,,x x x 是三种反应物(氢,n 戊烷,异构戊烷)的含量,y 是反应速度。今测得一组数据如下表,试由此确定参数51,, ,并给出其置信区间。51,, 的参考值为(0.1,0.05,0.02,1,2)。

序号 反应速度y 氢1x n 戊烷2x 异构戊烷3x

1 8.55 470 300 10

2 3.79 285 80 10

3 4.82 470 300 120

4 0.02 470 80 120

5 2.75 470 80 10

6 14.39 100 190 10

7 2.54 100 80 65

8 4.35 470 190 65

9 13.00 100 300 54

10 8.50 100 300 120

11 0.05 100 80 120

12 11.32 285 300 10

13 3.13 285 190 120

解首先,以回归系数和自变量为输入变量,将要拟合的模型写成函数文件huaxue.m:

function yhat=huaxue(beta,x);

yhat=(beta(4)*x(:,2)-x(:,3)/beta(5))./(1+beta(1)*x(:,1)+...

beta(2)*x(:,2)+beta(3)*x(:,3));

然后,用nlinfit计算回归系数,用nlparci计算回归系数的置信区间,用nlpredci 计算预测值及其置信区间,编程如下:

clc,clear

x0=[ 1 8.55 470 300 10

2 3.79 285 80 10

3 4.82 470 300 120

4 0.02 470 80 120

5 2.75 470 80 10

6 14.39 100 190 10

7 2.54 100 80 65

8 4.35 470 190 65

9 13.00 100 300 54

10 8.50 100 300 120

11 0.05 100 80 120

12 11.32 285 300 10

13 3.13 285 190 120];

x=x0(:,3:5);

y=x0(:,2);

第二讲数学建模的基本方法和步骤

第二讲 数学建模的基本方法与步骤 数学建模面临的实际问题就是多种多样的,建模的目的不同、分析的方法不同、采用的数学工具不同,所得模型的类型也不同,我们不能指望归纳出若干条准则,适用于一切实际问题的数学建模方法。下面所谓基本方法不就是针对具体问题而就是从方法论的意义上讲的。(注:用最初等的方法解决,越受人尊重) 一 数学建模的基本方法 一般说来数学建模的方法大体上可分为机理分析与测试分析两种。 ????????????? 机理分析: 是根据对客观事物特性的认识,找出反映内部机理的数 量规律,建立的数学模型常有明确的物理或现实意义。 建模方法测试分析: 将研究对象看作一个“黑箱”(意思是内部机理看不清 楚),通过对测量数据的统计分析,找出与数据拟合最 好的模型。 面对于一个实际问题用哪一种方法建模,主要取决于人们对研究对象的了解程度与建模目的。如果掌握了一些内部机理的知识,模型也要求具有反映内部特征的物理意义,建模就应以机理分析为主。而如果对象的内部机理规律基本上不清楚,模型也不需要反映内部特征,那么可以用测试分析。对于许多实际问题也常常将两种方法结合起来,用机理分析建立模型结构,用测试分析确定模型的参数。 二 数学建模的一般步骤 建模要经过哪些步骤并没有一定的模式,通常与问题性质与建模的目的等有关。下面给出建模的一般步骤,如图1、2所示。 ⑴ 模型准备:了解实际背景,明确建模目的,搜索必要信息,弄清对象的主要特征,形成一个比较清晰的“问题”(即问题的提出)。情况明才能方法对,在这个阶段要深入调查研究,虚心向实际工作者请教,尽量掌握第一手资料。

⑵模型假设:根据对象的特征与建模目的,抓住问题的本质,忽略次要因素,作出必要的、合理的简化假设。对于建模的成败这就是非常重要与困难的一步。假设不合理或太简单,会导致错误的或无用的模型;假设作得过分详细,试图把复杂对象的众多因素都考虑进去,会使您很难或无法继续下一步的工作。常常需要在合理与简化之间作出恰当的折衷,要不段积累经验,并注意培养与充分发挥对事物的洞察力与判断力。 ⑶模型的建立:根据假设,用数学的语言、符号描述对象的内在规律,得到一个数学结构。这里除了需要一些相关的专门知识外,还常常需要较为广阔的应用数学方面的知识,要善于发挥想象力,注意使用类比法,分析对象与熟悉的其她对象的共性,借用已有的数学模型。建模时还应遵循的一个原则就是尽量采用简单数学工具,因为您的模型总希望更多的人了解与使用,而不就是只供少数专家欣赏。 ⑷模型求解:使用各种数学方法、数学软件与计算机技术对模型求解。 ⑸模型分析:对求解结果进行数学上的分析,如对结果进行误差分析,分析模型对数据的稳定性或灵敏性等。 ⑹模型检验:把求解与分析结果翻译回到实际问题,与实际现象、数据进行比较,检验模型的合理性与适用性。如果结果与实际不符,问题常常出现在模型假设上,应该修改或补充假设,重新建模。这一步对于模型就是否真的有用就是非常关键的,要以严肃认真的态度对待。 ⑺模型应用:这与问题的性质、建模的目的以及最终结果有关,一般不属于本书讨论的范围。 应该指出,并不就是所有问题的建模都要经过这些步骤,有时各步骤之间的界限也不那么分明,建模时不要拘泥于形式上的按部就班。 三数学建模的全过程 数学建模的全过程可分为表述、求解、解释、验证几个阶段,并且通过这些阶段完成从现实对象到数学模型,再从数学模型回到现实对象的循环,如图1、3所示。 表述就是根据建模目的与信息将实际问题“翻译”成数学问题,即将现实问题“翻译”成抽象的数学问题,属于归纳法。数学模型的求解选择适当的数学方

数学建模——回归分析

回归分析——20121060025 吕佳琪 企业编号生产性固定资产价值(万元)工业总产值(万元) 1318524 29101019 3200638 4409815 5415913 6502928 7314605 812101516 910221219 1012251624 合计65259801 (2)建立直线回归方程; (3)计算估价标准误差; (4)估计生产性固定资产(自变量)为1100万元时总产值(因变量)的可能值。解: (1)画出散点图,观察二变量的相关方向 x=[318 910 200 409 415 502 314 1210 1022 1225]; y=[524 1019 638 815 913 928 605 1516 1219 1624]; plot(x,y,'or') xlabel('生产性固定资产价值(万元)') ylabel('工业总产值(万元)') 由图形可得,二变量的相关方向应为直线 (2)

x=[318 910 200 409 415 502 314 1210 1022 1225]; y=[524 1019 638 815 913 928 605 1516 1219 1624]; X = [ones(size(x))', x']; [b,bint,r,rint,stats] = regress(y',X,0、05); b,bint,stats b = 395、5670 0、8958 bint = 210、4845 580、6495 0、6500 1、1417 stats = 1、0e+004 * 0、0001 0、0071 0、0000 1、6035 上述相关系数r为1,显著性水平为0 Y=395、5670+0、8958*x (3) 计算方法:W=((Y1-y1)^2+……+(Y10-y10)^2)^(1/2)/10 利用SPSS进行回归分析:

层次分析报告法在数学建模中的应用

层次分析法在数学建模中的应用 摘要:人们在生活中处理一些决策问题的时候,要考虑的因素有多有少,有大有小,但是 一个共同的特点是它们通常都涉及到经济 、社会、 人文等方面的因素。在作比较、 判断 、 评价、 决策时,这些因素的重要性 影响力或者优先程度往往难以量化,人的主观选择会起 着相当主要的作用,这就给用一般的数学方法解决问题带来本质上的困难。这是就有人提出 了一种能有效地处理这样一类问题的实用方法,称为层次分析法,这是一种定性和定量相结 合的、系统化、层次化的分析方法。以及在对层次分析法的引入基础之上,建立层次分析模 型,并给出了层次分析的求解过程,以及在现实生活中的应用。 关键词:层次分析法;成对比较矩阵;权向量;一致性指标;一致性比率 一. 问题的提出:人们在日常生活中常常碰到许多决策问题:请朋友吃饭要筹划是办家宴还是去饭店,是吃中餐、西餐还是自助餐;假期旅游和科研成果的评价。诸如此类问题面临抉择,就要慎重考虑,反复比较,尽可能满意的决策。 然而人们在处理上面这些决策问题的时候,要考虑的因素有多有少,有大有小,但是一个共同的特点是它们通常都涉及经济社会和人文等方面的因素。在做比较、判断、评价、决策时,这些因素的重要性、影响力或者优先程度难以量化,人的主观选择会起着相当重要的作用。T.L.Saaty 等人在20世纪70年代提出了一种能有效地处理这样一类问题的实用方法,称为层次分析法(简称AHP ),这是一种定性和定量相结合的、系统化、层次化的分析方法。 二. 层次分析法的基本步骤 1.将决策问题分解为三个层次。最上层为目标层,最下层为方案层,中间层为准则层。 2.通过相互比较确定各准则对于目标的权重,及各方案对于每一准则的权重,这些权重在人的思想过程常是定性的,而在层次分析法中则要给出得到权重的定量方法。 3.将方案层对准则层的权重及准则层对目标层的权重进行综合,最终确定方案层对目标层的权重。在层次分析法中要给出进行综合的计算方法。 三. 构造成对比较阵、计算权向量并做一致性检验;计算组合权向量并做组合一致性检验。 1.成对比较矩阵和权向量 所有因素两两相互对比,对比时采用相对尺度,以尽可能减少性质不同的诸因素相互对比的困难,提高准确度。 假设要比较某一层n 个因素对12,n c c c 上层一个因素O 的影响,每次取两个

建立数学建模案例分析

§15.4锁具装箱问题 [学习目标] 1.能表述锁具装箱问题的分析过程; 2.能表述模型的建立方法; 3.会利用排列组合来计算古典概型; 4.会利用Mathematica求解锁具装箱问题。 一、问题 某厂生产一种弹子锁具,每个锁具的钥匙有5个槽,每个槽的高度从{1,2,3,4,5,6}6个数(单位从略)中任取一数。由于工艺及其它原因,制造锁具时对5个槽的高度有两个要求:一是至少有3个不同的数;二是相邻两槽的高度之差不能为5。满足上述两个条件制造出来的所有互不相同的锁具称为一批。销售部门在一批锁具中随意地抽取,每60个装一箱出售。 从顾客的利益出发,自然希望在每批锁具中不能互开(“一把钥匙开一把锁”)。但是,在当前工艺条件下,对于同一批中两个锁具是否能够互开,有以下实验结果:若二者相对应的5个槽的高度中有4个相同,另一个槽的高度差为1,则可能互开;在其它情况下,不可能互开。 团体顾客往往购买几箱到几十箱,他们会抱怨购得的锁具中出现互开的情形。现请回答以下问题: 1.每批锁具有多少个,能装多少箱? 2.按照原来的装箱方案,如何定量地衡量团体顾客抱怨互开的程度(试对购买一、二箱者给出具体结果)。 二、问题分析与建立模型 因为弹子锁具的钥匙有5个槽,每个槽的高度从{1,2,3,4,5,6}这6个数中任取一数,且5个槽的高度必须满足两个条件:至少有3个不同的数;相邻两槽的高度之差不能为5。所以我们在求一批锁具的总数时,应把问题化为三种情况,即5个槽的高度由5个不同数字组成、由4个不同数字组成、由3个不同数字组成,分别算出各种情况的锁具个数,然后相加便得到一批锁具的总个数。在分别求这三种情况锁具个数的时候,先求出满足第1个条件的锁具个数再减去不满足第2个条件的锁具个数。在求这三种情况锁具个数的时候,主要依靠排列组合的不尽相异元素的全排列公式。 下面用一个5元数组来表示一个锁具: Key=(h1,h2,h3,h4,h5) 其中h i表示第i个槽的高度,i=1,2,3,4,5。此5元数组表示一把锁,应满足下述条件: 条件1:h i∈{1,2,3,4,5,6},i = 1,2,3,4,5。

数学建模主成分分析方法

主 成分分析方法 地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息事实上,这种想法是可以实现的,这里介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。 一、主成分分析的基本原理 主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:

111212122212p p n n np x x x x x x X x x x ???=????L L L L L L L (1) 如何从这么多变量的数据中抓住地理事物的内在规律性呢要解决这一问题,自然要在p 维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。 如果记原来的变量指标为x 1,x 2,…,x p ,它们的综合指标——新变量指标为z 1,z 2,…,zm (m≤p)。则 11111221221122221122,,......................................... ,p p p p m m m mp p z l x l x l x z l x l x l x z l x l x l x =+++??=+++????=+++?L L L (2)

第1章 数学建模与误差分析

第1章数学建模与误差分析 1.1 数学与科学计算 数学是科学之母,科学技术离不开数学,它通过建立数学模型与数学产生紧密联系,数学又以各种形式应用于科学技术各领域。数学擅长处理各种复杂的依赖关系,精细刻画量的变化以及可能性的评估。它可以帮助人们探讨原因、量化过程、控制风险、优化管理、合理预测。近几十年来由于计算机及科学技术的快速发展,求解各种数学问题的数值方法即计算数学也越来越多地应用于科学技术各领域,相关交叉学科分支纷纷兴起,如计算力学、计算物理、计算化学、计算生物、计算经济学等。 科学计算是指利用计算机来完成科学研究和工程技术中提出的数学问题的计算,是一种使用计算机解释和预测实验中难以验证的、复杂现象的方法。科学计算是伴随着电子计算机的出现而迅速发展并获得广泛应用的新兴交叉学科,是数学及计算机应用于高科技领域的必不可少的纽带和工具。科学计算涉及数学的各分支,研究它们适合于计算机编程的数值计算方法是计算数学的任务,它是各种计算性学科的联系纽带和共性基础,兼有基础性和应用性的数学学科。它面向的是数学问题本身而不是具体的物理模型,但它又是各计算学科共同的基础。 随着计算机技术的飞速发展,科学计算在工程技术中发挥着愈来愈大的作用,已成为继科学实验和理论研究之后科学研究的第三种方法。在实际应用中所建立的数学模型其完备形式往往不能方便地求出精确解,于是只能转化为简化模型,如将复杂的非线性模型忽略一些因素而简化为线性模型,但这样做往往不能满足精度要求。因此,目前使用数值方法来直接求解较少简化的模型,可以得到满足精度要求的结果,使科学计算发挥更大作用。了解和掌握科学计算的基本方法、数学建模方法已成为科技人才必需的技能。因此,科学计算与数学建模的基本知识和方法是工程技术人才必备的数学素质。 1.2 数学建模及其重要意义 数学,作为一门研究现实世界数量关系和空间形式的科学,在它产生和发展的历史长河中,一直是和人们生活的实际需要密切相关。用数学方法解决工程实际和科学技术中的具体问题时,首先必须将具体问题抽象为数学问题,即建立起能描述并等价代替该实际问题的数学模型,然后将建立起的数学模型,利用数学理论和计算技术进行推演、论证和计算,得到欲求解问题的解析解或数值解,最后用求得的解析解和数值解来解决实际问题。本章主要介绍数学建模基本过程和求解数学问题数值方法的误差传播分析。 1.2.1 数学建模的过程 数学建模过程就是从现实对象到数学模型,再从数学模型回到现实对象的循环,一般通过表述、求解、解释、验证几个阶段完成。数学建模过程如图1.2.1所示,数学模型求解方法可分为解析法和数值方法,如图1.2.2所示。 表述是将现实问题“翻译”成抽象的数学问题,属于归纳。数学模型的求解方法则属于演绎。归纳是依据个别现象推出一般规律;演绎是按照普遍原理考察特定对象,导出结论。演绎利用严格的逻辑推理,对解释现象做出科学预见,具有重要意义,但是它要以归纳的结论作为公理化形式的前提,只有在这个前提下

基于层次分析法的数学建模

基于层次分析法研究云南烟草品牌竞争力 摘要 与国外知名烟草品牌相比,国内的烟草品牌存在着品牌集中度不够,品牌多、杂、散、小;品牌定位模糊,市场占有率低;品牌形象乱,品牌美誉度低,消费者购买行为习惯化导致忠诚度差等问题,因此,本文采用层次分析法对在中国烟草行业中有着举足轻重地位的云南省烟草品牌竞争力进行了评价研究,分析云南烟草业品牌现状,提出品牌竞争力的影响因素,对提高云南烟草业的品牌竞争力、解决烟草业存在的问题提供一定的帮助。 关键词:烟草品牌云南烟草品牌竞争力层次分析法 一、问题重述 近年来,我国一直推进实施卷烟工业的整合重组、卷烟品牌的淘汰和优化。但是,由于之前的卷烟品牌众多;截止到 2009 年底我国的烟草企业有 30 家,卷烟品牌 138 个,所以目前我国烟草企业之间的竞争非常激烈,行业内有众多势均力敌的竞争对手。当今卷烟产品差异化日渐缩小,消费者购买时会更看重品牌价值和品牌文化,使烟草行业内部面临着激烈的竞争,以具有代表性的云烟为实证,分析云南烟草企业的品牌竞争力及影响品牌竞争力的主要因素,并提出提高云烟品牌竞争力的对策建议。

二、问题分析 (1)云南卷烟近年情况分析 图1为云产卷烟在全国各地区的销量情况,有颜色部分为云南卷烟销量均超过15.58万箱,在全国卷烟销售中占有很大份额。2008 年卷烟品牌为16个,比2003年的36个减少了 20个。作为全国卷烟产销量最大的省份,2009 年云南的产销量达到 3667.9 亿支。在卷烟产量增幅较小的情况下,2008 年云南烟草工业税利为 577 亿元,比2003 年的 330 亿元增加了 247 亿元。因此,分析云南卷烟品牌竞争力有助于对云南卷烟品牌做出适当的规划调整,很大程度上能够促进云南经济的发展。(数据为云南中烟系统中2015年 云产卷烟销量数据) 图1

数学建模案例分析--对策与决策方法建模6决策树法

§6 决策树法 对较为复杂的决策问题,特别是需要做多个阶段决策的问题,最常用的方法是决策树法。决策树法是把某个决策问题未来发展情况的可能性和可能结果所做的预测用树状图画出来。其步骤如下: 1、用方框表示决策点。从决策点画出若干条直线或折线,每条线代表一个行动方案,这样的直线或折线称为方案枝。 2、在各方案枝的末端画一个园圈,称为状态点,从状态点引出若干直线或折线,每条线表示一个状态,在线的旁边标出每个状态的概率,称为概率枝。 3、把各方案在各个状态下的损益期望值算出标记在概率枝的末端。 4、把计算得到的每个方案的损益期望值标在状态点上,然后通过比较,选出损益期望值最小的方案为最优方案。 例1某厂准备生产一种新产品,产量可以在三种水平n1、n2、n3中作决策。该产品在市场上的销售情况可分为畅销、一般和滞销三种情况,分别为S1、S2、S3。通过调查,预测市场处于这三种情况的概率分别为0.5、0.3、0.2。三种决策在各种不同市场情况下的利润见下表: 表1 基于各种决策的各种市场情况的利润表(万元) 我们可以计算每种决策下利润的期望值: 实行在水平n1下生产的利润的期望值为:90×0.5+30×0.3-60×0.2=42 实行在水平n2下生产的利润的期望值为:60×0.5+50×0.3-10×0.2=43 实行在水平n3下生产的利润的期望值为:10×0.5+9×0.3-6×0.2=6.5 由于在水平n2下生产利润的期望值最大,因而应选择产量水平n2生产。 可以应用决策树帮助解决这样的决策问题,把各种决策和情况画在图1上: 图1

图中的方框(□)称为决策点,圆圈(○)称为状态点,从方框出发的线段称为对策分支,表示可供选择的不同对策。在圆圈下面的线段称为概率分支,表示在此种对策下可能出现的各种情况。在概率分支上注明了该情况出现的概率。在每一个概率分支的末端注明了对应对策和对应情况下的收益(利润)。在计算时,我们把相应的期望值写在相应的状态点旁边,再由比较大小后选择最优决策,在图上用∥表示舍弃非最优的对策,并在决策点上注明最优决策所对应的期望利润。 图2 利用决策树还可以解决多阶段的决策问题。 例2 某公司在开发一种新产品前通过调查推知,该产品未来的销售情况分前三年和后三年两种情况。因此生产该产品有两种可供选择的方案:建造大厂和建造小厂。如果建造大厂,投资费用5000万元,当产品畅销时,每年可获利2000万元,当产品滞销时,每年要亏损120万元。如果建造小厂,投资费用1000万元,当产品畅销时,每年可获利300万元,当产品滞销时,每年仍可获利150万元。若产品畅销可考虑在后三年再扩建,扩建投资需2000万元,随后三年每年可获利1000万元;也可不再扩建。预测这六年该产品畅销的概率为0.6,滞销的概率为0.4。试分析该公司开发新产品应如何决策? 根据问题的各种情况可以画出决策树如下:这是一个两阶段的决策问题。注意到图中有两个决策点,反映建小厂的方案中可以分成前三年和后三年两个阶段,并在后三年还要做出一次决策。 图3 把各种数据填到图适当的位置后,由后向前计算获利的期望值。由图可见应采用决策:建造大厂。 500 900 1000*3=3000 300*3=900 6.5

《数值分析与数学建模》

2007-2008学年第一学期《数值分析与数学建模》课程考核题目 说明: 本次考核题目共有五个部分,请从每一部分中任选一题作答。选择时请注意:每题难度不同分值也有所不同。 完成时间:2007-2008学年第二学期开学第一周前三个工作日,过期无效。 答卷提交方式:手写稿或打印稿请直接交到5号楼202室;电子稿可以发送Email 至 tzl99@https://www.360docs.net/doc/ea3546787.html, 。 要求: (1)标清题号; (2)列出关键的数学模型及模型中各参数的含义; (3)可利用Matalb 软件中相关库函数直接求解,请注明你所用到的关键函数及其作用; (4)也可以在建立模型之后,自行选择数值分析课程中介绍的合适算法并利用Matlab 软件编程实现;如此,你将获得额外加分; (5)对得到的结果加以适当评价,以及对问题本身提出相应的思考与改进,也将获得额外加分; (6)鼓励相互讨论,不允许相互抄袭;雷同(绝大部分相同)答卷按无效答卷处理,不予记录成绩;若某些题目解答完全相同,则该题不得分。 第一部分 说明: Ex1、Ex2每题10分;Ex3~Ex6每题15分 Ex1:以定期存储为基础的储蓄账户的累积值可由“定期年金方程”确定, ]1)1[(-+= n i i P A ; 在这个方程中,A 是账户中的数额,P 是定期存储的数额,i 是n 个存储期间的每期利率。一个工程师想在20年内退休时储蓄账户上的数额达到750000美元,而为了达到这个目标他每个月能存1500美元。为实现他的储蓄值目标,最小利率应是多少?假定利息是月复利的。 Ex2:在固定的时期内需付抵押贷款的数额问题和下面的称为“普通年金方程”的公式有关, ]) 1(1[n i i P A -+-= 在这个方程中,A 是抵押贷款的数额,P 是每期付款的数额,i 是n 个付款期的每期利率。假设需要30年房屋按揭贷款135000美元,又假设借款人每月至多能付1000美元房款。借款人能付得起的最大利率是多少? Ex3:病人用的药在血流中产生的浓度由ml mg e t A t c t 3 ) (-=给出(注射了A 单位药物后的t 小时以后血液中药物的浓度)。病人能够承受的药物最大安全浓度是1 ml mg 。 (1)分别利用微积分知识以及Matlab 软件描绘出浓度随时间变化的图形; (2)应该注射多大的量来达到最大的安全浓度?什么时候达到这个最大的安全浓度? (3)在浓度下降到0.25ml mg 后,要给病人注射这种药的附加的药量。确定何时应进行第二次注射,精确到分钟; (4)假设连续注射的浓度是可加的,又假设开始注射的75%的药量仍在第二次注射中起作用。什么时候可以进行第三次注射?

数学建模之层次分析法

第四讲层次分析法 在现实世界中,往往会遇到决策的问题,比如如何选择旅游景点的问题,选择升学志愿的问题等等。在决策者作出最后的决定以前,他必须考虑很多方面的因素或者判断准则,最终通过这些准则作出选择。 比如选择一个旅游景点时,你可以从宁波、普陀山、浙西大峡谷、雁荡山和楠溪江中选择一个作为自己的旅游目的地,在进行选择时,你所考虑的因素有旅游的费用、旅游地的景色、景点的居住条件和饮食状况以及交通状况等等。这些因素是相互制约、相互影响的。我们将这样的复杂系统称为一个决策系统。这些决策系统中很多因素之间的比较往往无法用定量的方式描述,此时需要将半定性、半定量的问题转化为定量计算问题。层次分析法是解决这类问题的行之有效的方法。层次分析法将复杂的决策系统层次化,通过逐层比较各种关联因素的重要性来为分析、决策提供定量的依据。 一、建立系统的递阶层次结构 首先要把问题条理化、层次化,构造出一个有层次的结构模型。一个决策系统大体可以分成三个层次: (1) 最高层(目标层):这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果; (2) 中间层(准则层):这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则; (3) 最低层(方案层):这一层次包括了为实现目标可供选择的各种措施、决策方案等。 比如旅游景点问题,我们可以得到下面的决策系统: 目标层——选择一个旅游景点 准则层——旅游费用、景色、居住、饮食、交通 方案层——宁波、普陀山、浙西大峡谷、雁荡山、楠溪江 二、构造成对比较判断矩阵和正互反矩阵 在确定了比较准则以及备选的方案后,需要比较若干个因素对同一目标的影响,从额确定它们在目标中占的比重。如旅游问题中,五个准则对于不同决策者在进行决策是肯定会有不同的重要程度,而不同的方案在相同的准则上也有不同的适合程度表现。层次结构反映了因素之间的关系,但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的

数学建模案例分析

案例分析1: 自行车外胎的使用寿命 问题: 目前,自行车在我国是一种可缺少的交通工具。它小巧、灵活、方便、易学,而且价格适中,给广大居民带来了不小的益处。但是,自行车也有令人头痛的地方,最常见的问题莫过于扎胎了。扎胎的原因有很多,但相当一部分是由于外胎磨损,致使一些玻璃碴、小石子很容易侵入、扎破内胎。为了减少不必要的麻烦,如何估计自行车外胎的寿命,及时更换? 分析: 分析角度:由于题目里未明确指出我们是应从厂家角度,还是应从用户角度来考虑这个问题,因此需要我们自己做出合理判断。若从厂家角度,我们面对的应当是一大批自行车外胎的平均寿命的估计。这样的估计要求一定精确度和相对明确的使用环境;而从用户角度来说,面对的仅是个人的一辆车,不需要很高的精确度,这样的寿命估计更简单,易于随时了解,下面仅从用户角度进行分析。 产品的使用者需要了解产品的寿命,是基于安全性及更换的费用来考虑的。我们将这两个标准作为主要标准来分析,首先值得注意的两个关键性问题是如何定义寿命、何时为寿命的终止。寿命的定义要做到科学,直观,有可比性,在航空工业中航天飞机的使用寿命是用重复使用的次数来衡量,而工厂机器设备的寿命则以连续工作的时间来定义。本题外胎的寿命亦可用时间来表征,但由于外胎的寿命直接与其磨损速度相关;而磨损速度又与使用频率及行驶速度相互联系,致使外胎的寿命不一定与使用时间成正比(这种非正比关系使我们不能拿一辆—天跑200公里的自行车与一天只跑1公里的自行车进行寿命比较),降低了可比性。如换成自行车的路程寿命来比较,就好得多。产品寿命是在安全性和更换费用相互制约下达到的一个点,在这个点上,外胎的安全系数降到用户不可接受的最低值,更换费用(寿命越长,在一定意义上更换费用越低)也达到了最大限度的节省。 弄清了上面两个问题后,我们继续明确建立模型需要解决哪些问题及建立模型的重点难点。 自行车使用过程中,一来影响因素多,二来这些因素之间彼此相关,十分复杂,要做到比较准确地估计使用寿命,不但要对外胎的性能有相当的了解,而且对使用环境更不能忽视。当然我们由于是站在用户角度上来考虑的,相对地就可忽略一些次要的影响因素。 这样的数学模型面对着两个主要问题。一、自行车使用寿命与外胎厚度的关系,二、外胎能够抵御小石子破坏作用的最小厚度。后者可处理得相对简略些(如只考虑一块具有一般特征的小石子对外胎的破坏作用),而重点(也是难点)是第一个问题。车重、人重、轮胎性质(力学的、热学的、甚至化学的)和自行车使用频率等都左右着它们的关系。这么多相关因素,不必一一都加以考虑(用户是不会在意这么多的),有些因素,可以先不考虑,在模型的改进部分再作修改,采取逐步深入的方法,如:摩擦损耗有滑动摩擦和滚动摩擦损耗两种,由于滚动摩擦占用的时间(或路程)显然占绝对优势,因此可重点考虑。但滑动摩擦造成的一次损坏又比滚动摩擦大,在刹车使用过频的情况下,就不能不考虑了。 最后,需对得出的结果用简单清晰的文字进行说明,以供用户参考。 案例分析2:城市商业中心最优位置分析 问题: 城市商业中心是城市的基本构成要素之一。它的形成是一个复杂的定位过程。商业中心的选址涉及到各种因素制约,但其中交通条件是很重要的因素之一。即商业中心应位于城市“中心”,如果太偏离这一位置,极有可能在城市“中心”地带又形成一个商业区,造成重复建设。 某市对老商业中心进行改建规划,使居民到商业中心最方便。如果你是规划的策划者,如何建立一个数学模型来解决这个问题。

数学建模之回归分析法

什么是回归分析 回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。 回归分析之一多元线性回归模型案例解析 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程为: 毫无疑问,多元线性回归方程应该为: 上图中的x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示: 那么,多元线性回归方程矩阵形式为: 其中:代表随机误差,其中随机误差分为:可解释的误差和不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样) 1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。 2:无偏性假设,即指:期望值为0 3:同共方差性假设,即指,所有的随机误差变量方差都相等 4:独立性假设,即指:所有的随机误差变量都相互独立,可以用协方差解释。

今天跟大家一起讨论一下,SPSS---多元线性回归的具体操作过程,下面以教程教程数据为例,分析汽车特征与汽车销售量之间的关系。通过分析汽车特征跟汽车销售量的关系,建立拟合多元线性回归模型。数据如下图所示:(数据可以先用excel建立再通过spss打开) 点击“分析”——回归——线性——进入如下图所示的界面:

数学建模常用的十种解题方法

数学建模常用的十种解题方法 摘要 当需要从定量的角度分析和研究一个实际问题时,人们就要在深入调查研究、了解对象信息、作出简化假设、分析内在规律等工作的基础上,用数学的符号和语言,把它表述为数学式子,也就是数学模型,然后用通过计算得到的模型结果来解释实际问题,并接受实际的检验。这个建立数学模型的全过程就称为数学建模。数学建模的十种常用方法有蒙特卡罗算法;数据拟合、参数估计、插值等数据处理算法;解决线性规划、整数规划、多元规划、二次规划等规划类问题的数学规划算法;图论算法;动态规划、回溯搜索、分治算法、分支定界等计算机算法;最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法;网格算法和穷举法;一些连续离散化方法;数值分析算法;图象处理算法。 关键词:数学建模;蒙特卡罗算法;数据处理算法;数学规划算法;图论算法 一、蒙特卡罗算法 蒙特卡罗算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法。在工程、通讯、金融等技术问题中, 实验数据很难获取, 或实验数据的获取需耗费很多的人力、物力, 对此, 用计算机随机模拟就是最简单、经济、实用的方法; 此外, 对一些复杂的计算问题, 如非线性议程组求解、最优化、积分微分方程及一些偏微分方程的解⑿, 蒙特卡罗方法也是非常有效的。 一般情况下, 蒙特卜罗算法在二重积分中用均匀随机数计算积分比较简单, 但精度不太理想。通过方差分析, 论证了利用有利随机数, 可以使积分计算的精度达到最优。本文给出算例, 并用MA TA LA B 实现。 1蒙特卡罗计算重积分的最简算法-------均匀随机数法 二重积分的蒙特卡罗方法(均匀随机数) 实际计算中常常要遇到如()dxdy y x f D ??,的二重积分, 也常常发现许多时候被积函数的原函数很难求出, 或者原函数根本就不是初等函数, 对于这样的重积分, 可以设计一种蒙特卡罗的方法计算。 定理 1 )1( 设式()y x f ,区域 D 上的有界函数, 用均匀随机数计算()??D dxdy y x f ,的方法: (l) 取一个包含D 的矩形区域Ω,a ≦x ≦b, c ≦y ≦d , 其面积A =(b 一a) (d 一c) ; ()j i y x ,,i=1,…,n 在Ω上的均匀分布随机数列,不妨设()j i y x ,, j=1,…k 为落在D 中的k 个随机数, 则n 充分大时, 有

(完整版)数学建模之层次分析法

层次分析法 层次分析法是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的课题。 缺点: (1)层次分析法的主观性太强,模型的搭建,判断矩阵的输入都是决策者的主观判断,往往会因为决策者的考虑不周、顾此失彼而造成失误。 (2)层次分析法模型的内部结构太过理想化,完全分离、彼此独立的层次结构在实践中很难做到。 (5)层次分析法只能从给定的决策方案中去选择,而不能给出新的、更优的策略。 1.模型的应用 用于解决多目标的复杂问题的定性与定量相结合的决策分析。 (1)公司选拔人员, (2)旅游地点的选取, (3)产品的购买等, (4)船舶投资决策问题(下载文档), (5)煤矿安全研究, (6)城市灾害应急能力, (7)油库安全性评价, (8)交通安全评价等。 2.步骤 ①建立层次结构模型 首先明确决策目标,再将各个因素按不同的属性从上至下搭建出一个有层次的结构模型,模型如下图所示。

目标层 准则层 方案层 目标层:表示解决问题的目的,即层次分析要达到的总目标。通常只有一个总目标。 准则层:表示采取某种措施、政策、方案等实现预定总目标所涉及的中间环节。 方案层:表示将选用的解决问题的各种措施、政策、方案等。通常有几个方案可选。 注意: (1)任一元素属于且仅属于一个层次;任一元素仅受相邻的上层元素的支配,并不是任一元素与下层元素都有联系; (2)虽然对准则层中每层元素数目没有明确限制,但通常情况下每层元素数最好不要超过 9 个。这是因为,心理学研究表明,只有一组事物在 9 个以内,普通人对其属性进行判别时才较为清楚。当同一层次元素数多于 9 个时,决策者对两两重要性判断可能会出现逻辑错误的概率加大,此时可以通过增加层数,来减少同一层的元素数。 ②构造判断(成对比较)矩阵 以任意一个上一层的元素为准则,对其支配的下层各因素之间进行两两比 a重要程度的衡量用Santy的1—9较。得到判断矩阵,再求出各元素的权重。 ij 标度方法给出。即

回归分析在数学建模中的应用

摘要 回归分析和方差分析是探究和处理相关关系的两个重要的分支,其中回归分析方法是预测方面最常用的数学方法,它是利用统计数据来确定变量之间的关系,并且依据这种关系来预测未来的发展趋势。本文主要介绍了一元线性回归分析方法和多元线性回归分析方法的一般思想方法和一般步骤,并且用它们来研究和分析我们在生活中常遇到的一些难以用函数形式确定的变量之间的关系。在解决的过程中,建立回归方程,再通过该回归方程进行预测。 关键词:多元线性回归分析;参数估计;F检验

回归分析在数学建模中的应用 Abstract Regression analysis and analysis of variance is the inquiry and processing of the correlation between two important branches, wherein the regression analysis method is the most commonly used mathematical prediction method, it is the use of statistical data to determine the relationship between the variables, and based on this relationship predict future trends. introduces a linear regression analysis and multiple linear regression analysis method general way of thinking and the general steps, and use them to research and analysis that we encounter in our life, are difficult to determine as a function relationship between the variables in the solving process, the regression equation is established by the regression equation to predict. Keywords:Multiple linear regression analysis; parameter estimation;inspection II

数学建模的基本步骤

数学建模的基本步骤 一、数学建模题目 1)以社会,经济,管理,环境,自然现象等现代科学中出现的新问题为背景,一般都有一个比较确切的现实问题。 2)给出若干假设条件: 1. 只有过程、规则等定性假设; 2. 给出若干实测或统计数据; 3. 给出若干参数或图形等。 根据问题要求给出问题的优化解决方案或预测结果等。根据问题要求题目一般可分为优化问题、统计问题或者二者结合的统计优化问题,优化问题一般需要对问题进行优化求解找出最优或近似最优方案,统计问题一般具有大量的数据需要处理,寻找一个好的处理方法非常重要。 二、建模思路方法 1、机理分析根据问题的要求、限制条件、规则假设建立规划模型,寻找合适的寻优算法进行求解或利用比例分析、代数方法、微分方程等分析方法从基本物理规律以及给出的资料数据来推导出变量之间函数关系。 2、数据分析法对大量的观测数据进行统计分析,寻求规律建立数学模型,采用的分析方法一般有: 1). 回归分析法(数理统计方法)-用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式。 2). 时序分析法--处理的是动态的时间序列相关数据,又称为过程统计方法。 3)、多元统计分析(聚类分析、判别分析、因子分析、主成分分析、生存数据分析)。 3、计算机仿真(又称统计估计方法):根据实际问题的要求由计算机产生随机变量对动态行为进行比较逼真的模仿,观察在某种规则限制下的仿真结果(如蒙特卡罗模拟)。 三、模型求解: 模型建好了,模型的求解也是一个重要的方面,一个好的求解算法与一个合

适的求解软件的选择至关重要,常用求解软件有matlab,mathematica,lingo,lindo,spss,sas等数学软件以及c/c++等编程工具。 Lingo、lindo一般用于优化问题的求解,spss,sas一般用于统计问题的求解,matlab,mathematica功能较为综合,分别擅长数值运算与符号运算。 常用算法有:数据拟合、参数估计、插值等数据处理算法,通常使用spss、sas、Matlab作为工具. 线性规划、整数规划、多元规划、二次规划、动态规划等通常使用Lindo、Lingo,Matlab软件。 图论算法,、回溯搜索、分治算法、分支定界等计算机算法, 模拟退火法、神经网络、遗传算法。 四、自学能力和查找资料文献的能力: 建模过程中资料的查找也具有相当重要的作用,在现行方案不令人满意或难以进展时,一个合适的资料往往会令人豁然开朗。常用文献资料查找中文网站:CNKI、VIP、万方。 五、论文结构: 0、摘要 1、问题的重述,背景分析 2、问题的分析 3、模型的假设,符号说明 4、模型的建立(局部问题分析,公式推导,基本模型,最终模型等) 5、模型的求解 6、模型检验:模型的结果分析与检验,误差分析 7、模型评价:优缺点,模型的推广与改进 8、参考文献 9、附录 六、需要重视的问题 数学建模的所有工作最终都要通过论文来体现,因此论文的写法至关重要:

数学建模方法和步骤

数学建模的主要步骤: 第一、模型准备 首先要了解问题的实际背景,明确建模目的,搜集必需的各种信息,尽量弄清对象的特征. 第二、模型假设 根据对象的特征和建模目的,对问题进行必要的、合理的简化,用精确的语言作出假设,是建模至关重要的一步.如果对问题的所有因素一概考虑,无疑是一种有勇气但方法欠佳的行为,所以高超的建模者能充分发挥想象力、洞察力和判断力,善于辨别主次,而且为了使处理方法简单,应尽量使问题线性化、均匀化. 第三、模型构成 根据所作的假设分析对象的因果关系,利用对象的内在规律和适当的数学工具,构造各个量间的等式关系或其它数学结构.这时,我们便会进入一个广阔的应用数学天地,这里在高数、概率老人的膝下,有许多可爱的孩子们,他们是图论、排队论、线性规划、对策论等许多许多,真是泱泱大国,别有洞天.不过我们应当牢记,建立数学模型是为了让更多的人明了并能加以应用,因此工具愈简单愈有价值. 第四、模型求解 可以采用解方程、画图形、证明定理、逻辑运算、数值运算等各种传统的和近代的数学方法,特别是计算机技术.一道实际问题的解决往往需要纷繁的计算,许多时候还得将系统运行情况用计算机模拟出来,因此编程和熟悉数学软件包能力便举足轻重. 第五、模型分析 对模型解答进行数学上的分析."横看成岭侧成峰,远近高低各不?quot;,能否对模型结果作出细致精当的分析,决定了你的模型能否达到更高的档次.还要记住,不论那种情况都需进行误差分析,数据稳定性分析. 数学建模采用的主要方法有: (一)、机理分析法:根据对客观事物特性的认识从基本物理定律以及系统的结构数据来推导出模 型. 1、比例分析法:建立变量之间函数关系的最基本最常用的方法. 2、代数方法:求解离散问题(离散的数据、符号、图形)的主要方法. 3、逻辑方法:是数学理论研究的重要方法,对社会学和经济学等领域的实际问题,在决策,对策等学科中得到广泛应用. 4、常微分方程:解决两个变量之间的变化规律,关键是建立“瞬时变化率”的表达式. 5、偏微分方程:解决因变量与两个以上自变量之间的变化规律. (二)、数据分析法:通过对量测数据的统计分析,找出与数据拟合最好的模型 1、回归分析法:用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式,由于处理的是静态的独立数据,故称为数理统计方法. 2、时序分析法:处理的是动态的相关数据,又称为过程统计方法. 3、回归分析法:用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式,由于处理的是静态的独立数据,故称为数理统计方法.

相关文档
最新文档