国赛一等奖优秀论文

国赛一等奖优秀论文
国赛一等奖优秀论文

葡萄酒质量的综合评价分析模型

中国海洋大学罗聃徐兴成谭萍指导教师高翔

【摘要】

近年来,我国掀起了一场葡萄酒热,对葡萄酒的需求与日俱增,特别是随着食品科学技术的发展,人们不再满足传统感官评价葡萄酒的水平,如何运用数据资料定量研究葡萄酒的品质,加快建立葡萄酒市场指标规则成为人们关注的焦点。本文主要研究了葡萄酒的品质与葡萄酒自身以及酿酒葡萄的理化指标的关系,给出了基于葡萄酒自身的理化指标以及酿酒葡萄的理化指标与芳香物质的定量综合评价模型。

首先基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t检验法建立评估两组数据差异的模型,得到了两组评酒员的评分存在显著差异的结论,并通过对两组数据进行方差分析,以判别结果具有的稳定性作为标准,得到第二组比较可靠。

接下来我们结合酿酒葡萄的理化指标和可信组评酒员的打分所刻画的葡萄酒的质量对酿酒葡萄进行分级,用聚类分析的方法将红,白葡萄酒和酿酒葡萄各分成了5类,然后对分好的葡萄类所酿造的葡萄酒进行统计,得到各类葡萄所对应的级别。

更进一步,我们分析了酿酒葡萄和葡萄酒的理化指标之间的联系,运用主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒的理化指标联系的模型。

最后我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。

关键词:假设检验聚类分析主成分分析逐步回归

一、问题重述

1.1问题背景

葡萄酒是由新鲜葡萄或葡萄汁经过酒精发酵而得到的一种含酒精饮料。葡萄酒质量是其外观、香气、口感、整体的综合表现。一方面,酒中的糖、酸、矿物质和酚类化合物,都具有各自独特的风味,它们组成了葡萄酒的酒体;另一方面,酒中大量的挥发性物质,包括醇、脂、醛、碳氢化合物等,都具有不同浓度、不同愉悦程度的香气,葡萄

酒最终的质量则是葡萄酒中各种成分协调平衡的结果。

1.2问题提出

随着葡萄酒产业逐渐升温,为了获得质量更好的葡萄酒,对酿酒葡萄及葡萄酒的研究也越加深入。现在流行的做法是通过聘请一批有资质的评酒员进行品评,但是这种感官评价的主观性总是带给我们模糊的印象。正如我们所知的,酿酒葡萄的好坏与所酿葡萄酒的质量有直接的关系,葡萄酒和酿酒葡萄检测的理化指标会在一定程度上反映葡萄酒和葡萄的质量。如何充分利用这些理化指标定量研究葡萄酒的质量成了炙手可热的研究问题。

二、问题分析

题目为我们提供了感官评价指标,葡萄和葡萄酒的各种理化指标和芳香物质的信息。本文的关键就是通过分析处理已给的数据,建立数学模型来研究葡萄酒质量的确立。为此,我们要依次达到题目给出的以下几个目标:

2.1 两组评价结果差异性和可信性研究

问题一给出了两组评酒员对同一批葡萄酒的评价分数,本文采用假设检验中的t检验法建立评估两组数据差异的模型,研究两组评价员的评价结果是否存在差异,判断是否能接受它们有显著性差异的假设。若判断的结果是这两组数据存在差异,我们就进入第二步,可靠性研究。我们分别对两组数据求方差,方差小的那组说明波动比较小,评酒员的评定比较稳定,数据比较可靠。

2.2酿酒葡萄的分级

首先,我们我们利用第一题的结果,用置信区间法对可信组的原始数据进行处理,降低评酒员之间的差异,提高酒样品之间的差异【1】;利用处理后的数据(总分)对葡萄酒进行分级;

然后,用初步处理后的酿酒葡萄的理化指标对葡萄进行聚类分析,将葡萄分成了若干类;分析每类葡萄对应的葡萄酒大都属于哪一级别,从而得出葡萄的级别;

最后,分析每一级葡萄理化指标的特点,建立起葡萄指标识别葡萄级别的模型帮助果农更好地利用好葡萄酿好酒。

2.3酿酒葡萄与葡萄酒理化指标的联系

问题三要求研究葡萄与葡萄酒理化指标之间的联系,我们先对于葡萄的30个理化指标进行主成分分析法,得到葡萄一些具有代表性的理化指标。然后我们建立葡萄的理化指标与葡萄酒的7个理化指标之间的多元线性回归方程,得到了酿酒葡萄与葡萄酒理化指标之间的定量联系。

2.4 理化指标对葡萄酒质量的影响及论证

问题四要求研究酿酒葡萄与葡萄酒的理化指标对葡萄酒质量的影响,以及是否能完

全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。我们将提取葡萄及葡萄酒的理化指标与芳香物质中的主成分,利用逐步回归的方法考察理化指标与芳香物质对葡萄酒质量的影响程度,通过对芳香物质对葡萄酒质量影响比重得到芳香物质对葡萄酒的质量有30%以上的影响比重(白葡萄的芳香物质对白葡萄酒的质量影响相对更大),故而不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。

三、问题假设

1、同种葡萄酒在一组评酒员下的得分成正态分布。

2、一种葡萄对应酿制一种葡萄酒。

3、葡萄的成分充分转换成葡萄酒里的成分,不存在意外的浪费和挥发。

4、假设葡萄和葡萄酒芳香物质中没有检测到的成分不存在于该样本中,数据处理前将其置为零。

四、符号说明

五、建模的建立与求解

5.1模型一:基于t检验建立差异评估模型

我们采用假设性检验验证是否能接受两组评酒员评价结果无差异的假设。然后用方差分析两组评酒员组内数据的波动,认为较平稳的一组数据比较可靠。

5.1.1数据预处理

我们在整理数据的时候发现几个比较显著的异常数据:

1)第一组红酒数据—样品20—色调—品酒员4号数据缺失;

2)第一组白酒数据—样品3—持久性—品酒员7号数据明显有问题,怀疑是多敲了一个7;

3)第一组白酒数据—样品8—口感分析—浓度—品酒员2号数据明显异常。

因为随机样本在均值附近振荡,所以我们选用均值来代替异常数据以求误差最小。

5.1.2基于成对数据的t 检验【2】

1)模型的建立:

将两组评酒员分别看作两个整体1T 、2T ,对每个红葡萄酒样品(1)i J (1,2,,27)i =(白

葡萄酒样品(2)i J (1,2,

,28)i =)进行感官评价,1T 对每个红葡萄酒样品(1)i J 的评价结果

通过组内每一位品酒员的评分(1)

ij

x (1,2,

,10)j =的均值10(1)

(1)

1

110i

ij j x x ==∑来刻画,同样2T 对每个红葡萄酒样品(1)

i J 的评价结果用均值10

(1)

1

110i ij j y y ==∑来刻画,从而得到两组评酒员

对每种样品酒的评价结果,建立两组评酒员对红葡萄酒的评价结果见表1。

红葡萄酒样品1234567891011121314第一组评分62.7

80.3

80.4

68.6

73.3

72.2

71.5

72.3

81.5

74.2

70.153.974.6

73

第二组评分

68.17474.671.272.166.365.36678.268.861.668.368.872.6D

-5.4

6.3 5.8-2.6 1.2 5.9 6.2 6.3 3.3 5.48.5-14.4 5.80.4

红葡萄酒样品15161718192021222324252627第一组评分58.774.979.359.978.678.677.177.285.67869.273.873第二组评分

65.769.974.565.472.675.872.271.677.171.568.27271.5D

-7

5

4.8

-5.5

6

2.8

4.9

5.6

8.5

6.5

1

1.8

1.5

表1 红葡萄酒的评价结果

表中的数据是成对的,即对同一酒样品(1)i J 得到一对数据。可知一对与另一对数据之间差异是由各种因素,如葡萄酒的外观、香气、口感、材料成分等因素引起的。由于各酒样品(1)i J (1,2,,27)i =的特性有广泛的差异,就不能将第一组评酒员1T 对27种红葡萄酒的评价结果看成是同分布随机变量的观测值。因而表中第一行不能看成是一个样本的样本值,同样第二组的数据也不能看成是同一个样本的样本值,而同一对中两个数据是同分布随机变量的观测值,他们的差异是由于两组品酒员的水平引起的。为鉴定他们的评价结果有无显著性差异,可使用基于成对数据的逐对比较法。

以红葡萄样品为例,有27对相互独立的评价结果:11222727(,),(,),,(,)X Y X Y X Y ,令111222272727,,

,D X Y D X Y D X Y =-=-=-,则1227,,,D D D 相互独立。由于

122

,,

,D D D 是由同一因素所引起的,可认为它们服从同一分布。现假设2

(,)i D D D N μσ,

1,2,

,27i =。就是说1227,,

,D D D

构成正态总体2(,)D D N μσ的一个样本,其中2

,D D

μσ未知。基于这一样本检验假设:

01:0,:0D D H H μμ=≠ (1)

分别记1227,,,D D D 的样本均值和样本方差的观测值为d ,2

D

s 。对1227,,,D D D 进行单

个均值的t 检验,检验问题的拒绝域为(显著水平为α):

2(1)t t n α=

≥-. (2)

当t 的值不落在拒绝域内,接受0H ,认为两组品酒员的评价结果没有显著差异,否则两组品酒员的评价结果有显著性差异。

对白葡萄酒的处理同红葡萄。 2)模型的求解:

现以红葡萄酒为例求解,首先,作出同一酒样品(1)i J (1,2,

,27)i =分别由两组品酒

员1T 、2T 得到的评价结果之差,列于表1的第三行。根据建立的模型需检验假设

01:0,:0D D H H μμ=≠.

我们取α=0.02,则20.01(26)(26) 2.4786t t α==,通过查表即知拒绝域为

2.4786t =

由观测值得 2.5407d =,2

27.7883D s =

, 2.5044 2.4786t =

=≥.现t 的值落在

拒绝域内,故接受1H ;同样对白葡萄酒进行成对数据的t 检验,得白葡萄酒观测值之差

的均值 2.5214d =-,2

24.9124D s =

, 2.6249 2.4727t =

=≥,故认为两组品酒

员的评价结果有显著性差异。

5.1.3可信度定量分析

1)模型的建立:

记第一组10位品酒员对红葡萄酒样品(1)i J (1,2,

,27)i =的评分为

(1)

ij a (

1,2,,1j =,

10(1)

(1)1110i

ij j a a ==∑,10(1)(1)2

(1)211

1()10i ij i j s a a ==-∑ (3) 其中,(1)

i a 表示第一组品酒员对红葡萄酒样品(1)i J 的评分均值,(1)21i s 表示(1)i J 的评分方差;

同样,第二组对红葡萄酒样品(1)i J 的评分均值和方差分别为

10(1)

(1)1110i ij j c c ==∑,10(1)(1)2(1)

221

1()10i ij i j s c c ==-∑ (4)

从而对每一组品酒员得到一个评分方差向量

(1)2(1)2(1)2(1)211112127(,,,)S s s s =

(1)2(1)2(1)2(1)222122227(,,

,)S s s s =

同理可求得白葡萄酒的(2)21S ,(2)22S 。再对(1)21S 和(1)2

2S 中的元素分别求和得到方差和,用

方差和对比得到对于同一批红葡萄两组不同的评价水平。方差和小的稳定性好,相对来说比另一组的评价结果是更可信的。 2)模型的求解:

运用excel 软件进行求解,容易得到(1)21S ,(1)22S ,(2)21S ,(2)2

2S ,具体附录一

对红葡萄酒而言:(1)21S 元素的和为1409.3,(1)2

2S 元素的和为821.1。对白葡萄而言:(2)21S 元素的和为3183.1,(2)22S 元素的和为1388.5。不管是红葡萄酒还是白葡萄酒,第一组的方差

和总是远远大于第一组。为了更直观的看到这个结果,下图即为两组评酒员对两种葡萄酒的方差图像,可以直观的看到第二组的波动程度比第一组的小,第二组更可信。

图1 两组品酒员对红、白葡萄酒的评分方差图

5.2模型二:基于聚类分析建立酿酒葡萄分级模型

我们根据可信组评酒员给每种酒样品的打分来确定葡萄酒的质量;再用聚类分析对酿酒葡萄进行分类,对每类的葡萄酿造的葡萄酒进行统计,对应地得到这类葡萄所对应的级别。

5.2.1葡萄酒的分级

1)置信区间法

置信区间法【2】能有效的降低评酒员之间的差异,提高酒样品之间的差异【1】,虽然我们在第一问中分辨出第二组评酒员评判出的数据更可靠,但是我们不能排除第一组评酒员的专业性,为了最可靠的样本,我们应该综合两组评价的分数。所以本文先采用置信区间法分别处理第一,二组数据,处理之后对同种葡萄酒的分数做一个平均。

以红葡萄酒为例用置信区间处理第一组数据,计算评酒员对酒样品

(1)i J (1,2,,27)i =评价的置信区间为(1)(1)

,i i i i a a σσ??-+????

其中(1)i a 为酒样(1)i J 的平均值;, i σ为酒样(1)i J 的标准差。

如果评酒员j 对酒样(1)i J 的评价(1)ij a 在其置信区间范围内就可以直接使用; 如果其评价(1)ij a 不在置信区间范围内, 则做如下变换:

若 (1)ij a <(1)

i

i a σ-, 则(1)(1)ij ij i a a σ=+ 若 (1)ij a > (1)

i

i a σ+,则(1)(1)ij ij i a a σ=-

若变换之后的(1)ij a 仍不在置信区间范围内,再重复上面的变换,这样逐步调整,直至不

同评酒员对同一酒样的评价值都处于(1)(1)

,i i i i a a σσ??-+????

范围内。

对第二组数据做同样处理,再对同种酒样(1)i J 两组数据做平均。同样方法得到红白

葡萄置信区间法处理后的数据见附录2。 2)葡萄酒分级

现在国际上对葡萄酒的分类流行用罗伯特·帕克的分类方法【3】

,即: 96-100分 顶级葡萄酒

90-95 分 具有高级品味特征和口感的葡萄酒

80-89 分品质优良,口感纯正

70-79分一般,略有瑕疵

60-69分低于一般

50-59分次品,可以认为是一款不合格的葡萄酒

通过分析所有葡萄酒样品的最高分和最低分,我们发现处于运用罗伯特分级标准分级的此次过于宽泛,所以我们借鉴罗伯特的分级标准制定本文的对葡萄酒的分级标准,以更好的体现酒样之间的差异。

葡萄酒样品的分级标准:

80~85分:高级葡萄酒

75~80分:中上级葡萄酒

70~75分:中级葡萄酒

65~70分:中下级葡萄酒

60~65分:下级葡萄酒

以下是根据1)的数据求得的葡萄酒总分的平均分

高级红葡萄酒:无

中上级红葡萄酒:9、23、20

中级红葡萄酒:3、17、2、26、14、19、5、21、4、24、27、22

中下级红葡萄酒:16、10、13、1、12、25、6、15、7、8

下级红葡萄酒:18、11

高级白葡萄酒:9、5、25

中上级白葡萄酒:21、10、28、22、17、15、23、1、4、19、14、27、26、18、24、

6、20、2、3

中级白葡萄酒:7、13、8、12、11

中下级白葡萄酒:16

下级白葡萄酒:无

5.2.2对酿酒葡萄的Q 型聚类分【4】

聚类分析方法是基于数值分类法的思想建立起来的,又称为系统聚类法。这里只基于酿酒葡萄样本进行聚类,成为Q 型聚类,其步骤为: 步骤一:数据标准化

以酿酒红葡萄和红葡萄酒为例,由于酿酒葡萄(1)i A (1,2,

,27)i =的各理化指标

(1)ij x (1,2,

,30)j =使用了不同的量纲及数据的大小差距很大,

对理化指标数据矩阵的处理采用标准化,处理方式为

(1)(1)

(1)

(1)

ij j ij

j x x x s -=

(5)

其中(1)

j

x ,(1)

j

s 是矩阵(1)(1)2730()ij A x ?=每一列的均值和标准差。

步骤二:样本的相似性度量

在对酿酒红葡萄的理化指标进行聚类分析时,首先要确定理化指标样本的相似性度

量,本文采用相关系数来衡量两个指标样本的相似性。记样本(1)?j x

的取值1227

(,,

,

)T n j j j x x x R ∈(1,2,

,30j =,则两个样本的相关系数

30

(1)(1)(1)(1)(1)

130

30

(1)(1)2(1)(1)211()()

()()ij

j ik k i jk

ij

j ik k i i x

x x x r x x x x ===--=

??--????

∑∑∑ (6)

相似性度量中(1)

jk r 越接近1,(1)?j x

与(1)?k x 越相关;(1)jk r 越接近0,(1)?j x 与(1)?k x 的相关性越弱。

步骤三:样本的距离定义

在对酿酒葡萄的聚类分析中,定义两类理化指标样本的距离(类平均法)为

(1)(1)12(1)(1)12??121

??(,)(,)j k j k x G x G D G G d x x n n ∈∈=∑∑ (7) 它等于12,G G 中两两样本点距离的平均,式中12, n n 分别为12,G G 中的样本点个数。其中

(1)(1)(1)??(,)1j k jk d x x r =-或(1)(1)(1)2

??(,)1j k jk d x x r =-。

步骤四:Q 型聚类分析求解模型

使用MATLAB 软件中的linkage 函数(本文所有程序均用matlab 7.11软件处理),对数据进行处理(matlab 程序见附录4),样本间相似性度量采用相关系数,类间距离的度量计算采用类平均法,对两种酿酒葡萄进行Q 型聚类分析,画出聚类图,对酿酒葡萄划分类别。

1)红、白葡萄的聚类分析图如下:

图2红、白葡萄的聚类图

2)聚类结果分析

红葡萄划分成6类的结果如下:

属于第1类的样本有:葡萄样品2、9 、23

属于第2类的样本有:葡萄样品1、8、14

属于第3类的样本有:葡萄样品3、21

属于第4类的样本有:葡萄样品4、5、6、7、12、13、15、16、17、18、19、20、

22、24、25、26、27

属于第5类的样本有:葡萄样品10

属于第6类的样本有:葡萄样品11

白葡萄划分成6类的结果如下:

属于第1类的样本有:葡萄样品2、8、11、16、19、25

属于第2类的样本有:葡萄样品4、5、9、10、12、14、17、20、21、22、23、24、

2 6、28

属于第3类的样本有:葡萄样品6、7、15、18

属于第4类的样本有:葡萄样品1、13

属于第5类的样本有:葡萄样品3

属于第6类的样本有:葡萄样品27

对于每类葡萄中的元素(单个葡萄样本),结合其酿造出的葡萄酒的品质,既该葡萄样本所酿造的葡萄酒的级别,来确定该葡萄的级别。然后再根据每类葡萄中葡萄样本级别的比例来确定该类葡萄的级别。对应葡萄酒的分级,我们也将葡萄分成高级,中上,中级,中下,下级

根据以上聚类分析的结果再综合葡萄酒的分级(葡萄酒的质量)我们得出如下结论:

5.3模型三:基于主成分分析和逐步回归建立葡萄与葡萄酒理化指标联系模型 为了更好的反应酿酒葡萄理化指标的实质,本文采用主成分分析法对30个指标进行处理,提取出葡萄理化指标的主成分;考虑到大多数葡萄到葡萄酒的化学反应时线性的,我们通过多元线性回归建立起葡萄和葡萄酒理化指标之间的联系。 5.3.1关于酿酒葡萄理化指标的主成分分析

本文运用主成分分析法对酿酒葡萄的理化指标进行主成分分析,将多个理化指标合为几个具有代表性的主成分,从而实现对高维变量空间进行降维处理。

主成分分析法的步骤如下: 1)对原始数据进行标准化处理

由于各指标的量纲与大小不同,首先须对初始指标的数值标准化,同一比较的尺度,方法如式(5); 2)主成分的求解

将27个酿酒红葡萄样本的30个指标数据标准化处理后构成一个标准化数据矩阵

2730X ?,求X 的协方差阵1

T C X X n

=的特征值i λ(1,2,,27)

i =及相应的特征向量i v (1,2,,27)i =,将27征向量正交化得方阵V ,作变换Y VX =,将27征值按大小顺序进行排列,相应的27个新变量i y (1,2,,27)i =。i λ越大的新变量i y 对模型的贡献率越大。新变量12,,y y 分别称为第一主成分,第二主成分,…,前面几个主成分构成了样本空间的最大变化特征:

(1)(1)(1)

11122(2)(2)(2)21122()()()1122n n n n

p p p p n n y v x v x v x y v x v x v x y v x v x v x ?=+++?=+++??

=+++?

?=+++?

(8)

前面几个主成分12,,,p y y y (27)p <对应的特征值12,,,p λλλ的和占总和的比例

27

1

1

p

i

i

i i ρλλ

===∑∑ (9)

即为主成分12,,

,p y y y 的累计贡献率,当0.8ρ≥时,可选用前p 个主成分代替原来

酿酒葡萄样本中的30个理化指标。

5.3.2关于葡萄酒理化指标的多元线性回归

通过对酿酒葡萄的理化指标进行主成分分析,将多个理化指标合为几个具有代表性

的主成分,现将酿酒葡萄的主成分作为新的指标(现仍记为()12,,,p x x x )对葡萄酒的每一项理化指标进行多元回归。

多元线性回归的模型为

01122p p y b b x b x b x ε=+++++ (10)

式中12,,

,p x x x 为酿酒葡萄的主成分即为新的指标,y 为葡萄酒的理化指标,ε为测量

误差向量,(1,2,

,)i b i p =为回归系数。

设()12,,

,,i i ip i x x x y ,1,2,

,i m =是()12,,

,,p x x x y 的p 次测量值即确定12,,

,p

x x x 为酿酒葡萄新的指标后葡萄的新指标值,则多元线性模型可表示为

01122i i i p ip i y b b x b x b x ε=+++++,1,2,,i m =

i y 为葡萄酒的第i 项理化指标。

为书写方便,采用矩阵形式表达,令

12m y y Y y ??

????=??

??

??,01p b b b b ??????=????????

,1112121222121111p p m m mp x x x x x x X x x x ??????=????????

, 12m εεεε??

????=??????

则多元线性模型可表示为

Y Xb ε=+

求回归系数b 的估计值b ,就是求最小二乘函数

()()()T Q b y Xb y Xb =--

达到最小的b 值。为此,令

0,0,1,2,,i

Q

i p b ?==? 可以求得b 的最小二乘估计

1()T T b X X X y -=

从而得到多元线性回归方程

01122n n y b b x b x b x =+++

+

5.3.3模型的求解

1)酿酒葡萄理化指标的主成分分析结果

利用MATLAB 软件中的pcacov 函数对酿酒葡萄(以红葡萄为例)的三十个理化指标

进行主成分分析(matlab 程序见附录5),1

T C X X n

=的前几个特征根及其贡献率如表

5。

表5:酿酒红葡萄理化指标的主成分分析结果

序号

特征根

贡献率

累计贡献率

1 6.966223.22070.2322

2 4.9416.46670.3969

3 3.737112.4570.5214

4 2.849.46680.6161

5 1.9988 6.66280.6827

6 1.7424 5.80790.7408

7 1.4185 4.72820.7881

8 1.2701 4.23350.830490.960

9 3.20310.8625100.7384 2.46140.8871110.6907 2.30250.910112

0.5138

1.7127

0.9272

可以看出,前8个特征根的累计贡献率就达到了80%以上,主成分分析效果很好。

下面选取前12个主成分(累计贡献率就达到了92.72%)对酿酒葡萄的三十种理化指标进行替代,前12个特征值对应的特征向量见附录,由此可得12个主成分分别为

1123021230

121230

0.14210.23250.05240.24450.22470.21970.27690.07800.1351y x x x y x x x y x x x =++-??=-++??

??=--+-

?

从主成分的系数可以看出,第一主成分主要反映了前几个理化指标(氨基酸、蛋白

质、花色苷、褐变度和总酚等方面)的信息,第二主成分主要反映了白藜芦醇、黄酮醇、总糖和可滴定酸的信息,第三主成分主要反映了单宁、果皮质量和果皮颜色的信

息,……,第十二个主成分主要反映了黄酮醇和果梗比的信息。把各酿酒葡萄样本的原始三十个理化指标的标准化数据代入十二个主成分的表达式,就可以得到各葡萄样本的十二个主成分值。

2)葡萄酒理化指标的多元线性回归结果

利用各葡萄样本的十二个主成分值,对葡萄酒的每一项理化指标进行多元线性回归,红葡萄酒各理化指标的回归结果为

1121221212

71212

0.29110.02770.26150.32470.02890.08380.25500.00300.2108z y y y z y y y z y y y =-+-??=++-??

??=--++

?

式中1212,,,y y y 为酿酒红葡萄的前十二个主成分,i z (1,2,

,7)i =为红葡萄酒的各

理化指标。

从红葡萄的回归方程及主成分中,可知:酿酒红葡萄的第一、四主成分与红葡萄酒的理化指标存在较强的正相关关系,即红葡萄中的蛋白质、花色苷、褐变度、单宁和总酚及白藜芦醇、黄酮醇、总糖和可滴定酸等与红葡萄酒的理化指标存在较强的正相关性,果梗比、果皮质量与红葡萄酒的理化指标存在负相关。

白葡萄酒的各理化指标的回归结果为

(2)(2)(2)(2)

11213(2)(2)(2)(2)21213

(2)(2)(2)(2)61213

0.15430.14140.04770.16900.18520.03980.21390.04080.1870z y y z y y y z y y y ?=+++?=+++??

??=-+-

?

式中(2)(2)(2)

1213

,,,y y y 为酿酒白葡萄的前十三个主成分,i z (1,2,,6)i =为白葡萄酒的各理化指标。

从白葡萄的回归方程及主成分中,可知:酿酒白葡萄中的蛋白质、单宁和总酚及白藜芦醇、总糖和可滴定酸等与白葡萄酒的理化指标存在正相关关系,花色苷、褐变度、果梗比、果皮质量等与白葡萄酒的理化指标存在负相关关系。

5.4模型四:基于逐步回归分析法研究理化指标对葡萄酒质量的影响 5.4.1 逐步回归分析模型的建立

逐步回归法是一种变量筛选方法。逐步回归法采取边进边退的方法,对于模型外部的变量,只要它还可提供显著的解释信息,就可以再次进入模型;而对于已在内部的变量,只要它的偏F 检验【6】不能通过,则还可能从模型中被删除。 1)偏F 检验

在决定一个新的变量是否有必要进入模型,或者判断某个变量是否可以从模型中删除时,考虑这个变量能否对y 提供显著的附加解释信息?现采用偏F 检验。

设有n 个自变量12,,,n x x x ,采用这n 个自变量拟合的模型称为全模型,即

01122n n y b b x b x b x ε=+++++

从这n 个变量中删除自变量j x ,这时用1n -个自变量拟合模型称为减模型,即

0111111j j j j n n y b b x b x b x b x ε--++=+++++

++

全模型的复判定系数为2R ,减模型的复判定系数记为2j R 。定义

222

j j R R R ?=-

由于在全模型中多一个自变量j x ,所以,若2j R ?几乎为零,说明增加j x ,对

y 的解释能力没有显著提高;否则,若2j R ?显著不为零,则j x 就可以为回归模型提供显著的解释信息。

给出统计假设22

01:0,:0j j H R H R ?=?≠

统计检验量为

(1)

j j Q Q

F Q n m -=

--

式中,j Q 是减模型的残差平方和,Q 为全模型的残差平方和。

根据检验水平α查F 分布表,得到拒绝域的临界值F α ,则决策准则如下: (i )当j F F α>时,拒绝0H ,说明2j R ?显著不为零,这说明在111,,,,,j j n x x x x -+变

量已进入模型后,引入j x 会显著提高对y 的解释能力;

(i )当j F F α≤时,接受0H ,说明2j R ?显著为零,这说明在全模型中删除j x ,对

y 的解释能力无显著的减弱变化。 2)逐步回归分析 模型的起始首先要求y 与每一个i x 的一元线性回归方程,选择F 值最大的变量进入模型。然后,对剩下的1n -个模型外的变量进行偏F 检验(设定1i x 已在模型中),在若干通过偏F 检验的变量中,选择j F 值最大者进入模型。再对模型外的2n -个自变量做偏

F 检验。在通过偏F 检验的变量中选择j F 值最大者进入模型。接着对模型中的三个自

变量分别进行偏F 检验,如果三个自变量都通过了偏F 检验,则接着选择第四个变量。但如果有某一个变量没有通过偏F 检验,则将其从模型中删除。重复上述步骤,直到所有模型外的变量都不能通过偏F 检验,则算法终止。为了避免变量的进出循环,一般取偏F 检验拒绝域的临界值为

>F F 进出

式中,F 进为选入变量时的临界值;F 出为删除变量时的临界值。

3)理化指标对葡萄酒质量的影响 将酿酒葡萄和葡萄酒的理化指标合并为一个数据表(见附件),将得到的数据进行标准化处理,处理方法如式(5),基于模型三的酿酒葡萄理化指标的主成分分析法对合并的数据进行主成分分析,得到酿酒葡萄和葡萄酒的理化指标的p 个主成分,对其两者的理化指标降维,且增强指标的独立性,把各酿酒葡萄与葡萄酒合并的样本的原始三十九个理化指标的标准化数据代入p 个主成分的表达式,就可以得到各葡萄样本的p 个主成分值。将评酒员的评分作为葡萄酒质量的定量刻画,利用合成样本的主成分对葡萄酒质量进行逐步回归分析,得到酿酒葡萄和葡萄酒理化指标对葡萄质量的综合定量描述12(,,,)p y f x x x =,改变其中的某一项或几项解释变量i x ,可以观察到该项或几项解释变量对葡萄质量的影响12(,,,,,)i p y f x x x x ?=?。

5.4.2 逐步回归分析模型的求解

对酿酒葡萄与葡萄酒合并的样本进行主成分分析,以酿酒红葡萄、红葡萄酒为例主成分分析的结果如下:

可以看出,前8个特征根的累计贡献率就达到了80%以上,主成分分析效果很好。下面选取前19个主成分(累计贡献率就达到了98.63%),由此可得19个主成分分别为

1123921239

191239

0.10530.16150.00970.23910.18400.12250.23640.19690.1539y x x x y x x x y x x x =++-??=-++??

??=--+-?

现将前19个主成分代替原来的理化指标,然后对葡萄酒的质量进行逐步回归。运用MATLAB 中的Stepwise Regression 窗口(matlab 程序见附录6)进行交互式逐步回归,如图4。

图3 逐步回归交互式界面

复判定系数为20.8711R =,检验值15.2108F =,得到最终模型为

12612130.14230.17820.10270.19360.3670y y y y y y =-+

-+-

此回归方程即为酿酒红葡萄和红葡萄酒的理化指标对红葡萄酒质量的影响方程,i y 表示酿酒红葡萄、红葡萄酒理化指标的第i 个主成分。 通过逐步回归分析后,影响红葡萄酒质量的红葡萄和红葡萄酒理化指标的主成分只剩下1213(1,2,,6),,i y i y y =。结合红葡萄及红葡萄酒理化指标的主成分,糖转化为酒精,酸影响葡萄酒中的PH 值,单宁、色素等酚类物质溶解在葡萄酒中,红葡萄酒的颜色、气味、口感等与酚类、糖类和酸类等物质密切相关,而葡萄酒的质量目前主要依据评酒员的感官评价,葡萄酒的好坏与其外观、香气和口感密切联系,葡萄与葡萄酒的理化指标就在一定程度上影响了葡萄酒的质量,具体定量关系如上式回归方程。 5.4.3 关于葡萄和葡萄酒的理化指标对葡萄酒质量影响的论证

由于评酒员的感官评价中考虑了外观、香气和口感等综合因素,因此葡萄酒的感官质量是由葡萄酒的外观、香气、口感和整体因素等决定的,受评酒员个人的偏好的影响。若反映到葡萄及葡萄酒的化学组成,外观是受葡萄及葡萄酒的色泽等影响的,香气是由葡萄及葡萄酒的芳香物质影响的,而口感是由葡萄及葡萄酒的某些理化指标影响的。因此,理化指标在一定程度上反应了葡萄酒的质量,由于香气对葡萄酒质量的影响,可能芳香物质在一定程度上影响了葡萄酒的质量。

现在我们就采用主成分分析与逐步回归的方法对葡萄及葡萄酒的理化指标与芳香物质进行定量研究,考察理化指标与芳香物质对葡萄酒质量的影响程度。 分析步骤如下:

(1)葡萄和葡萄酒理化指标的综合主成分分析

基于模型四中酿酒葡萄和葡萄酒的理化指标的主成分分析法,得到了葡萄和葡萄酒

的两种理化指标合并在一起的综合主成分,记为(1)(1)(1)

1211,,,y y y 。 (2)葡萄和葡萄酒芳香物质的综合主成分分析

同对理化指标的处理方法,先将酿酒葡萄和葡萄酒的芳香物质合并成一个数据矩阵,先对其中的每一个元素进行标准化处理,然后进行主成分分析,得到芳香物质的主成分

(2)(2)(2)

1213

,,,y y y 。 (3)两种综合主成分的逐步回归

将葡萄和葡萄酒的理化指标及芳香物质的综合主成分看作同等地位的变量对葡萄酒的质量会产生一定的影响,现对其三者之间进行逐步回归分析(用matlab 的Stepwise Regression 窗口实现),得到理化指标与芳香物质的回归方程:

(2)(1)(1)(1)

91250.45040.16370.18060.1194y y y y y =+-++ (15) (4)理化指标与芳香物质对葡萄酒质量的影响比重

理化指标对葡萄酒质量影响比重计算为

11

(1)

1

111

13

(1)(2)1

1

i i i

j

i j k

SI k

k

====

+∑∑∑ (16)

芳香物质对葡萄酒质量影响比重计算为

13

(2)1

211

13

(1)(2)1

1

j j i

j

i j k

SI k

k ====

+∑∑∑ (17)

式中(1)i k 表示葡萄及葡萄酒理化指标的综合主成分(1)i y 在回归方程中的系数,(2)j k 表

示葡萄及葡萄酒芳香物质的综合主成分(2)j y 在回归方程中的系数,1SI 为理化指标对葡萄酒质量影响比重,2SI 为芳香物质对葡萄酒质量影响比重。

由式(15)的系数及式(15)、式(16),可以计算得理化指标对红葡萄酒质量

影响比重165.5%SI =,芳香物质对红葡萄酒质量影响比重235.5%SI =;同样可以计算得理化指标对白葡萄酒质量影响比重153.1%SI =,芳香物质对白葡萄酒质量影响比重246.9%SI =,说明红、白葡萄和红、白葡萄酒的芳香物质对葡萄酒的质量有30%以上的影响比重,白葡萄的芳香物质对白葡萄酒的质量影响相对更大。根据实际情况,红葡萄酒的颜色、气味、口感等与酚类等理化指标密切相关,而白葡萄酒的质量,主要由源于葡萄品种的一类香气和源于酒精发酵的二类香气以及酚类物质的含量所决定。故而它们的理化指标对葡萄酒的质量有较大程度的影响,但并不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量。

5.5 结果分析

1)两组评价结果差异性和可信性研究结果

基于两组评酒员对同一批葡萄酒的评价分数数据,采用假设检验中的t 检验法建立评估两组数据差异的模型,得到了两组评酒员的评分存在显著差异的结论,并通过对两组数据进行方差分析,以判别结果具有的稳定性作为标准,第一组评酒员的评酒水平波动较大,第二组较为稳定,故得到第二组比较可信。 2)酿酒葡萄的分级结果

我们利用第一题的结论,用置信区间法对可信组的原始数据进行处理,降低评酒员

之间的差异,提高酒样品之间的差异,利用处理后的数据对葡萄酒进行分级;然后,根据酿酒葡萄的理化指标对葡萄进行聚类分析,将葡萄分成了若干类;分析每类葡萄对应的葡萄酒大都属于哪一级别,从而得出葡萄的级别,葡萄的分级结果见表4。为了更直观看清葡萄的分级结果,作如下直方图:

红葡萄级别直方图

24681012141618高级中上中级中下下级数目/

白葡萄级别直方图

246810121416高级中上中级中下下级

数目/

图4 红葡萄和白葡萄的级别数量直方图

观察以上两幅直方图我们能很直观的看出不同级的红葡萄数量分布和正态分布很相近,中级的葡萄占了总数的大部分,高级和低级的红葡萄占了小部分,符合自然的生物规律;而不同级的白葡萄分布的一个突出特点就是高级葡萄特别多,我们查了网上的资料,绝大部分的白葡萄都是从意大利,法国等国外引进【5】,应该经过人工的精心挑选,所以分布呈现出特殊的形态。

3)酿酒葡萄与葡萄酒理化指标的联系

研究葡萄和葡萄酒的理化指标之间的联系,我们运用了主成分分析的方法,从酿酒葡萄的30个指标中提取出了12个主要成分,进而通过逐步回归的方法建立起酿酒葡萄和葡萄酒理化指标的定量联系。可以得到酿酒红葡萄的蛋白质、花色苷、褐变度、单宁和总酚及白藜芦醇、黄酮醇、总糖和可滴定酸等与红葡萄酒的理化指标存在较强的正相关性,果梗比、果皮质量与红葡萄酒的理化指标存在负相关;酿酒白葡萄中的单宁和总酚、白藜芦醇等与白葡萄酒的理化指标存在正相关关系,花色苷、褐变度、果梗比、果皮质量等与白葡萄酒的理化指标存在负相关关系。 4)理化指标对葡萄酒质量的影响及其论证结果

研究葡萄与葡萄酒的理化指标对葡萄酒质量的影响,考虑了葡萄和葡萄酒芳香物质对葡萄酒的影响,得知红、白葡萄和红、白葡萄酒的芳香物质对葡萄酒的质量有30%以上的影响比重,且白葡萄的芳香物质对白葡萄酒的质量影响相对更大,也就是说它们的理化指标对葡萄酒的质量有较大程度的影响,但并不能完全用酿酒葡萄和葡萄酒的理化指标评价葡萄酒的质量,葡萄酒的质量还受到芳香物质、外观及加工工艺等其他因素的影响。

六、模型的检验

6.1回归模型的假设检验

葡萄酒的理化理化指标y 与酿酒葡萄的主成分1212,,

,x x x 之间是否存在如模型

(10)所示的线性关系是需要检验的。 1)回归方程的显著性检验

如果所有(1,2,,12)i b i =都很小,y 与12,,,p x x x 的线性关系就不大,所以可以令

原假设为

0:0(1,2,,12)i H b i ==

1:(1,2,,12)i H b i =至少有一个不为零

当0H 成立时由统计知识可知

12

~(12,27121)121)

U F F Q =----

Q 和U 是根据前面模型的建立得到统计值:27

2

1

?()i i i Q y y

==-∑,27

21

?()i i U y y ==-∑;在显著性水平α下有上分位数(12,27121)F α--,若(12,27121)F F α<--,接受0H ;否则,拒接。

利用MATLAB 软件进行回归模型的假设检验,我们取α=0.05,则(12,14)F α=2.53我们得到F 向量的7个值:14.8100 10.5319 9.0860 7.9587 6.6878 7.2357 6.6663。

2)回归系数的显著性检验 检验假设

01:0,:0(1,2,,12)i i H b H b i =≠=

对给定的显著水平α

计算统计量i T =i t 。

若2(27121)i t t α≥--,则拒绝0H ,即认为i b 显著不为零;若(27121)i t t α<--,则接受0H ,即认为i b 等于零。该模型的系数均通过了回归系数的t 检验。 3)复相关系数检验 复相关系数的定义:

21e R

T T

S S R S S =

=- 当离差平方和e S 越小,则复相关系数越大。该指标反映了一组自变量12,,

,p x x x 解释因

变量y 的程度,201R <≤。2R 越接近1,表示因变量y 与各自变量之间i x 线性相关程度越强。该回归模型的复相关系数2R 为0.7201 0.6331 0.7530 0.9307 0.6878 0.8521 0.8663,线性相关性较好。所以我们能接受用回归模型来线性刻画酿酒葡萄和葡萄酒理化指标之间的联系。

七、模型的评价与优化

7.1模型优缺点分析

优点:该模型深入研究了酿酒葡萄及葡萄酒的理化指标,清晰明了的刻画了两种指标对葡萄酒质量的影响,创新性地通过数据评价了葡萄酒的品质,结合现在比较成熟的感官评价规则,更加客观全面地评价了葡萄酒。

缺点:我们不能排除酿酒葡萄的理化指标与葡萄酒的理化指标之间,以及酿酒葡萄和葡萄酒的理化指标与葡萄酒质量之间存在非线性的关系,但不管是多元线性回归还是逐步回归,都无法完全刻画指标与质量之间的关系。 7.2模型联系函数的改进分析

刻画联系的函数可由线性改为非线性(如正态函数),对于每个模型用更加合理的联

系函数去衡量(因为每个联系的关系和影响程度是不同的),得到更加精确的模型。

八、参考文献

【1】李华等. 葡萄酒感官评价结果的统计分析方法研究. 中国食品学报. 第6卷,第2

期,2006年4月.

【2】盛骤,谢氏千等,概率论与数理统计. 高等教育出版社,2008年6月,第181页.

【3】张哲,罗伯特帕克是如何评分的,https://www.360docs.net/doc/951862772.html,/article-150149.html ,2012年9月8日.

【4】薛毅,陈立萍.统计建模与R 软件(下册).清华大学出版社2006年.466页.

【5】百度文库,白葡萄品种,https://www.360docs.net/doc/951862772.html,/view/50999510f18583d0496459aa.html ,2012年9月9日.

【6】Cleve B.Moler 著,喻文健 译. MATLAB 数值计算,机械工业出版社,2006年6月. 第243页

九、附录

附录1:

对红葡萄酒而言:

(1)2(1)2(1)2(1)211112127(,,,)=[83.61,35.81,41.24,97.24,55.81,53.76,93.25,39.61,29.65,12.17,63.69,

71.69,40.44,32.4,77.01,16.29,79.21,42.49,42.64,23.44,104.49,45.56,29.24,67.4,58.16,28.16,44.8];S s s s = (1)2(1)2(1)2(1)222122227(,,,)=[73.69,14.6,27.64,37.16,12.29,19.01,56.4,58.6,23.16,32.56,34.24,

22.61,13.76,20.84,37.21,18.09,8.25,45.24,49.64,35.16,31.96,21.84,22.29,9.65,39.36,37.4,18.45];

S s s s =

对白葡萄而言 (2)2(2)2(2)2(2)211112127(,,

,)=[83,180.96,328.61,40.24,113.8,146.44,35.25,

165.24,83.49,191.41,159.41,104.21,153.69,102.8,118.44,160.16,129.76,140.89,41.76,57.96,155.44,124.8,39.29,100.01,30.49,65S s s s =.61,129.96,72.41];

(2)2(2)2(2)2(2)222122227(,,

,)=[23.29,44.16,128.24,37.89,23.65,20.45,

37.65,28.01,95.64,63.36,79.04,126.04,42.09,14.29,48.64,74.01,34.61,27.21,23.44,45.04,57.96,48.24,10.44,34.69,95.85,92.61,32,22S s s s =.84];

附录2:

红葡萄酒使用置信区间前评分:

68 71 80 52 53 76 71 73 70 67 75 76 76 71 68 74 83 73 73 71 82 69 80 78 63 75 72 77 74 76 75 79 73 72 60 77 73 73 60 70 66 68 77 75 76 73 72 72 74 68 65 67 75 61 58 66 70 67 67 67 68 65 68 65 47 70 57 74 72 67 71 70 78 51 62 69 73 59 68 59 81 83 85 76 69 80 83 77 75 73 67 73 82 62 63 66 66 72 65 72 64 61 67 62 50 66 64 51 67 64 67 68 75 58 63 73 67 72 69 71 74 64 68 65 70 67 70 76 69 65 71 71 78 64 67 76 74 80 73 72 62 60 73 54 59 71 71 70 68 69 71 65 78 70 64 73 66 75 68 69 72 73 75 74 75 77 79 76 76 68 67 65 80 55 62 64 62 74 60 65 72 65 82 61 64 81 76 80 74 71 80 75 80 66 70 84 79 83 71 70 80 72 75 72 62 77 63 70 73 78 77 79 75 62 68 69 73 71 69 73 79 77 80 83 67 79 80 71 81 74 66 69 72 73 73 68 72 76 76 70 68 68 84 62 60 66 69 73 66 66 68 67 83 64 73 74 77 78 63 73 71

64 72 71 69 71 82 73 73 69

使用置信区间后

68.0000 71.0000 71.4000 60.6000 61.6000 76.0000 71.0000 73.0000 70.0000 67.0000;

75.0000 76.0000 76.0000 71.0000 71.8000 74.0000 79.2000 73.0000 73.0000 71.0000;

76.7000 74.3000 74.7000 78.0000 68.3000 75.0000 72.0000 77.0000 74.0000 76.0000;

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写):B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3.

指导教师或指导教师组负责人(打印并签名): ?(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

2013全国数学建模大赛a题优秀论文

车道被占用对城市道路通行能力的影响 摘要 随着城市化进程加快,城市车辆数的增加,致使道路的占用现象日益严重,同时也导致了更多交通事故的发生。而交通事故发生过程中,路边停车、占道施工、交通流密增大等因素直接导致车道被占用,进而影响了城市道路的通行能力。本文在视频提供的背景下通过数据采集,利用数据插值拟合、差异对比、车流波动理论等对这一影响进行了分析,具体如下: 针对问题一,首先根据视频1中交通事故前后道路通行情况的变化过程运用物理观察测量类比法、数学控制变量法提取描述变量(如事故横断面处的车流量、车流速度以及车流密度)的数据,从而通过研究各变量的变化,来分析其对通行能力的影响。而视频1中有一些时间断层,我们可根据现有的数据先用统计回归对各变量数据插值后再进行拟合,拟合过程中利用残差计算值的大小来选择较好的模型来反应各变量与事故持续时间的关系,进而更好地说明事故发生至撤离期间,事故所处横断面实际通行能力的变化过程。 针对问题二:沿用问题一中的方法,对视频2中影响通行能力的各个变量进行数据采集,同样使用matlab对时间断层处进行插值拟合处理,再将所得到的的变化图像与题一中各变量的变化趋势进行对比分析,其中考虑到两视频的时间段与两视频的事故时长不同,从而采用多种对比方式(如以事故发生前、中、后三时段比较差值、以事故相同持续时间进行对比、以整个事故时间段按比例分配时间进行对比)来更好地说明这一差异。由于小区口的位置不同、时间段是否处于车流高峰期以及1、2、3道车流比例不同等因素的影响,采用不同的数据采集方式使采集的变量数据的实用性更强,从而最后得到视频1中的道路被占用影响程度高于视频2中的影响程度,再者从差异图像的变化波动中得到验证,使其合理性更强。 针对问题三:运用问题1、2中三个变量与持续时间的关系作为纽带,再根据附件5中的信号相位确定出车流量的测量周期为一分钟,测量出上游车流量随时间的变化情况,而事故横断面实际通行能力与持续时间的关系已在1、2问中由拟合得到,所以再根据波动理论预测道路异常下车辆长度模型的结论,结合采集数据得到的函数关系建立数学模型,最后得出事故发生后,车辆排队长度与事故横断面实际通行能力、事故持续时间以及路段上游车流量这三者之间的关系式。 针对问题四:在问题3建立的模型下,利用问题4中提供的变量数据推导出其它相关变量值,然后代入模型,估算出时间长度,以此检验模型的操作性及可靠性。 关键词:通行能力车流波动理论车流量车流速度车流密度

研究生如何发表优秀论文

一年三篇IF大于7的牛人告诉你怎么SCI 这是一个一年三篇IF大于7的牛人,当我问道他怎么这么强的时候,他给我他在网上总结发文章的秘笈。看了实在是心中有一种感觉,特奉献出来! 一、研究生必备四本 俗话说好记性不如烂笔头,所以一定要首先养成做笔记的好习惯!作为研究生下面这几个本子是必不可少的 1,实验记录本(包括试验准备本),这当然首当其冲必不可少,我就不多说了;2,Idea记录本,每次看文献对自己有用的东西先记下,由此产生的idea更不能放过,这可是做研究的本钱,好记性不如烂笔头,以后翻翻会更有想法的;3,专业概念以及理论进展记录本,每个人不可能对自己领域的概念都了如指掌,初入门者更是如此,这时候小小一个本子的作用就大了; 4,讲座记录本,这本本子可能有些零杂,记录听到的内容,更要记录瞬间的灵感,以及不懂的地方,不可小视! 这四本是你必不可少的,不过作为我们这些非英语专业的研究生来说,还有一个应该具备的本子就是英语好句记录本。 二、论文写作要点 1、选题要小,开掘要深;不要题目很大,内容却很单薄; 2、写作前要读好书、翻阅大量资料、注意学术积累,在这个过程中,还要注重利用网络,特别是一些专业数据库; 3、“选题新、方法新、资料新”的三新原则(老板教导的); 4、“新题新做”和“小题大做。 总之,一点之见即成文。 三、如何撰写实验研究论文(唐朝枢) 论文发表意识:基础研究成果的表达方式;是否急于发表(创新与严谨的关系);发表的论文与学位论文的区别(反映科学事实而不是反映作者水平)。 论文格式:原著、快报、简报、摘要不同于教科书、讲义,更不同于工作总结。

撰写前的准备工作:复习和准备好相关文献;再次审定实验目的(学术思想,Idea);实验资料完整并再次审核。 1.Introduction: 问题的提出;研究的现状及背景;以前工作基础;本工作的目的;思路(可提假说);对象;方法;结果。在… 模型上,观察… 指标,以探讨… (目的) 2. M & M ⑴ 材料的写法和意义; 伦理. ⑵ 程序与指标。操作程序:能序贯,可操作性;方法:多指标方法的排序;引出参照文献简述;改良之处;哪些详或简?⑶ 统计学处理 3. Results ⑴指标归类描述,忌流水帐。不分析不解释,但要体现思路 ⑵ 文字、图、表相对独立,但避免重复 ⑶ 避免统计错误:对照,均衡,随即,重复。计量-计数、绝对值-相对值、专一指标—综合指标的转换。盲判与非盲判。技术资料直接概率法与卡方检验;多组资料与两组资料;等级相关与直线相关;多因素与单因素分析;配对资料与独立样本资料;非正态分布资料;例数不当;平行管,混合样本;突出差异(绝对值,Δ值,变化%;联合×、÷比值,分亚组等)有效位数的保留。统计学结论与专业结论。 4. Discussion ⑴ 背景材料:展开问题的提出;有关本研究的一些基本知识内容(不要离题太远) ⑵ 本实验结果分析:各指标的意义(与文献值比较),结果说明什么问题 ⑶ 进一步对结果机理分析:结合文献 ⑷ 本工作的意义、结语或小结,进一步提出的新问题 其它注意点: ①引证讨论文献知识太多(不同于学位论文),掩盖了本工作的贡献 ②分析不合逻辑,结论不当

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以 上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取 消评奖资格。) 日期:2014 年9 月 15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

全国数模竞赛优秀论文

一、基础知识 1.1 常见数学函数 如:输入x=[-4.85 -2.3 -0.2 1.3 4.56 6.75],则: ceil(x)= -4 -2 0 2 5 7 fix(x) = -4 -2 0 1 4 6 floor(x) = -5 -3 -1 1 4 6 round(x) = -5 -2 0 1 5 7 1.2 系统的在线帮助 1 help 命令: 1.当不知系统有何帮助内容时,可直接输入help以寻求帮助: >>help(回车) 2.当想了解某一主题的内容时,如输入: >> help syntax(了解Matlab的语法规定) 3.当想了解某一具体的函数或命令的帮助信息时,如输入: >> help sqrt (了解函数sqrt的相关信息)

2 lookfor命令 现需要完成某一具体操作,不知有何命令或函数可以完成,如输入: >> lookfor line (查找与直线、线性问题有关的函数) 1.3 常量与变量 系统的变量命名规则:变量名区分字母大小写;变量名必须以字母打头,其后可以是任意字母,数字,或下划线的组合。此外,系统内部预先定义了几个有特殊意 1 数值型向量(矩阵)的输入 1.任何矩阵(向量),可以直接按行方式 ...输入每个元素:同一行中的元素用逗号(,)或者用空格符来分隔;行与行之间用分号(;)分隔。所有元素处于一方括号([ ])内; 例1: >> Time = [11 12 1 2 3 4 5 6 7 8 9 10] >> X_Data = [2.32 3.43;4.37 5.98] 2 上面函数的具体用法,可以用帮助命令help得到。如:meshgrid(x,y) 输入x=[1 2 3 4]; y=[1 0 5]; [X,Y]=meshgrid(x, y),则 X = Y =

数学建模国赛一等奖论文

电力市场输电阻塞管理模型 摘要 本文通过设计合理的阻塞费用计算规则,建立了电力市场的输电阻塞管理模型。 通过对各机组出力方案实验数据的分析,用最小二乘法进行拟合,得到了各线路上有功潮流关于各发电机组出力的近似表达式。按照电力市场规则,确定各机组的出力分配预案。如果执行该预案会发生输电阻塞,则调整方案,并对引起的部分序内容量和序外容量的收益损失,设计了阻塞费用计算规则。 通过引入危险因子来反映输电线路的安全性,根据安全且经济的原则,把输电阻塞管理问题归结为:以求解阻塞费用和危险因子最小值为目标的双目标规划问题。采用“两步走”的策略,把双目标规划转化为两次单目标规划:首先以危险因子为目标函数,得到其最小值;然后以其最小值为约束,找出使阻塞管理费用最小的机组出力分配方案。 当预报负荷为982.4MW时,分配预案的清算价为303元/MWh,购电成本为74416.8元,此时发生输电阻塞,经过调整后可以消除,阻塞费用为3264元。 当预报负荷为1052.8MW时,分配预案的清算价为356元/MWh,购电成本为93699.2元,此时发生输电阻塞,经过调整后可以使用线路的安全裕度输电,阻塞费用为1437.5元。 最后,本文分析了各线路的潮流限值调整对最大负荷的影响,据此给电网公司提出了建议;并提出了模型的改进方案。

一、问题的重述 我国电力系统的市场化改革正在积极、稳步地进行,随着用电紧张的缓解,电力市场化将进入新一轮的发展,这给有关产业和研究部门带来了可预期的机遇和挑战。 电网公司在组织电力的交易、调度和配送时,必须遵循电网“安全第一”的原则,同时按照购电费用最小的经济目标,制订如下电力市场交易规则: 1、以15分钟为一个时段组织交易,每台机组在当前时段开始时刻前给出下一个时段的报价。各机组将可用出力由低到高分成至多10段报价,每个段的长度称为段容量,每个段容量报一个段价,段价按段序数单调不减。 2、在当前时段内,市场交易-调度中心根据下一个时段的负荷预报、每台机组的报价、当前出力和出力改变速率,按段价从低到高选取各机组的段容量或其部分,直到它们之和等于预报的负荷,这时每个机组被选入的段容量或其部分之和形成该时段该机组的出力分配预案。最后一个被选入的段价称为该时段的清算价,该时段全部机组的所有出力均按清算价结算。 电网上的每条线路上有功潮流的绝对值有一安全限值,限值还具有一定的相对安全裕度。如果各机组出力分配方案使某条线路上的有功潮流的绝对值超出限值,称为输电阻塞。当发生输电阻塞时,需要按照以下原则进行调整: 1、调整各机组出力分配方案使得输电阻塞消除; 2、如果1做不到,可以使用线路的安全裕度输电,以避免拉闸限电,但要使每条 线路上潮流的绝对值超过限值的百分比尽量小; 3、如果无论怎样分配机组出力都无法使每条线路上的潮流绝对值超过限值的百分 比小于相对安全裕度,则必须在用电侧拉闸限电。 调整分配预案后,一些通过竞价取得发电权的发电容量不能出力;而一些在竞价中未取得发电权的发电容量要在低于对应报价的清算价上出力。因此,发电商和网方将产生经济利益冲突。网方应该为因输电阻塞而不能执行初始交易结果付出代价,网方在结算时应该适当地给发电商以经济补偿,由此引起的费用称之为阻塞费用。网方在电网安全运行的保证下应当同时考虑尽量减少阻塞费用。 现在需要完成的工作如下: 1、某电网有8台发电机组,6条主要线路,附件1中表1和表2的方案0给出了各机组的当前出力和各线路上对应的有功潮流值,方案1~32给出了围绕方案0的一些实验数据,试用这些数据确定各线路上有功潮流关于各发电机组出力的近似表达式。 2、设计一种简明、合理的阻塞费用计算规则,除考虑电力市场规则外,还需注意:在输电阻塞发生时公平地对待序内容量不能出力的部分和报价高于清算价的序外容量出力的部分。 3、假设下一个时段预报的负荷需求是982.4MW,附件1中的表3、表4和表5分别给出了各机组的段容量、段价和爬坡速率的数据,试按照电力市场规则给出下一个时段各机组的出力分配预案。 4、按照表6给出的潮流限值,检查得到的出力分配预案是否会引起输电阻塞,并在发生输电阻塞时,根据安全且经济的原则,调整各机组出力分配方案,并给出与该方案相应的阻塞费用。 5、假设下一个时段预报的负荷需求是1052.8MW,重复3~4的工作。 二、问题的分析

获国家“一等奖”小学数学论文

撷数学作业之材筑精彩成功之路 ——谈谈小学数学作业设计的几点做法 【摘要】:课堂教学是一种重要的教学形式,为了更好的反馈课堂教学效果,重要形式就是学生的作业。平日那种周而复始、形式单一的作业已使学生成为一个"机械工",学生的好奇心、求知欲、创造性受到压制。为此,作为一线教师,课堂教学是一种重要的教学形式,在不断改革课堂教学的同时,还要改变原有的作业观,认识到作业也应顺应课改要求,利用丰富多彩展示形式,展现出全新的形态。 【关键词】:数学作业趣味性层次性探索性开放性物竞天择,适者生存。在实施新课程改革的浪潮中,我们小学数学的课堂发生了巨大的改变,在有效备课与有效课堂的实践中,许多老师积累了丰富的经验和案例,但在作业设计方面,许多教师往往过多地依赖教科书,迷信习题集,对作业的设计认识不足。其实数学作业是课堂教学的复习与巩固,也是课堂教学的延续和补充,是学生学习数学、发展思维的一项经常性的实践活动,也是检验学生独立完成学习任务的主要形式。如果作业设计不科学,不仅加重了学生的课业负担,而且制约了学习的灵活性,扼杀了学生学习的积极性。如何以新课程标准为依据,设计出新

颖、有趣、开放的新型数学作业,这就要求教师在不断改革课堂教学的同时,还要改变原有的作业观,认识到作业也应顺应课改要求,利用丰富多彩展示的形式,展现出全新的教学理念。经过这几年的教学实践,谈谈本人在这方面的几点做法: 一、作业设计要具有趣味性让学生成为学习的好学者 在小学生的眼里,那些新颖、生动、灵活多变的事物往往更容易引起的兴趣,促使他们的思维始终处于积极状态,产生强烈的求知欲,使其进入最佳学习状态。根据这一规律,我们在设计作业时,就应该多设计一些具有童趣性和亲近性的作业,以激发学生的学习兴趣,使学生成为一个乐学者。 1、童趣性作业。作业设计时,可从学生的年龄特征和生活经验出发,设计具有童趣性和亲近性的数学作业,以激发学生的学习兴趣。 例如:在学习了“乘数是一位数的乘法”后,可设计一些如“找门牌号”、“小熊闯关”、“小壁虎找尾巴”等带有童趣味的游戏性作业,把一道道计算题融合在故事情节中,让学生在轻松愉悦的氛围中,掌握运算的方法和技能,提高学生的计算能力。 2、游戏类作业。游戏是激发兴趣的最好载体。游戏作业带有“玩”的色彩,设计游戏类作业要考虑与所学习的数学内容有关系,此类作业主要用于低中年级。

全国数学建模优秀论文

上海世博会影响力的定量评估 摘要 本文主要针对世博会对上海市的发展产生的影响力进行定量评估。 在模型一中,首先我们从上海的城市基础设施建设这一侧面定量评估世博会对上海市的发展产生的影响,而层次分析法是对社会经济系统进行系统分析的有力工具。所以我们运用层次分析法,构造成对比矩阵a,找到最大特征值 ,运用 进行一致性检验,这样对成对比矩阵a进行逐步修正,最终可以确定权向量。再运用模糊数学的综合评价法,通过组合权向量就可以得出召开世博会比没有召开世博会对上海城市基本设施建设的影响要高出40%。 在模型二中,上海世博会的影响力直接体现在GDP上,我们直接以GDP这个硬性直接指标来衡量上海世博会对上海的影响。因此我们运用线性回归的模型预测出在有无上海世博会这两者情况下的GDP的值,并将运用线性回归得到的数据与上海统计年鉴中的相关数据进行比较运算,算出误差在1.2%左右,这说明我们用线性回归得到的模型能准确地反映出世博会对上海GDP的影响。运用公式 可以计算出世博对上海GDP的影响力的大小为 。 关键词:层次分析法模糊数学线性回归城市基础建设 GDP 1 问题重述

2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2010年上海世博会的影响力。 2 问题分析 对于模型一,为了定量评估2010年上海世博会的影响力,我们首先选取城市基础设施建设的投入这一个侧面,因为通过查找相关数据,我们发现,城市基础设施建设的投入在上海整个GDP的增长中占有很大的比重,对GDP的贡献占主体地位。而层次分析法是对社会经济系统进行系统分析的有力工具。为此,我们通过研究上海统计局的相关数据,使用层次分析法来评估世博会的召开对基础设施建设的投入的影响,目标层为世博会的召开对基础设施建设的投入的影响,准则层依次为电力建设、交通运输、邮电通信、公用事业、市政建设,方案层依次为没有召开世博时的影响、召开世博时的影响。首先我们通过层次分析法算出电力建设、交通运输、邮电通信、公用事业、市政建设的相对权重,然后应用模糊数学中的综合评价法对上海世博会对城市基础设施建设的影响作出综合的评价,应用综合评价法计算出没有召开世博和召开世博两种情况下的权重,从而得出上海世博会的召开对城市基础设施建设的影响。 对于模型二,直接以GDP这个硬性直接指标来衡量上海世博会对上海的影响。先根据上海没有申办世博会的GDP总额的相关数据,建立线性回归模型,由此预测不举办世博会情况下2010年上海市的GDP总额;再由2002年至2009年的GDP值用线性回归预测出举办世博会情况下2010年上海市的GDP总额,并将两种情况进行对比得出世博会对上海GDP的影响。 3 模型假设 3.1假设非典和奥运等重大事件对世博前的城市基础建设的投入影响很小,可以忽略。

数学建模全国赛07年A题一等奖论文

关于中国人口增长趋势的研究 【摘要】 本文从中国的实际情况和人口增长的特点出发,针对中国未来人口的老龄化、出生人口性别比以及乡村人口城镇化等,提出了Logistic、灰色预测、动态模拟等方法进行建模预测。 首先,本文建立了Logistic阻滞增长模型,在最简单的假设下,依照中国人口的历史数据,运用线形最小二乘法对其进行拟合,对2007至2020年的人口数目进行了预测,得出在2015年时,中国人口有13.59亿。在此模型中,由于并没有考虑人口的年龄、出生人数男女比例等因素,只是粗略的进行了预测,所以只对中短期人口做了预测,理论上很好,实用性不强,有一定的局限性。 然后,为了减少人口的出生和死亡这些随机事件对预测的影响,本文建立了GM(1,1) 灰色预测模型,对2007至2050年的人口数目进行了预测,同时还用1990至2005年的人口数据对模型进行了误差检验,结果表明,此模型的精度较高,适合中长期的预测,得出2030年时,中国人口有14.135亿。与阻滞增长模型相同,本模型也没有考虑年龄一类的因素,只是做出了人口总数的预测,没有进一步深入。 为了对人口结构、男女比例、人口老龄化等作深入研究,本文利用动态模拟的方法建立模型三,并对数据作了如下处理:取平均消除异常值、对死亡率拟合、求出2001年市镇乡男女各年龄人口数目、城镇化水平拟合。在此基础上,预测出人口的峰值,适婚年龄的男女数量的差值,人口老龄化程度,城镇化水平,人口抚养比以及我国“人口红利”时期。在模型求解的过程中,还对政府部门提出了一些有针对性的建议。此模型可以对未来人口做出细致的预测,但是需要处理的数据量较大,并且对初始数据的准确性要求较高。接着,我们对对模型三进行了改进,考虑人为因素的作用,加入控制因子,使得所预测的结果更具有实际意义。 在灵敏度分析中,首先针对死亡率发展因子θ进行了灵敏度分析,发现人口数量对于θ的灵敏度并不高,然后对男女出生比例进行灵敏度分析得出其灵敏度系数为0.8850,最后对妇女生育率进行了灵敏度分析,发现在生育率在由低到高的变化过程中,其灵敏度在不断增大。 最后,本文对模型进行了评价,特别指出了各个模型的优缺点,同时也对模型进行了合理性分析,针对我国的人口情况给政府提出了建议。 关键字:Logistic模型灰色预测动态模拟 Compertz函数

全国大学生数学建模一等奖获奖论文

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的电子文件名:B0302 所属学校(请填写完整的全名):广西师范学院 参赛队员(打印并签名) :1. 钟兴智 2. 尹海军 3. 斯婷 指导教师或指导教师组负责人(打印并签名):韦程东 日期: 2007 年 9 月 24 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

乘公交,看奥运 摘要 我们基于最小换乘次数算法,设计了公交查询系统,能够分别从时间和花费 出发考虑,选择最优路径,以满足查询者的各种不同需求。 问题一:采用最小换乘次数算法,求出任意两站的最小换乘次数,在次数一定的情况下,分别选取花费最少和时间最少作为优化目标,建立两种模型:最少时间模型:∑∑==+-+?=3 1 3 1 5)))1(((3),(min i i i i i i i x q x n x B A f ;最少花费模型: ))1((),(m in '''3 1 i i i y x x B A g -+=∑;利用两种模型求出6组数局的最佳路线如下(两 地铁的线路转化成公交的问题,改进问题一中的模型求出此问题的最少时间模型 + +-+?=∑∑∑===)))5)))1(((3((),(m in 3 1 3 1 3 1 i i i i i i i i i x q x n x y B A f ++-+?-∑∑∑===)4))))1(((5.2)(1((31 31 ' 31 i i i i i i i i i x q x n x y ∑=-3 1 i )z 1(7i i y +∑=3 1 i z 6i i y 最小换乘算法进行了改进。 关键词:最小换乘次数, 算法,紧邻点,数据库,路线集

SARS传播的数学模型 数学建模全国赛优秀论文

SARS传播的数学模型 (轩辕杨杰整理) 摘要 本文分析了题目所提供的早期SARS传播模型的合理性与实用性,认为该模型可以预测疫情发展的大致趋势,但是存在一定的不足.第一,混淆了累计患病人数与累计确诊人数的概念;第二,借助其他地区数据进行预测,后期预测结果不够准确;第三,模型的参数L、K的设定缺乏依据,具有一定的主观性. 针对早期模型的不足,在系统分析了SARS的传播机理后,把SARS的传播过程划分为:征兆期,爆发期,高峰期和衰退期4个阶段.将每个阶段影响SARS 传播的因素参数化,在传染病SIR模型的基础上,改进得到SARS传播模型.采用离散化的方法对本模型求数值解得到:北京SARS疫情的预测持续时间为106天,预测SARS患者累计2514人,与实际情况比较吻合. 应用SARS传播模型,对隔离时间及隔离措施强度的效果进行分析,得出结论:“早发现,早隔离”能有效减少累计患病人数;“严格隔离”能有效缩短疫情持续时间. 在建立模型的过程中发现,需要认清SARS传播机理,获得真实有效的数据.而题目所提供的累计确诊人数并不等于同期累计患病人数,这给模型的建立带来不小的困难. 本文分析了海外来京旅游人数受SARS的影响,建立时间序列半参数回归模型进行了预测,估算出SARS会对北京入境旅游业造成23.22亿元人民币损失,并预计北京海外旅游人数在10月以前能恢复正常. 最后给当地报刊写了一篇短文,介绍了建立传染病数学模型的重要性.

1.问题的重述 SARS (严重急性呼吸道综合症,俗称:非典型肺炎)的爆发和蔓延使我们认识到,定量地研究传染病的传播规律,为预测和控制传染病蔓延创造条件,具有很高的重要性.现需要做以下工作: (1) 对题目提供的一个早期模型,评价其合理性和实用性. (2) 建立自己的模型,说明优于早期模型的原因;说明怎样才能建立一个真正能够预测以及能为预防和控制提供可靠、足够信息的模型,并指出这样做的困难;评价卫生部门采取的措施,如:提前和延后5天采取严格的隔离措施,估计对疫情传播的影响. (3) 根据题目提供的数据建立相应的数学模型,预测SARS 对社会经济的影响. (4) 给当地报刊写一篇通俗短文,说明建立传染病数学模型的重要性. 2.早期模型的分析与评价 题目要求建立SARS 的传播模型,整个工作的关键是建立真正能够预测以及能为预防和控制提供可靠、足够的信息的模型.如何结合可靠、足够这两个要求评价一个模型的合理性和实用性,首先需要明确: 合理性定义 要求模型的建立有根据,预测结果切合实际. 实用性定义 要求模型能全面模拟真实情况,以量化指标指导实际. 所以合理的模型能为预防和控制提供可靠的信息;实用的模型能为预防和控制提供足够的信息. 2.1早期模型简述 早期模型是一个SARS 疫情分析及疫情走势预测的模型, 该模型假定初始时刻的病例数为0N , 平均每病人每天可传染K 个人(K 一般为小数),K 代表某种社会环境下一个病人传染他人的平均概率,与全社会的警觉程度、政府和公众采取的各种措施有关.整个模型的K 值从开始到高峰期间保持不变,高峰期后 10天的范围内K 值逐步被调整到比较小的值,然后又保持不变. 平均每个病人可以直接感染他人的时间为L 天.整个模型的L 一直被定为20.则在L 天之内,病例数目的增长随时间t (单位天)的关系是: t k N t N )1()(0+?= 考虑传染期限L 的作用后,变化将显著偏离指数律,增长速度会放慢.采用半模拟循环计算的办法,把到达L 天的病例从可以引发直接传染的基数中去掉. 2.2早期模型合理性评价 根据早期模型对北京疫情的分析与预测,其先将北京的病例起点定在3月1日,经过大约59天在4月29日左右达到高峰,然后通过拟合起点和4月20日以后的数据定出高峰期以前的K =0.13913.高峰期后的K 值按香港情况变化,即10天范围内K 值逐步被调整到0.0273.L 恒为20.由此画出北京3月1日至5月7日疫情发展趋势拟合图像以及5月7日以后的疫情发展趋势预测图像,如图1.

数学建模优秀论文全国一等奖

Haozl觉得数学建模论文格式这么样设置 版权归郝竹林所有,材料仅学习参考 版权:郝竹林 备注☆ ※§等等字符都可以作为问题重述左边的。。。。。一级标题 所有段落一级标题设置成段落前后间距13磅 二级标题设置成段落间距前0.5行后0.25行 Excel中画出的折线表字体采用默认格式宋体正文10号 图标题在图上方段落间距前0.25行后0行 表标题在表下方段落间距前0行后0.25行 行距均使用单倍行距 所有段落均把4个勾去掉 注意Excel表格插入到word的方式在Excel中复制后,粘贴,word2010粘贴选用使用目标主题嵌入当前 Dsffaf 所有软件名字第一个字母大写比如E xcel 所有公式和字母均使用MathType编写 公式编号采用MathType编号格式自己定义 公式编号在右边显示

农业化肥公司的生产与销售优化方案 摘 要 要求总分总 本文针对储油罐的变位识别与罐容表标定的计算方法问题,运用二重积分法和最小二乘法建立了储油罐的变位识别与罐容表标定的计算模型,分别对三种不同变位情况推导出的油位计所测油位高度与实际罐容量的数学模型,运用matlab 软件编程得出合理的结论,最终对模型的结果做出了误差分析。 针对问题一要求依据图4及附表1建立积分数学模型研究罐体变位后对罐容表的影响,并给出罐体变位后油位高度间隔为1cm 的罐容表标定值。我们作图分析出实验储油罐出现纵向倾斜ο14.时存在三种不同的可能情况,即储油罐中储油量较少、储油量一般、储油量较多的情况。针对于每种情况我们都利用了高等数学求容积的知识,以倾斜变位后油位计所测实际油位高度为积分变量,进行两次积分运算,运用MATLAB 软件推导出了所测油位高度与实际罐容量的关系式。并且给出了罐体倾斜变位后油位高度间隔为1cm 的罐容标定值(见表1),最后我们对倾斜变位前后的罐容标定值残差进行分析,得到样本方差为4103878.2-?,这充分说明残差波动不大。我们得出结论:罐体倾斜变位后,在同一油位条件下倾斜变位后罐容量比变位前罐容量少L 243。 表 1.1 针对问题二要求对于图1所示的实际储油罐,试建立罐体变位后标定罐容表的数学模型,即罐内储油量与油位高度及变位参数(纵向倾斜角度α和横向偏转角度β)之间的一般关系。利用罐体变位后在进/出油过程中的实际检测数据(附件2),根据所建立的数学模型确定变位参数,并给出罐体变位后油位高度间隔为10cm 的罐容表标定值。进一步利用附件2中的实际检测数据来分析检验你们模型的正确性与方法的可靠性。我们根据实际储油罐的特殊构造将实际储油罐分为三部分,左、右球冠状体与中间的圆柱体。运用积分的知识,按照实际储油罐的纵向变位后油位的三种不同情况。利用MATLAB 编程进行两次积分求得仅纵向变位时油量与油位、倾斜角α的容积表达式。然后我们通过作图分析油罐体的变位情况,将双向变位后的油位h 与仅纵向变位时的油位0h 建立关系表达式01.5(1.5)cos h h β=--,从而得到双向变位油量与油位、倾斜角α、偏转角β的容积表达式。利用附件二的数据,采用最小二乘法来确定倾斜角α、偏转角β的值,用matlab 软件求出03.3=α、04=β α=3.30,β=时总的平均相对误差达到最小,其最小值为0.0594。由此得到双向变位后油量与油位的容积表达式V ,从而确定了双向变位后的罐容表(见表2)。 本文主要应用MATLAB 软件对相关的模型进行编程求解,计算方便、快捷、准确,整篇文章采取图文并茂的效果。文章最后根据所建立的模型用附件2中的实际检测数据进行了误差分析,结果可靠,使得模型具有现实意义。 关键词:罐容表标定;积分求解;最小二乘法;MATLAB ;误差分

全国第五届研究生数学建模优秀论文

全国第五届研究生数学建模竞赛 题目大中型商场中央空调节能运行方案研究(国家二等奖论文) 参赛队员:邓书莉万里鹏何志刚 摘要: 大型商场中央空调节能控制是一个焦点问题。本文通过研究影响商场冷负荷的六大因素,采用计算机模拟的方法,提出了两级控制的节能方案,所得结果是比较满意的。 对于问题1,在定义出客流量密度基础上,结合冷冻水补偿的冷负荷和建筑物围护结构输入冷负荷等分别求出了人流量的冷负荷和照明等电气设备的冷负荷。通过计算并与相关文献所研究的大型商场中各冷负荷所占比例相比较,发现两者结果基本吻合。 对于问题2,是在问题1的基础上,将商场的人流量和外部环境温度由恒定值变为随营业时间变化的函数,从而求出总的冷负荷的函数表达式。通过计算机 模拟得到冷负荷的误差范围为[0.05,0.35] ω=。 ω∈-,平均误差为16.4%对于问题3,首先分别了拟合出了商场一天内的客流量密度变化曲线和夏季某天室外温度变化曲线,从而得到商场总的冷负荷与室外温度之间的函数关系式,进而可以求出商场一天内冷冻水的水流量随营业时间变化的函数关系,然后通过“两级控制法”分别对冷冻水水泵进行粗调和细调,达到既使商场温度稳定又节能的控制目的。之后,采用“两级控制法”对具体的案例提出了控制策略,通过与题目所给情况对比,得到节能效率为30.79%。 对于问题4,结合问题2与问题3的定义以及求解方法,求出设定温度为26℃下,商场每天的基准冷负荷为:1.5043×1010 J。当设定温度提高到27℃时,此时的基准冷负荷减少了1.575×109 J。 本文优点在于通过计算机模拟,计算结果更有信服力。同时,提出的两级控制法的节能效果明显。 关键词:客流密度,计算机模拟,冷负荷模型,两级控制法

2014年数学建模国家一等奖优秀论文

承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写):B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期:2014 年 9 月 15日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

创意平板折叠桌 摘要 目前住宅空间的紧张导致越来越多的折叠家具的出现。某公司设计制作了一款折叠桌以满足市场需要。以此折叠桌为背景提出了三个问题,本文运用几何知识、非线性约束优化模型等方法成功解决了这三个问题,得到了折叠桌动态过程的描述方程以及在给定条件下怎样选择最优设计加工参数,并针对任意形状的桌面边缘线等给出了我们的设计。 针对问题一,根据木板尺寸、木条宽度,首先确定木条根数为19根,接着,根据桌子是前后左右对称的结构,我们只以桌子的四分之一为研究对象,运用空间几何的相关知识关系,推导并建立了几何模型。接着用MATLAB软件编程,绘制出折叠桌动态变化过程图。然后求出折叠桌各木条相对桌面的角度、各木条长度、各木条的开槽长度等数据,相关结果见表1。然后建立相应的三维坐标系,求出桌角各端点坐标,绘出桌角边缘线曲线图,并用MATLAB工具箱作拟合,求出桌角边缘线的函数关系式,并对拟合效果做分析(见表3)。 针对问题二,在折叠桌高度、桌面直径已知情况下,综合考虑桌子稳固性、加工方便、用材最少三个方面因素,我们运用材料力学等相关知识,对折叠桌作受力分析,确定稳固性、加工方便、用材最少三个方面因素间的相互制约关系,建立非线性优化模型。用lingo软件编程,求出对于高70 cm,桌面直径80 cm的折叠桌,平板尺寸172.24cm×80cm×3cm、钢筋位置在桌腿上距离铰链46.13cm处、各木条的开槽长度(见表3)、最长木条(桌脚)与水平面夹角71.934°。 针对问题三,对任意给出的桌面边缘线(f(x)),不妨假定曲线是对称的(否则,桌子的稳定性难以保证),将对称轴上n等份,依照等份点沿着木板较长方向平行的方向下料,则这些点即是铰接处到木板中垂线(相对于木板长方向)的距离。然后修改问题二建立的优化模型,用lingo软件编程,得到最优设计加工参数(平板尺寸、钢筋位置、开槽长度等)。最后,我们根据所建立的模型,设计了一个桌面边缘线为椭圆的折叠桌,并且给出了8个动态变化过程图(见图10)和其具体设计加工参数(见表5)。 最后,对所建立的模型和求解方法的优缺点给出了客观的评价,并指出了改进的方法。 关键字:折叠桌曲线拟合非线性优化模型受力分析

全国数学建模获奖论文

承诺书 我们仔细阅读了数学建模竞赛选拔的规则. 我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。 我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。如有违反选拔规则的行为,我们将受到严肃处理。 我们选择的题号是(从A/B/C中选择一项填写): 队员签名:1. 2. 3. 日期:年月日

2012年河南科技大学数学建模竞赛选拔 编号专用页 评阅编号(评阅前进行编号): 评阅记录(评阅时使用): 评 阅 人 评 分 备 注

C题数学建模竞赛成绩评价与预测 一、摘要 近20 年来,CUMCM 的规模平均每年以20%以上的增长速度健康发展,是目前全国高校中规模最大的课外科技活动之一。本文对数学建模竞赛成绩的评价与预测问题进行了建模、求解和相关分析。 对于问题一,首先对广东赛区各院校2008-2011年建模奖励数据进行统计分析,将决策问题分为三个层次,建立多层次模糊综合评判模型。在该模型中,将因素集{国家一等奖,国家二等奖,省一等奖,省二等奖,省三等奖}看作准则层,将2008-2011各年建模情况看作方案层,结合实际情况,给出改进综合评判模型,解得广东金融学院、华南农业大学的总体综合评定成绩分别2.9474、2.7141,排名第一、第二。 对于问题二,首先建立单年的综合评定模型,得出广州赛区各院校2008-2011年的综合评定成绩。鉴于仅有4组数据,分别采用GM(1,1)法、回归曲线最小二乘法、移动平均法进行建模,最后结合实际情况并根据结果对比以上三种模型,确定了移动平均法方案最优,最终得出广东金融学院、华南农业大学的综合评定成绩分别为0.7369、0.6785,依旧排名第一、第二,较好地解决了问题二。 对于问题三,鉴于附件2所给数据冗杂庞大,故从中抽取2008-2011年的建模数据作为样本,分别统计出本科组和专科组在这四年中每年获得国家一等奖和国家二等奖的人数;将问题一中国家一等奖、二等奖的权重进行归一化处理,建立类似问题一的特殊综合评判模型,得出本科组哈尔滨工业大学、解放军信息工程大学的综合评定成绩分别为5.5117、4.6609;专科组海军航空工程学院、太原理工轻纺与美术学院的综合评定成绩分别为1.3931、1.3095,名列各组第一、第二,问题三得到了较好解决。 对于问题四,除全国竞赛成绩、赛区成绩外,讨论了学生的能力、参赛队数、师资力量、学校的综合实力、硬件设施等因素对建模成绩评估的影响,考虑首先对因素集进行模糊聚类分析,然后用层次分析法来进行评价,用BP神经网络结合Matlab软件来进行预测,理论上问题四能够得到较好地得到解决。 关键词: 模糊综合评判模型GM(1,1)模型移动平均法综合评定成绩

研究生优秀论文评选方法

研究生优秀学位论文评选办法 为鼓励研究生刻苦钻研,努力创新,提高学位论文质量,并促进导师注重研究生科学研究能力的培养,根据我校实际情况,制订本办法。 一、评选范围及比例 凡当年在我校通过博士、硕士学位论文答辩者均可参加评选。优秀学位论文的评选比例按学科划分,硕士点为毕业生总数的5%,博士点为毕业生总数的10%。 二、评选标准 优秀学位论文的评选,应主要以社会评价为依据,主要包括如下内容: (一)以学位论文为主要内容,在国际、国内学术刊物和国际会议上发表论文的篇数以及论文被SCI、EI、ISTP三大检索收录情况; (二)获奖情况(包括研究生发表的论文及所参加的科研项目两个部分),获奖级别(如国家、省部、市、校级等)、次数及研究生排名; (三)申请专利情况; (四)论文期间承担或参与的科研项目以及所取得的重大经济效益或社会效益(附有关证明材料)。 (五)论文答辩委员会推荐意见及论文评阅意见。 三、评选程序 (一)研究生本人或导师于答辩结束后,立即填写有关申请表格:“作者简况表”、“指导教师简况表”、“优秀博/硕士学位论文推荐表”(以上表格可在校园网“学位与培养”中下载)。填写的表格及中、英文摘要须上交电子版。另还须将论文评阅人评语、答辩委员会评语及在学期间发表论文的审核意见栏(培养处教学管理科签字)的复印件附后。并将以上材料交存学院研究生工作办公室,以便下半年申报优秀学位论文时用(论文答辩后至优秀学位论文评选前取得的成果及发表的文章亦可列入申请表,但须将此材料的原件及复印件交学位办公室审查备案)。各学院受理后,提交所属学位评定分委员会进行初审。 (二)研究生优秀学位论文每年评选一次。每年9月中旬,各学院向学位办公室报送推荐的优秀学位论文名单及申请材料。报送的优秀学位论文申请者交纳评审费:硕士学位论文每篇300元,博士学位论文每篇600元;申请优秀学位论文者另需交论文3册(涉及作者及导师姓名的有关内容一律删掉)。 (三)学位办公室将学院报送的优秀学位论文隐名送3名校外专家评审,并回收评审意见; (四)学位办公室根据情况将优秀学位论文评审情况报校学位评定委员会审定,并将审定结果公布; (五)优秀学位论文获奖名单公布后,在一个月内无异议,则获奖生效;如有异议,须经复议决定。 (六)校级优秀学位论文经优中选优后,推荐参加省级和国家级优秀学位论文评选。四、奖励 研究生优秀学位论文奖励标准和奖励经费来源按《武汉理工大学研究生科研成果奖励基金实施管理办法》执行。 五、注意事项 (一)评选优秀学位论文是一项严肃、细致的工作,申请者要实事求是地填写申请表,

相关文档
最新文档