数学建模 DNA序列分类(2000年竞赛题)

数学建模 DNA序列分类(2000年竞赛题)
数学建模 DNA序列分类(2000年竞赛题)

DNA序列分类

摘要本问题是一个“有人管理分类问题”。首先分别列举出20个学习样本序列中1字符串、2字符串、3字符串出现的频率,构成含41个变量的基本特征集,接着用主成分分析法从中提取出4个特征。然后用Fisher线性判别法进行分类,得出了所求20个人工制造序列及182个自然序列的分类结果如下:

1)20个人工序列:22, 23,25,27,29,34,35,36,37为A类,其余为B类。

2)182个自然序列:1,4,8,10,27,29,32,41,43,48,54,63,70,72,75,76,81,86,90,92,102,110,116,119,126,131,144,150,157,159,160,161,162,163,164,165,166,169,170,182为B类,其余为A类。

最后通过检验证明所用的分类数学模型效率较高。

一.问题重述

人类基因组计划中DNA全序列草图是由4个字符A,T,C,G按一定顺序排成的长约30亿的序列,其中没有“断句”也没有标点符号。虽然人类对它知之甚少,但也发现了其中的一些规律性和结构。例如,在全序列中有一些是用于编码蛋白质的序列片段,即由这4个字符组成的64种不同的3字符串,其中大多数用于编码构成蛋白质的20种氨基酸。又例如,在不用于编码蛋白质的序列片段中,A和T的含量特别多些,于是以某些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。此外,利用统计的方法还发现序列的某些片段之间具有相关性,等等。这些发现让人们相信,DNA序列中存在着局部的和全局性的结构,充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。

作为研究DNA序列的结构的尝试,提出以下对序列集合进行分类的问题:

1)请从20个已知类别的人工制造的序列(其中序列标号1—10 为A类,11-20为B 类)中提取特征,构造分类方法,并用这些已知类别的序列,衡量你的方法是否足够好。然后用你认为满意的方法,对另外20个未标明类别的人工序列(标号21—40)进行分类,把结果用序号(按从小到大的顺序)标明它们的类别(无法分类的不写入)

2)同样方法对182个自然DNA序列(它们都较长)进行分类,像1)一样地给出分类结果。

二.模型的合理假设

1.各序列中DNA碱基三联组(即3字符串)的起始位置和基因表达不影响分类的结果。

2.64种3字符串压缩为20组后不影响分类的结果。

3.较长的182个自然序列与已知类别的20个样本序列具有共同的特征。

三.模型建立与求解

研究DNA序列具有什么结构,其A,T,C,G4个碱基排成的看似随机的序列中隐藏着什么规律,是解读人类基因组计划中DNA全序列草图的基础,也是生物信息学(Bioinformaties)最重要的课题之一。

题目给出了20个已知为两个类别的人工制造的DNA序列,要求我们从中提取特征,构造分类方法,从而对20个未标明类别的人工DNA序列和182个自然DNA序列进行分类。这是模式识别中的“有人管理分类”问题,即事先规定了分类的标准和种类的数目,通过大批已知样本的信息处理找出规律,再用计算机预报未知。给出的已知类别的样本称为学习样本。对于此类问题,我们通过建立分类数学模型(这包括形成和提取特征以及制定分类决策)、考查分类模型的效率、预报未知这几个步骤来进行。

一.特征的形成和提取

为了有效地实现分类识别,首先要根据被识别的对象产生一组基本特征,并对基本特征进行变换,得到最能反映分类本质的特征。这就是特征形成和提取的过程。在列举了尽可能完备的特征参数集之后,就要借助于数学的方法,使特征参数的数目(在保证分类良好的前提下)减到最小。这是因为:1.多余的特征参数不但没有多少好处,而且会带来噪音,干扰分类和数学模型的建立。2.为了保证样本数和特征参数个数的比值足够大,而又不必要用太多的样本,最好使特征参数的个数降至最少。模式识别计算一般要求样本数至少为变量数的3倍,否则结果不够可靠。本问题的学习样本数为20个,故特征参数的个数以6—8个为宜。

我们通过研究4个字符A,T,C,G在DNA序列中的排列、组合特性,主要是研究字符和字符串的排列在序列中出现的频率,从中提取DNA序列的结构特征参数。

(一)特征的形成

分别列举一个字符,2个字符,3个字符的排列在序列中出现的频率,构成基本特征集。

i.1个字符的出现频率

表1列出了20个样本中A,T,C,G这4个字符出现的频率。由于在不用于编码蛋白质的序列片段中,A和T的含量特别多些,因此我们将A和T是否特别丰富作为一个特征。在表一中,列出了A和T出现的频率之和。(程序见附录一)

表 1

A C T G A+T

1. 29.73 17.12 13.51 39.64 43.24

2. 27.03 16.22 15.32 41.44 42.34

3. 27.03 21.62 6.31 45.05 33.33

4. 42.34 10.81 28.83 18.02 71.17

5. 23.42 23.42 10.81 42.34 34.23

6. 35.14 12.61 12.61 39.64 4

7.75

7. 35.14 9.91 18.92 36.04 54.05

8. 27.93 16.22 18.92 36.94 46.85

9. 20.72 20.72 15.32 43.24 36.04

10. 18.18 27.27 13.64 40.91 31.82

11. 35.45 4.55 50.00 10.00 85.45

12. 32.73 2.73 50.00 14.55 82.73

13. 25.45 10.00 51.82 12.73 77.27

14. 30.00 8.18 50.00 11.82 80.00

15. 29.09 .00 64.55 6.36 93.64

16. 36.36 8.18 46.36 9.09 82.73

17. 35.45 24.55 26.36 13.64 61.82

18. 29.09 11.82 50.00 9.09 79.09

19. 21.82 14.55 56.36 7.27 78.18

20. 20.00 17.27 56.36 6.36 76.36

2.2字符串的排列出现的频率

A,T,C,G这4个字符组成了16种不同的2字符串。表2列出了20个样本中各2字符串出现的频率。(用“滚动”算法,如attcg有at,tt,tc,cg共4个2字符串)(程序与附录一类似)

表 2

AA AC AT AG TA TC TG TT CA CT CC CG GA GT GC GG

1. 9.01 9.01 3.60 8.11 4.50 .90 4.50 3.60 3.60 3.60 1.80 8.11 11.7 1

2.70 5.41 18.92

2. 9.91 7.21

3.60 5.41 2.70 1.80 5.41 5.41

4.50 1.80 .90 9.01 9.91 4.50

5.41 21.62

3. 5.41 11.71 3.60 5.41 2.70 1.80 .90 .90 5.41 .90 .90 1

4.41 13.51 .90 7.21 23.42

4. 18.92

5.41 11.71 5.41 10.81 1.80 5.41 10.81 5.41 1.80 .90 2.70

6.31 4.50 2.70 4.50

5. 6.31 8.11 1.80 7.21 1.80 2.70 2.70 3.60 5.41 4.50 2.70 10.81 9.91 .90 9.01 21.62

6. 15.32 2.70 6.31 9.91 3.60 1.80 1.80 5.41 4.50 .00 .00 8.11 10.81 .90 8.11 19.82

7. 15.32 1.80 10.81 7.21 4.50 2.70 6.31 5.41 .90 1.80 .90 6.31 13.51 .90 4.50 16.22

8. 8.11 3.60 6.31 9.91 5.41 3.60 2.70 7.21 2.70 3.60 1.80 8.11 10.81 1.80 7.2116.22

9. 9.01 .90 4.50 6.31 .00 3.60 7.21 4.50 3.60 2.70 2.70 11.71 7.21 3.60 13.5118.02

10. 6.36 3.64 1.82 6.36 1.82 5.45 2.73 3.64 5.45 3.64 4.55 13.64 4.55 3.64 13.64 18.18

11. 15.45 2.73 14.55 2.73 16.36 .91 1.82 30.00 .91 .91 .91 1.82 2.73 4.55 .00 2.73

12. 13.64 .91 10.91 6.36 15.45 1.82 1.82 30.91 .91 .91 .00 .91 2.73 7.27 .00 4.55

13. 6.36 4.55 10.00 4.55 12.73 1.82 2.73 34.55 2.73 2.73 1.82 1.8 2 3.64 4.55 1.82 2.73

14. 8.18 .91 12.73 7.27 13.64 6.36 1.82 28.18 2.73 4.55 .00 .91 5.45 4.55 .91 .91

15.13.64 .00 12.73 1.82 13.64 .00 2.73 48.18 .00 .00 .00 .00 1.82 3.64 .00 .91

16. 16.36 3.64 15.45 .9113.64 4.55 4.55 22.73 1.82 5.45 .00 .91 4.55 2.73 .00 1.82

17.17.27 5.45 10.91 1.82 10.00 6.36 4.55 5.45 4.55 7.27 9.09 2.73 3.64 2.73 3.64 3.64

18.8.18 7.27 11.82 1.82 15.45 1.82 .91 30.91 3.64 3.64 1.82 2.73 1.82 3.64 .91 2.73

19.2.73 2.73 13.64 1.82 14.55 9.09 .913 1.82 1.82 8.18 1.82 2.73 2.73 2.73 .91 .91

20. 6.36 6.36 6.36 .91 9.09 10.00 3.64 32.73 2.73 13.64 .91 .00 1.82 3.64 .00 .91

3.3字符串的排列出现的频率

A,T,C,G这4个字符组成了64种不同的3字符串。这64种3字符串构成生物蛋白质的20种氨基酸。在参考文献[1]的Figur2中,给出了这20种氨基酸的编码(见图1)。因此,在计算3字符串的出现频率时,我们根据图1将代表同一种氨基酸的3字符串合成一类,只统计20类3字符串的出现频率。(不考虑字符串在序列片段中的起始位置,也采用“滚动”算法。如acgtcc中就有acg,cgt,gtc,tcc共4个3字符串)见表3。(程序与附录一类似)

Figure 2. Symmetries of the diamond code sort the 64 codons into 20 classes, indicated here by 20 colors. All the codons in each class specified the same amino acid.

图1 Brian Hayes 在论文“The Invention of the Genetic Code”中给出的图形(注:图中DNA被转录为RNA,“U”代表“T”)

表 3

b1 b2 b3 b4 b5 b6 b7 b8 b9 b10 b11 b12 b13 b14 b15 b16 b17 b18 b19 b20

1 1.77 3.54 2.65 0.88 0.00 0.00 7.96 0.88 4.4

2 2.65 17.70 10.62 3.54 4.42 4.42 7.08 1.77 3.54 13.27 7.08

2 1.89 1.89 0.94 0.94 0.00 0.94 1.89 0.94 4.72 12.26 7.55 11.32 8.49 3.77 3.77 6.60 9.4

3 6.60 7.55 2.83

3 0.98 0.00 0.00 5.88 0.98 8.82 2.9

4 0.00 0.00 2.94 10.78 5.88 13.73 0.00 4.90 3.92 19.61 1.96 8.82 5.88

4 0.00 0.00 0.00 0.87 0.00 0.87 13.04 1.74 6.09 2.61 11.30 13.04 3.48 5.22 3.48 8.70 3.48 1.74 14.78,7.83

5 2.8

6 0.00 0.00 3.81 0.95 3.81 3.81 0.00 3.81 3.81 9.52 9.52 12.38 2.86 9.52 4.76 7.62 2.86 7.62 9.52

6 0.00 0.00 0.88 2.63 0.00 1.75 13.16 0.88 4.39 1.75 14.04 9.65 7.02 5.26 4.39 11.40 2.63 1.75 10.53 6.14

7 1.92 0.00 0.00 2.88 0.96 4.81 2.88 0.00 1.92 4.81 12.50 6.73 13.46 1.92 6.73 4.81 10.58 3.85 9.62 7.69

8 2.56 3.42 0.00 0.85 0.85 0.85 12.82 0.85 1.71 0.85 20.51 2.56 3.42 9.40 5.98 11.11 0.85 4.27 11.97 3.42

9 0.00 0.00 0.00 2.97 2.97 9.90 2.97 0.00 0.99 3.96 6.93 1.98 13.86 1.98 2.97 3.96 23.76 2.97 8.91 6.93

10 1.87 0.93 3.74 2.80 0.00 0.00 2.80 0.00 7.48 8.41 9.35 7.48 3.74 14.95 12.15 0.00 2.80 4.67 7.48 7.48

11 0.00 0.89 0.00 0.00 0.00 1.79 8.04 0.00 5.36 4.46 15.18 8.04 8.93 4.46 3.57 8.04 4.46 6.25 13.39 5.36

12 2.73 0.00 0.91 2.73 0.91 3.64 4.55 3.64 3.64 1.82 9.09 5.45 3.64 5.45 6.36 7.27 8.18 5.45 10.91 9.09

13 1.80 0.90 0.90 0.90 0.00 0.90 9.01 0.00 3.60 7.21 14.41 8.11 7.21 6.31 7.21 4.50 1.80 7.21 11.71 4.50

14 2.94 0.00 0.00 5.88 0.00 6.86 1.96 0.00 3.92 6.86 3.92 9.80 13.73 0.98 5.88 2.94 10.78 0.98 1 0.78 9.80

15 2.91 1.94 2.91 1.94 0.00 5.83 1.94 0.00 1.94 9.71 5.83 8.74 10.68 1.94 3.88 3.88 8.74 2.91 11.65 10.68

16 2.86 0.95 0.00 11.43 1.90 1.90 2.86 0.00 4.76 3.81 5.71 8.57 8.57 6.67 9.52 4.76 5.71 2.86 7.62 7.62

17 1.92 0.96 1.92 4.81 1.92 3.85 1.92 0.96 0.96 6.73 4.81 8.65 10.58 2.88 6.73 2.88 9.62 6.73 8.65 7.69

18 1.71 0.85 1.71 0.85 0.85 2.56 16.24 0.85 1.71 0.85 16.24 5.13 6.84 5.98 3.42 11.11 1.71 5.13 11.11 3.42

19 0.94 0.94 1.89 0.94 0.94 0.94 1.89 0.94 10.38 7.55 5.66 9.43 8.49 8.49 7.55 5.66 6.60 11.32 6.60 0.94

20 0.86 0.86 0.00 1.72 0.86 0.86 17.24 0.86 2.59 1.72 15.52 7.76 5.17 3.45 4.31 9.48 5.17 5.17 9.48 5.17

其中b1 =aaa+ata b2=aca+aga b3=cac+ctc b4=ccc+cgc

b5 =gag+gtg b6=gcg+ggg b7=tat+ttt b8=tct+tgt b9 =aac+caa+atc+cta b10=aag+gaa+atg+gta

b11=aat+taa+att+tta b12=acc+cca+agc+cga

b13=acg+gac+ctg+gtc b14=act+tca+agt+tga

b15=cag+gac+ctt+ttc b16=cat+tac+ctt+ttc

b17=ccg+gcc+cgg+ggc b18=cct+tcc+cgt+tgc

b19=gat+tag+gtt+ttg b20=gct+tcg+ggt+tgg

综合起来,形成了有41个变量的基本特征集。

(二)特征的提取

上述基本特征集中有41个变量,即样本处于一个高维空间中。特征的提取就是通

过变换的方法用低维空间来表示样本,使得X 的大部分特性能由Y 来表达,即将p 维随机向量X 变换成q 维随机向量 Y (q

1. 求X 的均方差矩阵V 的特征根,记为:

λ1≥λ2≥……≥λk >0 λk+1=……=λP =0

2. 求λ1,λ2……λK 对应的标准正交的特征向量r 1,r 2……r K

得到第i 个主成分为y i =r i X, i=1,2……K

3. 求第i 个主成分的贡献率u i =λi /

∑=k i 1λj , i=1,2……K 及前m 个主成分的累计贡

献率v m =∑=m i 1u i .

4. 求得q ,使得V q ≥V 0(V 0一般在0.85到1之间),则取

W=(r 1,r 2,……,r q )

Y=XW

第3步所求的贡献率,代表主成分表达X 的能力,贡献率越大,对应的主成分表达X 的能力越强。只要前q 个主成分的累计贡献率超过给定的百分比V 。就可以用低维特征Y=(y 1,y 2, ……y q )来反映高维特征(x 1,x 2……x p )的变化特性。

现将反映20个已知类别样本的41个特征的随机向量X 进行特征提取。

计算得前4个主成分的累计贡献率为96%,故提取特征为4个变量,取

W=(r 1,r 2,r 3,r 4),则Y=XW ,Y 的4个分量就是从基本特征集提取所得的特征参数向量。(程序及结果见附录二)

二. 分类决策的制定

前面已选取了特征参数,把特征参数张成的多维空间称为特征空间。分类决策就是在特征空间中用统计的方法把被识别对象归为某一类别。基本作法是在学习样本集的基础上确定某个判决规则,使按这种判决规则对被甄别对象进行分类所造成的错误识别率最小或引起的损失最少。

这里,我们的分类决策选取Fisher 线性判别法。即选取线性判别函数U(x),使得:

U(x)={E1[U(x)]-E2[U(x)]}2/{D1 [U(x)]+D2[U(x)]}=max (1)

其中Ei与Di分别表示母体i的期望和方差运算,i=1,2。

(1)式的含义是:构造一个线性判别函数U(x)对样本进行分类,使得平均出错概率最小。即应在不同母体下,使U(x)的取值尽量分开。具体地说,要使母体间的差异(E1(U(x))-E2(U(x)))2相对于母体内的差异D1[U(x)]+D2[U(x)] 为最大。取

U(x)=(X1-X2)'(∑1+∑2)-1X

就可满足(1)。其中X i为第i类母体的均值矩阵的估计,∑i为第i类母体的方差矩阵的估计。取分类门槛值为:

U0=U(α*X1+(1-α)*X2)

其中0<α<1,本问题中两类样本的个数相等,可取α=1/2。若U(X1)>U0,U(X2)

当U(X)>U0.,就认为X取自母体1;当U(X)

用上面得出的4个主成分构成的特征组和此分类决策,对20个学习样本进行分类,能得出正确的结果。但是,若取W=(r1,r2,r3),求Y=XW,以Y的3个分量作为特征参数向量,再用Fisher线性判别法对20个学习样本进行分类,则第四个样本不能正确分类。

因此,得出分类的数学模型为:

(1)特征选取:取W=(r1,r2,r3,r4),求Y=XW,得出特征参数向量就是Y的4个列向量。其中X是反映20个学习样本的41个特征的随机向量。

(2)分类决策:Fisher线性判别法。

三. 分类模型的有效性考查

前面建立的分类数学模型对20个学习样本进行了正确分类。为了进一步考查分类模型的有效性和可靠性,我们采用的方法是:预先留一部分学习样本不参加训练,然后用分类决策模型对其作预报,将预报成功率作为预报能力的指标。

每次取出一个学习样本,以其余学习样本作训练集,用分类决策模型对取出的一个样本作预报,同时对给出的后20种样本作预报。结果见表4。

表 4

从表4可以看出:

1、每次取出一个学习样本,以其余学习样本作训练集,用分类模型对该学习样本的预

报的成功率是100%。

2、每次取出一个学习样本,以其余学习样本作训练集,用分类模型对未知类别的第

21~40个样本进行预报,其结果有以下特点:

(1)除分别取出4、15、17,20的预报结果不同外,分别取出其余16中一个,预报结果均为:22,23,25,27,29,34,35,36,37,占80%。

(2)分别取出4、15、20的预报结果,与(1)的结果相比,只有一个样本的差异,占15%。

(3)取出17的预报结果,与(1)的结果相比,有两个样本的差异,占5%。

第一种结果和第二种结果非常接近,合计占总数的95%。只有第三组的这一个结果有较大差异,占总数的5%。

由以上检验得出结论:所建立的分类数学模型分类效果很好。

四.未知样本的预报

现在用前面建立的数学模型对题目所给的未知类型的20个人工序列和182个自然序列进行预报。(程序见附录三)

结果为:

1)20个人工序列的类别

A类:22,23,25,27,29,34,35,36,37

B类:21、24、26、28、30、31、32、33、38、39、40

2)182个自然序列的类别

A类:(共142个)2,3,5,6,7,9,11,12,13,14,15,16,17,18,19,

20,21,22,23,24,25,26,28,30,31,33,34,35,36,37,38,39,40,

42,44,45,46,47,49,50,51,52,53,55,56,57,58,59,60,61,62,

64,65,66,67,68,69,71,73,74,77,78,79,80,82,83,84,85,87,

88,89,91,93,94,95,96,97,98,99,100,101,103,104,105,106,107,108,109,111,112,113,114,115,117,118,120,121,122,123,124,125,127,128,129,130,132,133,134,135,136,137,138,139,140,141,142,143,145,146,147,148,149,151,152,153,154,155,156,158,167,168,171,172,173,174,175,176,177,178,179,180,181

B类:(共40个)1,4,8,10,27,29,32,41,43,48,54,63,70,72,75,

76,81,86,90,92,102,110,116,119,126,131,144,150,157,159,160,161,162,163,164,165,166,169,170,182

四.模型的优缺点分析

优点:

1.针对`“有人管理分类”问题,成功地建立解决这类难题的数学模型,并可立即运用到实践中去。

2.仅用4个特征参数即圆满解决了较为复杂的分类问题。而且模型假设条件少,因而能准确地反映实际情况,可靠性高。

3.采用模块化分析,逐渐深入,提高了准确性。

4.突出特征,假设合理,避免了在一些细节问题上的纠缠。

缺点:

由于只考虑了DNA样本序列中1字符串、2字符串、3字符串出现的频率作为特征,DNA序列的分类不一定与实际情况完全相符。(可以由科学家用物理的或化学的方法测定,作为补充)。

五.模型的改进方向及推广

模型的改进:因为模型没考虑DNA序列的实际特性,当序列变得很多很长很复杂时,分类的准确性会降低而不可用,因此应增加对DNA序列的生物特性的考虑。

模型的推广:该模型对一般的“有人管理分类”问题的求解有重要意义。对研究DNA 序列的规律性和结构提供了一种有效的分类模型。对人类基因组的研究有现实意义,有利于加快科研步伐。

六.参考文献

[1]The Invention of the Genetic Code,Brain Hayes(美),American Scientist—Computing Science,Jan.-Feb., 1998

[2]《MATLAB入门》后勤工程学院1997

[3]《数学实验》萧树铁主编高等教育出版社1999

[4]《概率论第二册——数理统计》复旦大学高等教育出版社1985

[5]《生命科学模型》William F. Lucas 主编国防科技大学出版社1996

[6]《运筹学基础手册》徐光煇主编科学出版社1999

[7]《数学模型》姜启源主编高等数学出版社1993

七.附录

附录一1个字符出现频率的计算程序]

CHARACTER*121 LINE(40)

integer a,c,t,g,at

READ*,LINE

DO 20 II=1,40

iii=ii+20

A=0

C=0

T=0

G=0

DO 10 I=1,121

IF(LINE(ii)(I:I).EQ.’a’)THEN

A=A+1

else if(line(ii)(I:I).eq.’c’)then

c=c+1

else if(line(ii)(I:I).eq.’t’)then

t=t+1

else if(line(ii)(I:I).eq.’g’)then

g=g+1

END IF

10continue

at=a+t

actg=a+c+t+g

aa=a/actg*100.

cc=c/actg*100.

tt=t/actg*100.

gg=g/actg*100.

aatt=at/actg*100.

open(5,file='t1.dat',status='old')

write(5,1)aa,cc,tt,gg

1 format(1x,4f7.2)

20 CONTINUE

END

附录二基本特征量的提取程序及结果

d=[ 27.43 19.47 36.28 16.81 63.72;

28.85 24.04 22.12 25.00 50.96;

17.65 25.49 18.63 38.24 36.27;

20.87 19.13 40.87 19.13 61.74;

24.76 22.86 21.90 30.48 46.67;

21.93 21.05 38.60 18.42 60.53;

23.08 20.19 23.08 33.65 46.15;

25.64 14.53 44.44 15.38 70.09;

14.85 21.78 18.81 44.55 33.66;

28.97 24.30 25.23 21.50 54.21;

24.11 17.86 35.71 22.32 59.82;

17.43 22.94 33.03 26.61 50.46;

27.03 18.92 33.33 20.72 60.36;

23.53 23.53 16.67 36.27 40.20;

24.27 21.36 20.39 33.98 44.66;

22.86 30.48 20.95 25.71 43.81;

21.36 25.24 20.39 33.01 41.75;

22.22 17.09 43.59 17.09 65.81;

27.36 28.30 23.58 20.75 50.94;

19.83 19.83 43.10 17.24 62.93];

dd=[ 5.31 4.42 7.96 8.85 9.73 6.19 1.77 18.58 6.19 4.42 4.42 4.42 6.19 4.42 4.42 1.77;

7.69 9.62 3.85 7.69 9.62 3.85 .96 6.73 2.88 1.92

7.69 11.54 7.69 8.65 2.88 4.81;

2.94

3.92 5.88

4.90 3.92 2.94 1.96 9.80 .00 1.96

12.75 9.80 10.78 .98 4.90 21.57;

1.74 4.35 3.48 11.30 13.04 1.74

2.61 22.61 2.61 9.57 4.35 2.61

3.48

4.35 8.70 2.61;

6.67 3.81 3.81 9.52 5.71 1.90 4.76 9.52

7.62 4.76

7.62 2.86 4.76 3.81 9.52 12.38;

3.51 3.51 5.26 9.65 7.89

4.39 1.75 24.56 7.89 6.14

1.75 4.39

2.63 2.63 11.40 1.75;

5.77 4.81 4.81 7.69

6.73 2.88 2.88 10.58 2.88 2.88

7.69 6.73 7.69 4.81 4.81 15.38;

3.42 5.13 9.40 6.84 11.97 5.13 3.42 23.93 2.56 6.84 2.56 2.56 7.69 3.42 1.71 2.56;

1.98 1.98 3.96 6.93 3.96

2.97 2.97 8.91 1.98 .99

8.91 8.91 6.93 4.95 7.92 24.75;

9.35 5.61 2.80 10.28 7.48 5.61 5.61 6.54 8.41 7.48

2.80 5.61

3.74 8.41 9.35 .00;

2.68 5.36 4.46 11.61 15.18 1.79 .89 16.96

3.57 6.25

3.57

4.46 2.68 7.14 7.14

5.36;

5.50 2.75 2.75

6.42 6.42

7.34 4.59 13.76 4.59 5.50

6.42 6.42 .92 10.09 6.42 8.26;

5.41 7.21 7.21 7.21 10.81 1.80 5.41 15.32 3.60 4.50

2.70 7.21 7.21 6.31 6.31 .90;

7.84 4.90 .98 8.82 4.90 .98 2.94 7.84 2.94 3.92

9.80 6.86 7.84 3.92 6.86 17.65;

5.83 4.85 3.88 9.71 7.77 3.88 1.94

6.80 3.88 2.91

3.88 9.71 6.80 6.80 8.74 11.65;

4.76 3.81 1.90 12.38 8.57

5.71 .00

6.67 5.71 3.81

10.48 10.48 3.81 8.57 9.52 2.86;

3.88 2.91 2.91 10.68 5.83 .97 6.80 5.83 5.83 5.83

9.71 3.88 4.85 5.83 11.65 10.68;

3.42 9.40 5.98 3.42 10.26 1.71

4.27 27.35

5.13 3.42

4.27 3.42 2.56 6.84 1.71

5.98;

8.49 5.66 4.72 8.49 4.72 8.49 2.83 6.60 11.32 1.89

9.43 5.66 2.83 9.43 4.72 3.77;

3.45 7.76

4.31 4.31 10.34 .86 3.45 27.59 1.72 6.03

8.62 3.45 4.31 5.17 1.72 6.03];

ddd=[ 1.77 3.54 2.65 .88 .00 .00 7.96 .88 4.42 2.65

17.70 10.62 3.54 4.42 4.42 7.08 1.77 3.54 13.27 7.08;

1.92 1.92 .96 .96 .00 .96 1.92 .96 4.81 1

2.50 7.69 11.54 8.65

3.85 3.85 6.73 9.62 6.73 7.69 2.88;

.98 .00 .00 5.88 .98 8.82 2.94 .00 .00 2.94 10.78 5.88 13.73 .00 4.90 3.92 19.61 1.96 8.82 5.88;

.00 .00 .00 .87 .00 .87 13.04 1.74 6.09 2.61 11.30 13.04 3.48 5.22 3.48 8.70 3.48 1.74 14.78 7.83;

2.86 .00 .00

3.81 .95 3.81 3.81 .00 3.81 3.81 9.52 9.52 12.38 2.86 9.52 3.81 7.62 2.86 7.62 9.52;

.00 .00 .88 2.63 .00 1.75 13.16 .88 4.39 1.75 14.04 9.65 7.02 5.26 4.39 11.40 2.63 1.75 10.53 6.14;

1.92 .00 .00

2.88 .96 4.81 2.88 .00 1.92 4.81 12.50 6.73 1

3.46 1.92 6.73

4.81 10.58 3.85 9.62 7.69;

2.56

3.42 .00 .85 .85 .85 12.82 .85 1.71 .85 20.51 2.56 3.42 9.40 5.98 11.11 .85

4.27 11.97 3.42;

.00 .00 .00 2.97 2.97 9.90 2.97 .00 .99 3.96 6.93 1.98 13.86 1.98 2.97 3.96 23.76 2.97 8.91 6.93;

1.87 .93 3.74

2.80 .00 .00 2.80 .00 7.48 8.41 9.35 7.48

3.74 1

4.95 12.15 .00 2.80 4.67 7.48 7.48;

.00 .89 .00 .00 .00 1.79 8.04 .00 5.36 4.46 15.18 8.04 8.93 4.46 3.57 8.04 4.46 6.25 13.39 5.36;

2.75 .00 .92 2.75 .92

3.67

4.59 3.67 3.67 1.83 9.17

5.50 3.67 5.50

6.42

7.34

8.26 5.50 11.01

9.17;

1.80 .90 .90 .90 .00 .90 9.01 .00 3.60 7.21 14.41 8.11 7.21 6.31 7.21 4.50 1.80 7.21 11.71 4.50;

2.94 .00 .00 5.88 .00 6.86 1.96 .00

3.92 6.86 3.92 9.80 13.73 .98 5.88 2.94 10.78 .98 10.78 9.80;

2.91 1.94 2.91 1.94 .00 5.83 1.94 .00 1.94 9.71

5.83 8.74 10.68 1.94 3.88 3.88 8.74 2.91 11.65 10.68;

2.86 .95 .00 11.43 1.90 1.90 2.86 .00 4.76

3.81

5.71 8.57 8.57

6.67 9.52 4.76 5.71 2.86

7.62 7.62;

1.94 .97 1.94 4.85 1.94 3.88 1.94 .97 .97 6.80 4.85 8.74 10.68

2.91 6.80 2.91 9.71 6.80 8.74 7.77;

1.71 .85 1.71 .85 .85

2.56 16.24 .85 1.71 .85 16.24 5.13 6.84 5.98

3.42 11.11 1.71 5.13 11.11 3.42;

.94 .94 1.89 .94 .94 .94 1.89 .94 10.38 7.55 5.66 9.43 8.49 8.49 7.55 5.66 6.60 11.32 6.60 .94;

.86 .86 .00 1.72 .86 .86 17.24 .86 2.59 1.72 15.52 7.76 5.17 3.45 4.31 9.48 5.17 5.17 9.48 5.17];

x=[ 29.73 17.12 13.51 39.64 43.24;

27.03 16.22 15.32 41.44 42.34;

27.03 21.62 6.31 45.05 33.33;

42.34 10.81 28.83 18.02 71.17;

23.42 23.42 10.81 42.34 34.23;

35.14 12.61 12.61 39.64 47.75;

35.14 9.91 18.92 36.04 54.05;

27.93 16.22 18.92 36.94 46.85;

20.72 20.72 15.32 43.24 36.04;

18.18 27.27 13.64 40.91 31.82;;

35.45 4.55 50.00 10.00 85.45;

32.73 2.73 50.00 14.55 82.73;

25.45 10.00 51.82 12.73 77.27;

30.00 8.18 50.00 11.82 80.00;

29.09 .00 64.55 6.36 93.64;

36.36 8.18 46.36 9.09 82.73;

35.45 24.55 26.36 13.64 61.82;

29.09 11.82 50.00 9.09 79.09;

21.82 14.55 56.36 7.27 78.18;

20.00 17.27 56.36 6.36 76.36];

xx=[ 9.01 9.01 3.60 8.11 4.50 .90 4.50 3.60 3.60 3.60

1.80 8.11 11.71

2.70 5.41 18.92;

9.91 7.21 3.60 5.41 2.70 1.80 5.41 5.41 4.50

1.80 .90 9.01 9.91 4.50 5.41 21.62;

5.41 11.71 3.60 5.41 2.70 1.80 .90 .90 5.41 .90 .90 14.41 13.51 .90 7.21 23.42;

18.92 5.41 11.71 5.41 10.81 1.80 5.41 10.81 5.41

1.80 .90

2.70 6.31 4.50 2.70 4.50;

6.31 8.11 1.80

7.21 1.80 2.70 2.70 3.60 5.41 4.50

2.70 10.81 9.91 .90 9.01 21.62;

15.32 2.70 6.31 9.91 3.60 1.80 1.80 5.41

4.50 .00 .00 8.11 10.81 .90 8.11 19.82;

15.32 1.80 10.81 7.21 4.50 2.70 6.31 5.41 .90

1.80 .90 6.31 13.51 .90 4.50 16.22;

8.11 3.60 6.31 9.91 5.41 3.60 2.70 7.21 2.70 3.60

1.80 8.11 10.81 1.80 7.21 16.22;

9.01 .90 4.50 6.31 .00 3.60 7.21 4.50 3.60 2.70

2.70 11.71 7.21

3.60 13.51 18.02;

6.36 3.64 1.82 6.36 1.82 5.45 2.73 3.64 5.45 3.64

4.55 13.64 4.55 3.64 13.64 18.18;

15.45 2.73 14.55 2.73 16.36 .91 1.82

30.00 .91 .91 .91 1.82 2.73 4.55 .00 2.73;

13.64 .91 10.91 6.36 15.45 1.82 1.82

30.91 .91 .91 .00 .91 2.73 7.27 .00 4.55;

6.36 4.55 10.00 4.55 12.73 1.82 2.73 34.55 2.73 2.73

1.82 1.82 3.64 4.55 1.82

2.73;

8.18 .91 12.73 7.27 13.64 6.36 1.82 28.18 2.73

4.55 .00 .91

5.45 4.55 .91 .91;

13.64 .00 12.73 1.82 13.64 .00 2.73

48.18 .00 .00 .00 .00 1.82 3.64 .00 .91;

16.36 3.64 15.45 .91 13.64 4.55 4.55 22.73 1.82

5.45 .00 .91 4.55 2.73 .00 1.82;

17.27 5.45 10.91 1.82 10.00 6.36 4.55 5.45 4.55 7.27

9.09 2.73 3.64 2.73 3.64 3.64;

8.18 7.27 11.82 1.82 15.45 1.82 .91 30.91 3.64 3.64

1.82

2.73 1.82

3.64 .91 2.73;

2.73 2.73 1

3.64 1.82 1

4.55 9.09 .91 31.82 1.82 8.18

1.82

2.73 2.73 2.73 .91 .91;

6.36 6.36 6.36 .91 9.09 10.00 3.64 32.73 2.73

13.64 .91 .00 1.82 3.64 .00 .91];

xxx=[ 5.41 .90 2.70 .90 5.41 3.60 .90 1.80 2.70 8.11

4.50 1.80 2

5.23 3.60 3.60 5.41 13.51 .00 3.60 4.50;

2.70 2.70 .00 .00

3.60 6.31 2.70 .90 7.21 7.21 6.31

1.80 18.92 .90 6.31 1.80 14.41 .00 3.60 10.81;

2.70 2.70 2.70 .00

3.60 6.31 .00 .90

4.50

5.41

1.80 .90 29.73 .00 5.41 4.50 2

2.52 .00 1.80 2.70;

15.32 6.31 .00 .00 .00 .90 9.01 1.80 6.31 10.81

12.61 3.60 4.50 1.80 2.70 5.41 1.80 1.80 7.21 6.31;

3.60 1.80 2.70 .00 5.41 7.21 .90 .00

4.50 1.80 2.70 3.60 20.72 1.80 6.31 4.50 19.82 1.80 1.80 7.21;

9.01 .90 .90 .00 2.70 5.41 4.50 .00 2.70 13.51

6.31 .00 25.23 .90 1.80 1.80 16.22 .00 2.70 3.60;

9.01 1.80 .00 .00 1.80 4.50 4.50 .90 3.60 16.22

8.11 .00 17.12 2.70 1.80 1.80 10.81 .90 6.31 6.31;

2.70 1.80 .90 .90 2.70

3.60 2.70 .90

4.50 9.91 8.11

3.60 18.92 .90 2.70

4.50 12.61 .90 7.21 8.11;

5.41 .00 .90 1.80 5.41 9.01 1.80 .90 3.60

6.31 1.80

3.60 11.71 2.70 2.70 2.70 20.72 1.80

4.50 10.81;

3.64 .91 2.73 6.36 3.64 10.91 .91 1.82 3.64 2.73

2.73 .91 17.27 .00 4.55 4.55 17.27 4.55 1.82 7.27;

9.09 .91 .00 .00 .00 .00 24.55 .00 3.64 6.36

33.64 .91 4.55 1.82 .00 1.82 .00 2.73 5.45 2.73;

2.73 .91 .00 .00 .00 .00 19.09 .00 1.82 8.18

37.27 .00 4.55 4.55 .00 2.73 .00 .91 10.00 5.45;

.91 2.73 .00 .00 .00 .00 27.27 1.82 1.82 5.45 26.36 2.73 4.55 2.73 4.55 5.45 1.82 2.73 5.45 1.82;

6.36 5.45 .00 .00 1.82 .00 20.00 5.45 2.73 2.73

24.55 .00 1.82 3.64 3.64 8.18 .91 .91 9.09 .91;

11.82 .91 .00 .00 1.82 .00 47.27 1.82 .00 3.64

25.45 .00 .91 .91 .00 .00 .00 .00 2.73 .91;

10.00 2.73 .91 .00 .00 .00 14.55 4.55 5.45 3.64

31.82 .91 .91 3.64 1.82 6.36 .00 .00 7.27 3.64;

10.91 .91 3.64 3.64 .00 .91 8.18 2.73 12.73 9.09

11.82 3.64 3.64 6.36 1.82 1.82 6.36 6.36 1.82 1.82;

4.55 4.55 .00 .00 .91 .91 21.82 .91 4.55 .91

29.09 .00 3.64 1.82 .91 10.91 2.73 4.55 4.55 .91;

3.64 .91 1.82 .91 .91 .00 25.45 5.45 3.64 .00 21.82

1.82 1.82 3.64 .91 13.64 .91

2.73 5.45 2.73;

2.73 .91 5.45 .00 .00 .00 2

3.64 10.00 6.36 1.82

13.64 .00 1.82 8.18 1.82 13.64 .00 1.82 6.36 .00];

ffx=[x xx xxx];

ffd=[d dd ddd];

cx=cov(ffx);

[vx,ex]=eig(cx);

ex1=eig(cx);

e1=mean(ex1)*41;

ex2=ex1(38:41,:);

e2=mean(ex2)*7;

e2/e1

vx1=[vx(:,38:41)];

s=ffx*vx1;ss=ffd*vx1;

x=s(1:10,:);

y=s(11:20,:);

u1=mean(x);u2=mean(y);

u1-u2;

z=8/9*(cov(x)+cov(y));

ux=0.5*(u1-u2)*inv(z);

u12=0.5*u1+0.5*u2;

u0=ux*u12.';

la=0;

for i=1:10

p(i)=ux*ss(i,:).';

tx(i)=ux*x(i,:).';

fy(i)=ux*y(i,:).';

if p(i)>u0

pbd(i)=1;

la=la+1;

else

pbd(i)=2 ;

end

if tx(i)>u0

lbx(i)=1 ;

else

lbx(i)=2;

end

if fy(i)>u0

lby(i)=1 ;

else

lby(i)=2 ;

end

for n=11:20

p(n)=ux*ss(n,:)';

if p(n)>u0

pbd(n)=1 ;

la=la+1;

else

pbd(n)=2;

end

tx ,fy ,p

pbd,lbx,lby

ans =0.9847

u0 =-2.4812

tx= Columns 1 through 7

8.2471 9.7074 10.8780 3.8672 9.3837 9.7612 9.2014 Columns 8 through 10

6.2700 11.6489 5.4181

fy =Columns 1 through 7

-15.2467 -15.2121 -14.2828 -8.0112 -13.4839 -11.1970 -11.2608 Columns 8 through 10

-15.0827 -14.9635 -15.2662

p =Columns 1 through 7

-6.5147 -3.6869 0.7514 -6.0838 0.3758 -6.7805 0.1074 Columns 8 through 14

-8.1194 5.0825 -6.1039 -7.0908 -2.7297 -6.0715 4.1447

Columns 15 through 20

4.5919 -4.2199 0.9096 -9.2269 -8.1303 -10.7112

pbd =Columns 1 through 12

2 2 1 2 1 2 1 2 1 2 2 2

Columns 13 through 20

2 1 1 2 1 2 2 2

lbx =1 1 1 1 1 1 1 1 1 1

lby = 2 2 2 2 2 2 2 2 2 2

附录三对未知序列进行分类的运算程序

d=[ 27.43 19.47 36.28 16.81 63.72;

28.85 24.04 22.12 25.00 50.96;

17.65 25.49 18.63 38.24 36.27;

20.87 19.13 40.87 19.13 61.74;

24.76 22.86 21.90 30.48 46.67;

21.93 21.05 38.60 18.42 60.53;

23.08 20.19 23.08 33.65 46.15;

25.64 14.53 44.44 15.38 70.09;

14.85 21.78 18.81 44.55 33.66;

28.97 24.30 25.23 21.50 54.21;

24.11 17.86 35.71 22.32 59.82;

17.43 22.94 33.03 26.61 50.46;

27.03 18.92 33.33 20.72 60.36;

23.53 23.53 16.67 36.27 40.20;

24.27 21.36 20.39 33.98 44.66;

22.86 30.48 20.95 25.71 43.81;

21.36 25.24 20.39 33.01 41.75;

22.22 17.09 43.59 17.09 65.81;

27.36 28.30 23.58 20.75 50.94;

19.83 19.83 43.10 17.24 62.93];

dd=[ 5.31 4.42 7.96 8.85 9.73 6.19 1.77 18.58 6.19 4.42 4.42 4.42 6.19 4.42 4.42 1.77;

7.69 9.62 3.85 7.69 9.62 3.85 .96 6.73 2.88 1.92

7.69 11.54 7.69 8.65 2.88 4.81;

2.94

3.92 5.88

4.90 3.92 2.94 1.96 9.80 .00 1.96

12.75 9.80 10.78 .98 4.90 21.57;

1.74 4.35 3.48 11.30 13.04 1.74

2.61 22.61 2.61 9.57 4.35 2.61

3.48

4.35 8.70 2.61;

6.67 3.81 3.81 9.52 5.71 1.90 4.76 9.52

7.62 4.76

7.62 2.86 4.76 3.81 9.52 12.38;

3.51 3.51 5.26 9.65 7.89

4.39 1.75 24.56 7.89 6.14

1.75 4.39

2.63 2.63 11.40 1.75;

5.77 4.81 4.81 7.69

6.73 2.88 2.88 10.58 2.88 2.88

7.69 6.73 7.69 4.81 4.81 15.38;

3.42 5.13 9.40 6.84 11.97 5.13 3.42 23.93 2.56 6.84 2.56 2.56 7.69 3.42 1.71 2.56;

1.98 1.98 3.96 6.93 3.96

2.97 2.97 8.91 1.98 .99

8.91 8.91 6.93 4.95 7.92 24.75;

9.35 5.61 2.80 10.28 7.48 5.61 5.61 6.54 8.41 7.48

2.80 5.61

3.74 8.41 9.35 .00;

2.68 5.36 4.46 11.61 15.18 1.79 .89 16.96

3.57 6.25

3.57

4.46 2.68 7.14 7.14

5.36;

5.50 2.75 2.75

6.42 6.42

7.34 4.59 13.76 4.59 5.50

6.42 6.42 .92 10.09 6.42 8.26;

5.41 7.21 7.21 7.21 10.81 1.80 5.41 15.32 3.60 4.50

2.70 7.21 7.21 6.31 6.31 .90;

7.84 4.90 .98 8.82 4.90 .98 2.94 7.84 2.94 3.92

9.80 6.86 7.84 3.92 6.86 17.65;

5.83 4.85 3.88 9.71 7.77 3.88 1.94

6.80 3.88 2.91

3.88 9.71 6.80 6.80 8.74 11.65;

4.76 3.81 1.90 12.38 8.57

5.71 .00

6.67 5.71 3.81

10.48 10.48 3.81 8.57 9.52 2.86;

3.88 2.91 2.91 10.68 5.83 .97 6.80 5.83 5.83 5.83

9.71 3.88 4.85 5.83 11.65 10.68;

3.42 9.40 5.98 3.42 10.26 1.71

4.27 27.35

5.13 3.42

4.27 3.42 2.56 6.84 1.71

5.98;

8.49 5.66 4.72 8.49 4.72 8.49 2.83 6.60 11.32 1.89

9.43 5.66 2.83 9.43 4.72 3.77;

3.45 7.76

4.31 4.31 10.34 .86 3.45 27.59 1.72 6.03

8.62 3.45 4.31 5.17 1.72 6.03];

ddd=[ 1.77 3.54 2.65 .88 .00 .00 7.96 .88 4.42 2.65

17.70 10.62 3.54 4.42 4.42 7.08 1.77 3.54 13.27 7.08;

1.92 1.92 .96 .96 .00 .96 1.92 .96 4.81 1

2.50 7.69 11.54 8.65

3.85 3.85 6.73 9.62 6.73 7.69 2.88;

.98 .00 .00 5.88 .98 8.82 2.94 .00 .00 2.94 10.78 5.88 13.73 .00 4.90 3.92 19.61 1.96 8.82 5.88;

.00 .00 .00 .87 .00 .87 13.04 1.74 6.09 2.61 11.30 13.04 3.48 5.22 3.48 8.70 3.48 1.74 14.78 7.83;

2.86 .00 .00

3.81 .95 3.81 3.81 .00 3.81 3.81 9.52 9.52 12.38 2.86 9.52 3.81 7.62 2.86 7.62 9.52;

.00 .00 .88 2.63 .00 1.75 13.16 .88 4.39 1.75 14.04 9.65 7.02 5.26 4.39 11.40 2.63 1.75 10.53 6.14;

1.92 .00 .00

2.88 .96 4.81 2.88 .00 1.92 4.81 12.50 6.73 1

3.46 1.92 6.73

4.81 10.58 3.85 9.62 7.69;

2.56

3.42 .00 .85 .85 .85 12.82 .85 1.71 .85 20.51 2.56 3.42 9.40 5.98 11.11 .85

4.27 11.97 3.42;

.00 .00 .00 2.97 2.97 9.90 2.97 .00 .99 3.96 6.93 1.98 13.86 1.98 2.97 3.96 23.76 2.97 8.91 6.93;

1.87 .93 3.74

2.80 .00 .00 2.80 .00 7.48 8.41 9.35 7.48

3.74 1

4.95 12.15 .00 2.80 4.67 7.48 7.48;

.00 .89 .00 .00 .00 1.79 8.04 .00 5.36 4.46 15.18 8.04 8.93 4.46 3.57 8.04 4.46 6.25 13.39 5.36;

2.75 .00 .92 2.75 .92

3.67

4.59 3.67 3.67 1.83 9.17

5.50 3.67 5.50

6.42

7.34

8.26 5.50 11.01

9.17;

1.80 .90 .90 .90 .00 .90 9.01 .00 3.60 7.21 14.41 8.11 7.21 6.31 7.21 4.50 1.80 7.21 11.71 4.50;

2.94 .00 .00 5.88 .00 6.86 1.96 .00

3.92 6.86 3.92 9.80 13.73 .98 5.88 2.94 10.78 .98 10.78 9.80;

2.91 1.94 2.91 1.94 .00 5.83 1.94 .00 1.94 9.71

5.83 8.74 10.68 1.94 3.88 3.88 8.74 2.91 11.65 10.68;

2.86 .95 .00 11.43 1.90 1.90 2.86 .00 4.76

3.81

5.71 8.57 8.57

6.67 9.52 4.76 5.71 2.86

7.62 7.62;

1.94 .97 1.94 4.85 1.94 3.88 1.94 .97 .97 6.80 4.85 8.74 10.68

2.91 6.80 2.91 9.71 6.80 8.74 7.77;

1.71 .85 1.71 .85 .85

2.56 16.24 .85 1.71 .85 16.24 5.13 6.84 5.98

3.42 11.11 1.71 5.13 11.11 3.42;

.94 .94 1.89 .94 .94 .94 1.89 .94 10.38 7.55 5.66 9.43 8.49 8.49 7.55 5.66 6.60 11.32 6.60 .94;

.86 .86 .00 1.72 .86 .86 17.24 .86 2.59 1.72 15.52 7.76 5.17 3.45 4.31 9.48 5.17 5.17 9.48 5.17];

x=[ 29.73 17.12 13.51 39.64 43.24;

27.03 16.22 15.32 41.44 42.34;

27.03 21.62 6.31 45.05 33.33;

42.34 10.81 28.83 18.02 71.17;

23.42 23.42 10.81 42.34 34.23;

35.14 12.61 12.61 39.64 47.75;

35.14 9.91 18.92 36.04 54.05;

27.93 16.22 18.92 36.94 46.85;

20.72 20.72 15.32 43.24 36.04;

18.18 27.27 13.64 40.91 31.82;;

35.45 4.55 50.00 10.00 85.45;

32.73 2.73 50.00 14.55 82.73;

25.45 10.00 51.82 12.73 77.27;

30.00 8.18 50.00 11.82 80.00;

29.09 .00 64.55 6.36 93.64;

36.36 8.18 46.36 9.09 82.73;

35.45 24.55 26.36 13.64 61.82;

29.09 11.82 50.00 9.09 79.09;

21.82 14.55 56.36 7.27 78.18;

20.00 17.27 56.36 6.36 76.36];

xx=[ 9.01 9.01 3.60 8.11 4.50 .90 4.50 3.60 3.60 3.60

1.80 8.11 11.71

2.70 5.41 18.92;

9.91 7.21 3.60 5.41 2.70 1.80 5.41 5.41 4.50

1.80 .90 9.01 9.91 4.50 5.41 21.62;

历届全国大学生数学建模题目

全国大学生数学建模竞赛题目1992-2009年 (黑体的为典型的微分方程模型) CUMCM从1992年到2009年的18年中共出了53个题目 1992年(A)施肥效果分析问题(北京理工大学:叶其孝) (B)实验数据分解问题(复旦大学:谭永基) 1993年(A)非线性交调的频率设计问题(北京大学:谢衷洁) (B)足球排名次问题(清华大学:蔡大用) 1994年(A)逢山开路问题(西安电子科技大学:何大可) (B)锁具装箱问题(复旦大学:谭永基,华东理工大学:俞文此) 1995年(A)飞行管理问题(复旦大学:谭永基,华东理工大学:俞文此) (B)天车与冶炼炉的作业调度问题(浙江大学:刘祥官,李吉鸾) 1996年(A)最优捕鱼策略问题(北京师范大学:刘来福) (B)节水洗衣机问题(重庆大学:付鹂) 1997年(A)零件参数设计问题(清华大学:姜启源) (B)截断切割问题(复旦大学:谭永基,华东理工大学:俞文此) 1998年(A)投资的收益和风险问题(浙江大学:陈淑平) (B)灾情巡视路线问题(上海海运学院:丁颂康) 1999年(A)自动化车床管理问题(北京大学:孙山泽) (B)钻井布局问题(郑州大学:林诒勋) (C)煤矸石堆积问题(太原理工大学:贾晓峰) (D)钻井布局问题(郑州大学:林诒勋) 2000年(A)DNA序列分类问题(北京工业大学:孟大志) (B)钢管订购和运输问题(武汉大学:费甫生) (C)飞越北极问题(复旦大学:谭永基) (D)空洞探测问题(东北电力学院:关信) 2001年(A)血管的三维重建问题(浙江大学:汪国昭) (B)公交车调度问题(清华大学:谭泽光) (C)基金使用计划问题(东南大学:陈恩水) (D)公交车调度问题(清华大学:谭泽光) 2002年(A)车灯线光源的优化设计问题(复旦大学:谭永基,华东理工大学:俞文此) (B)彩票中的数学问题(解放军信息工程大学:韩中庚) (C)车灯线光源的优化设计问题(复旦大学:谭永基,华东理工大学:俞文此)) (D)赛程安排问题(清华大学:姜启源) 2003年(A)SARS的传播问题(组委会) (B)露天矿生产的车辆安排问题(吉林大学:方沛辰) (C)SARS的传播问题(组委会) (D)抢渡长江问题(华中农业大学:殷建肃)

2000年全国大学生数学建模竞赛A题 DNA序列分类

2000年全国大学生数学建模竞赛A题DNA序列分类 2000年6月,人类基因组计划中DNA全序列草图完成,预计2001年可以完成精确的全序列图,此后人类将拥有一本记录着自身生老病死及遗传进化的全部信息的“天书”。这本大自然写成的“天书”是由4个字符A,T,C,G按一定顺序排成的长约30亿的序列,其中没有“断句”也没有标点符号,除了这4个字符表示4种碱基以外,人们对它包含的“内容”知之甚少,难以读懂。破译这部世界上最巨量信息的“天书”是二十一世纪最重要的任务之一。在这个目标中,研究DNA全序列具有什么结构,由这4个字符排成的看似随机的序列中隐藏着什么规律,又是解读这部天书的基础,是生物信息学(Bioinformatics)最重要的课题之一。 虽然人类对这部“天书”知之甚少,但也发现了DNA序列中的一些规律性和结构。例如,在全序列中有一些是用于编码蛋白质的序列片段,即由这4个字符组成的64种不同的3 字符串,其中大多数用于编码构成蛋白质的20种氨基酸。又例如,在不用于编码蛋白质的序列片段中,A和T的含量特别多些,于是以某些碱基特别丰富作为特征去研究DNA序列的结构也取得了一些结果。此外,利用统计的方法还发现序列的某些片段之间具有相关性,等等。这些发现让人们相信,DNA序列中存在着局部的和全局性的结构,充分发掘序列的结构对理解DNA全序列是十分有意义的。目前在这项研究中最普通的思想是省略序列的某些细节,突出特征,然后将其表示成适当的数学对象。这种被称为粗粒化和模型化的方法往往有助于研究规律性和结构。 作为研究DNA序列的结构的尝试,提出以下对序列集合进行分类的问题: 1)下面有20个已知类别的人工制造的序列(见下页),其中序列标号1—10 为A类,1 1-20为B类。请从中提取特征,构造分类方法,并用这些已知类别的序列,衡量你的方法是否足够好。然后用你认为满意的方法,对另外20个未标明类别的人工序列(标号21—4 0)进行分类,把结果用序号(按从小到大的顺序)标明它们的类别(无法分类的不写入): A类__________ ;B类_______________ 。 请详细描述你的方法,给出计算程序。如果你部分地使用了现成的分类方法,也要将方法名称准确注明。 这40个序列也放在如下地址的网页上,用数据文件Art-model-data 标识,供下载: 网易网址:https://www.360docs.net/doc/5117319671.html, 教育频道在线试题; 教育网: https://www.360docs.net/doc/5117319671.html, New mcm2000 教育网: https://www.360docs.net/doc/5117319671.html,/mcm 2)在同样网址的数据文件Nat-model-data 中给出了182个自然DNA序列,它们都较长。用你的分类方法对它们进行分类,像1)一样地给出分类结果。 提示:衡量分类方法优劣的标准是分类的正确率,构造分类方法有许多途径,例如提取序列

电子科技大学校内数学建模竞赛题目

2007 年电子科技大学校内数学建模竞赛题目 地铁杂散电流的分布 地铁以它的承载量大、快速、准时、占地少等特点被大家所青睐。但地铁也会带来安全、环境等问题。在环境方面的影响主要有共振和迷流等。 机车的驱动都是以电力为动力,电气机车接触网(第三轨)供电线路回路的结构如图1和图2所示。供电为1500V的直流电,通过地铁隧道顶的导电轨,机车顶上的电刷,给机车供电,通过隧道底部的钢轨实现回流。电流有可能泄漏到地下,形成地铁杂散电流(也称迷流)。 图 1 :地铁地下结构示意图(纵截面) 图 2 :地铁地下结构示意图(横截面) 某地的在建地铁工程设计希望解决以下两个问题: 1 .如图1所示,假设只有一根钢轨做回流线,钢轨是直的,不考虑弯曲的情况。轨上有2000安培的稳恒电流流过。请你建立一个模型,来描述地下(请考虑地下物质的电导特性)迷流的分布情况。

2 .地铁杂散电流一旦大量泄露出来,可能构成安全隐患。假设在距地铁的直线距离为150米的地方有一处摩天大楼,请你分析迷流对该建筑物的影响。 2006 年电子科技大学校内数学建模竞赛题目 想要有个家!!! 假设你是今年毕业的大学生,已签了一家月收入 2500 元的成都公司,公司不能为你提供住房。父母为你提供了一笔资金,可以作为一个小户型的 5 万首付款。你面临一个抉择:是先租房住还是先按揭买房? ( 1 )请分析并预测不同地段的房屋租金、房价走势。 ( 2 )结合当前银行贷款利率做出一个你认为比较好的决策。 ( 3 )从长远的观点来看,为保证你的生活质量,应该怎样规划你的购房计划。 2005 年电子科技大学校内数学建模竞赛题目 圆明园:该怎样保护你 已经进行了两年的圆明园公园铺设防渗膜工程最近引起了社会各界的极大关注。一方认为,防渗处理隔断了水的自然循环,破坏圆明园的整体生态系统和园林风格;另一方认为这样做是为了更好地保护圆明园的生态环境。 请你在了解双方观点依据的基础上,提出你自己的见解,建立数学模型支持你的观点。 注意:所用资料一定写明出处。 背景资料(仅供参考): 1. 圆明园历史从1709年开始营建,至1809年基本建成,历时一个世纪。此后的嘉庆、道光、咸丰三代屡有修缮扩建,历时150多年。圆明园总面积近352万平方米,水面面积约123万平方米。 2. 圆明园湖底防渗漏问题可以确定清河在圆明园的分布范围,在地下10.3米深度范围内,渗漏系数较大,渗水性较强。圆明园极为缺水,2000多亩的水面,每年枯水期约有七八个月,由于降水量少,很多植被旱死。经初步测算,如果圆明园要想保持水深是0.8米,总需水量合计为98.4万立方米;若常年保持1.5米深的水面,每年蓄水量为900万方。现在水务局能提供的水量是150万立方米。 3. 水费问题2004年8月1日前,北京市公园湖泊生态环境用水的收费标准是每立方米0.3元,现在环境用水涨到了每立方米1.3元。生态环境用水在城市用水

数学建模知识竞赛题库

数学建模知识竞赛题库 1.请问计算机中的二进制源于我国古代的哪部经典? D A.《墨经》 B.《诗经》 C.《周书》 D.《周易》 2.世界上面积最大的高原是?D A.青藏高原 B.帕米尔高原 C.黄土高原 D.巴西高原 3.我国海洋国土面积约有多少万平方公里? B A.200 B.300 C.280 D.340 4.世界上面值最高的邮票是匈牙利五百亿彭哥,它的图案是B A.猫 B.飞鸽 C.海鸥 D.鹰 5. 龙虾是我们的一种美食、你知道它体内的血是什么颜色的吗?B A.红色 B.蓝色 C.灰色 D.绿色 6.MATLAB使用三维向量[R G B]来表示一种颜色,则黑色为(D ) A. [1 0 1] B. [1 1 1] C. [0 0 1] D. [0 0 0] 7.秦始皇之后,有几个朝代对长城进行了修葺? A A.7个 B.8个 C.9个 D.10个 8.中国历史上历时最长的朝代是?A A.周朝 B.汉朝 C.唐朝 D.宋朝 9我国第一个获得世界冠军的是谁?C A 吴传玉 B 郑凤荣 C 荣国团 D 陈镜开 10.我国最早在奥运会上获得金牌的是哪位运动员?B A.李宁 B.许海峰 C.高凤莲 D.吴佳怩

11.围棋共有多少个棋子?B A.360 B.361 C.362 D.365 12下列属于物理模型的是:A A水箱中的舰艇 B分子结构图 C火箭模型 D电路图 13名言:生命在于运动是谁说的?C A.车尔尼夫斯基 B.普希金 C.伏尔泰 D.契诃夫 14.饱食后不宜剧烈运动是因为B A.会得阑尾炎 B.有障消化 C.导致神经衰弱 D.呕吐 15、MATLAB软件中,把二维矩阵按一维方式寻址时的寻址访问是按(B)优先的。 A.行 B.列 C.对角线 D.左上角16红军长征中,哪次战役最突出反应毛泽东的军事思想和指挥才?A A.四渡赤水B.抢渡大渡河C.飞夺泸定桥D.直罗镇战役 17色盲患者最普遍的不易分辨的颜色是什么?A A.红绿 B.蓝绿 C.红蓝 D.绿蓝 18下列哪种症状是没有理由遗传的? A.精神分裂症 B.近视 C.糖尿病 D.口吃 19下面哪个变量是正无穷大变量?(A )

数学建模dna序列分类模型终稿

DNA序列分类模型DNA序列分类模型

毕业设计(论文)原创性声明和使用授权说明 原创性声明 本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。 作者签名:日期: 指导教师签名:日期: 使用授权说明 本人完全了解大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。 作者签名:日期:

学位论文原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人承担。 作者签名:日期:年月日 学位论文版权使用授权书 本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。 涉密论文按学校规定处理。 作者签名:日期:年月日 导师签名:日期:年月日

2015年美国数学建模竞赛第二次模拟赛题

Problem A Warmer Days or Sour Grapes ? The high quality of wines(葡萄酒)produced in the Finger Lakes Region(五指湖区)of upstate (北部)New York is widely known. Proximity(接近)to lakes tempers the climate and makes it more suitable for growing several varieties of premium(独特)grapes: R iesling(雷司令), G ewürztraminer(琼瑶浆), C hardonnay(霞多丽), M erlot(梅洛), P inot Noir(黑比诺), and Cabernet F ranc(品丽珠). (There are many more, but we will restrict(限制)the discussion to these six to simplify(简化)the modeling.) Each variety has its own preferred “average temperature” range but is also different in its susceptibility(感受性)to diseases and ability to withstand(抵抗)short periods of unusually cold temperature. As our local climate changes, the relative suitability of these varieties will be changing as well. A forward-looking winery(酒厂)has hired your team to help with the long-term planning. You will need to recommend a) the proportion(比例)of the total vineyard(葡萄园)to be used for growing each of the above six varieties; b) and when should these changes be implemented (实施)(based on observed temperatures and/or current market prices for each type of wine). Naturally, the winery is interested in maximizing its annual profit. But since the latter (后者)is weather-dependent, it might vary a lot year-to-year. You are also asked to evaluate the trade-offs (权衡)between optimizing the expected/average case versus the worst(-realistic-)scenario(情景). Things to keep in mind: Climate modeling is complicated(复杂)and predicting the rate of “global warming” is a hotly debated area. For the purposes of this problem, assume that the annual average temperature in Ithaca(伊萨卡), NY will increase by no more than 4°C by the end of this century. It is not all about the average temperature – a short snap(临时)of sub- zero(零度)temperature in late Ferburay or early March (after the vines already started getting used to warmer weather) is far more damaging than the same low temperature would be in the middle of the winter. It takes at least 3 years for a newly planted vine to start producing grapes suitable for winemaking. Problem B Outlook of Car-to-Car Tech SAN FRANCISCO -- After more than a decade of research into car-to-car communications, U.S. auto safety regulators took a step forward today by unveiling their plan for requiring cars to have wireless gear that will enable them to warn drivers of danger.

历年数学建模赛题题目

历年数学建模赛题题目 1992年 (A) 施肥效果分析问题(北京理工大学:叶其孝) (B) 实验数据分解问题(华东理工大学:俞文此; 复旦大学:谭永基)1993年 (A) 非线性交调的频率设计问题(北京大学:谢衷洁) (B) 足球排名次问题(清华大学:蔡大用) 1994年 (A) 逢山开路问题(西安电子科技大学:何大可) (B) 锁具装箱问题(复旦大学:谭永基,华东理工大学:俞文此)1995年 (A) 飞行管理问题(复旦大学:谭永基,华东理工大学:俞文此) (B) 天车与冶炼炉的作业调度问题(浙江大学:刘祥官,李吉鸾)1996年 (A) 最优捕鱼策略问题(北京师范大学:刘来福) (B) 节水洗衣机问题(重庆大学:付鹂) 1997年 (A) 零件参数设计问题(清华大学:姜启源) (B) 截断切割问题(复旦大学:谭永基,华东理工大学:俞文此)1998年 (A) 投资的收益和风险问题(浙江大学:陈淑平) (B) 灾情巡视路线问题(上海海运学院:丁颂康) 1999年 (A) 自动化车床管理问题(北京大学:孙山泽) (B) 钻井布局问题(郑州大学:林诒勋) (C) 煤矸石堆积问题(太原理工大学:贾晓峰) (D) 钻井布局问题(郑州大学:林诒勋) 2000年 (A) DNA序列分类问题(北京工业大学:孟大志) (B) 钢管订购和运输问题(武汉大学:费甫生) (C) 飞越北极问题(复旦大学:谭永基) (D) 空洞探测问题(东北电力学院:关信) 2001年 (A) 血管的三维重建问题(浙江大学:汪国昭) (B) 公交车调度问题(清华大学:谭泽光) (C) 基金使用计划问题(东南大学:陈恩水) (D) 公交车调度问题(清华大学:谭泽光) 2002年

云南财经大学2017年数学建模竞赛校内选拔赛题目.doc

外商独资XXXXXX有限公司 章程 第一章总则 第一条根据《中华人民共和国公司法》、《中华人民共和国外资企业法》及中国其他有关法律、法规,制定本章程。 第二条股东名称:XXXXX 英文名称:XXXX 公司编号:XXXX 在香港登记注册,法定地址:XXXXX 电话:XXXXX 传真:XXXX 现任董事:XXXX 职务:董事国籍:XXXX 第三条外商独资企业名称:XXXX(以下简称公司)。 公司法定地址:深圳市前海深港合作区前湾一路1号A栋201室(入驻深圳市前海商务秘书有限公司)。 第四条公司为有限责任公司,是XXXX投资经营的企业,并以其认缴的出资额承担企业责任。 第五条公司经审批机构批准成立,并在深圳市登记注册,为企业法人,应遵守中华人民共和国的法律、法规,并受中国法律的管辖和保护。 第二章宗旨和经营范围 第六条公司宗旨:本着加强经济合作和技术交流的愿望,促进中国国民经济的发展,并获取满意的回报。 第七条公司经营范围:XXXX。 第三章投资总额和注册资本 第八条公司的投资总额为:XXXX 公司注册资本(出资额)为:XXXX 公司注册资本的出资方式及期限,按《中华人民共和国公司法》及中国其他有关法律、法规的规定执行。其中: 现金:XXXX(以等值外币出资,按缴款当日中国人民银行公布的基准汇率折算); 股东出资的XXXX应于XXXX年XX月XX日之前实际缴付到位,现本股东承诺在约定的时间内按期缴付全部出资,逾期不到位的,自愿按法律承担相应责任。 第九条股东缴付出资后三十天内,应当委托中国注册会计师事务所验证,并出具验资报告,报审批机关和工商行政管理机关备案。

第十条公司在经营期内,不得减少注册资本。但是,因投资总额和经营规模等发生变化,确需减少的,须经审批机构批准。 第十一条公司变更经营范围、分立、合并、注册资本增加、转让或者其他重要事项的变更,须经公司股东决议通过后,报原审批机构批准,并在规定期限内向工商行政管理、税务、外汇、海关等有关部门办理相应的变更登记手续。 第四章股东职权 第十二条公司股东决定公司的重大事项,依照公司法和本章程规定,通过股东决定行使下列职权: (一)决定公司的经营方针和投资计划; (二)委派和更换非由职工代表担任的董事、监事,决定有关董事、监事的报酬事项; (三)审议批准董事会的报告; (四)审议批准监事的报告; (五)审议批准公司的年度财务预算方案、决算方案; (六)审议批准公司的利润分配方案和弥补亏损方案; (七)对公司增加、减少或者转让注册资本作出决议; (八)对发行公司债券作出决议; (九)对公司合并、分立、延期、解散、清算或者变更公司形式作出决议;(十)修改公司章程; (十一)其他应由股东决定的重大事宜。 第五章董事会 第十三条公司设立董事会。董事会负责执行公司的一切重大事项,并向股东负责。 第十四条董事会由3名成员组成,其中董事长1人。董事长及董事由股东委派及撤换。董事长和董事每届任期3年。经继续委派可以连任。董事人选的更换,应书面通知董事会,并向公司登记机关备案。 第十五条董事长是公司的法定代表人,是代表公司行使职权的签字人。董事长在董事会闭会期间,依照企业章程和董事会决议,处理公司的重大问题,负责检查、监督董事会决议的执行情况。董事长临时不能履行职责的,委托其他董事代为履行,但应有书面委托。法律、法规规定必须由董事长行使的职责,不得委托他人代行。 第十六条董事会对公司股东负责,行使下列职权: (一)执行股东决定; (二)决定公司的经营方针、发展规划和投资方案,审批经理或管理部门提出

2019数学建模国赛a题答案

中国大学生数学建模竞赛: 全国大学生数学建模竞赛创办于1992年,每年一届,已成为全国高校规模最大的基础性学科竞赛,也是世界上规模最大的数学建模竞赛。2018年,来自全国34个省/市/区(包括香港、澳门和台湾)及美国和新加坡的1449所院校/校区、42128个队(本科38573队、专科3555队)、超过12万名大学生报名参加本项竞赛。 赛事设置: 竞赛宗旨 创新意识团队精神重在参与公平竞争。 指导原则 指导原则:扩大受益面,保证公平性,推动教学改革,提高竞赛质量,扩大国际交流,促进科学研究。 规模与数据 全国大学生数学建模竞赛是全国高校规模最大的课外科技活动之一。该竞赛每年9月(一般在上旬某个周末的星期五至下周星期一共3天,72小时)举行,竞赛面向全国大专院校的学生,不分专业(但竞赛分本科、专科两组,本科组竞赛所有大学生均可参加,专科组竞赛只有专科生(包括高职、高专生)可以参加)。同学可以向该校教务部门咨询,如有必要也可直接与全国竞赛组委会或各省(市、自治区)赛区组委会联系。 全国大学生数学建模竞赛创办于1992年,每年一届,成为全国高校规模最大的基础性学科竞赛,也是世界上规模最大的数学建模竞

赛。2014年,来自全国33个省/市/自治区(包括香港和澳门特区)及新加坡、美国的1338所院校、25347个队(其中本科组22233队、专科组3114队)、7万多名大学生报名参加本项竞赛。 比赛时间 2017年比赛时间是9月14号20:00到9月17号24:00,总共76小时,采取通讯方式比赛,比赛地点在各个高校。比赛时间全国统一的,不可以与老师交流,可以在互联网查阅资料。 同学们在比赛期间应该注意安排时间,以免出现时间不够用的情况。 组委名单 注:第五届专家组任期两年(2010-2011)。2011年底任期届满后,组委会对专家组进行了调整,并决定此后不再对外公布专家组成员名单。 第五届组委会成员名单(2010-2013)及下属专家组成员名单 第四届组委会成员名单及下属专家组成员名单 第一、二、三届组委第一、二、三届组委会成员名单及下属专家组成员名单引各赛区组委会各赛区联系方式列表引 [注1] 各赛区联系人请注意:若本赛区联系e-mail地址发生变化,请通知全国组委会进行修改。 [注2] 全国已成立赛区的有28个省、市、自治区,国内尚未成立赛区的区域组成联合赛区,其他(境外参赛学生)组成国际赛区,共30个赛区。

数学建模及全国历年竞赛题目

数学建模及全国历年竞赛题目 (2010-09-28 21:58:01) 标签: 分类:专业教学 数学建模 应用数学模型 教育 一、数学建模的涵 (一)数学建模的概念 数学建模是一种数学的思考方法,是运用数学的语言和方法,通过抽象、简化建立能近似刻画并"解决"实际问题的一种强有力的数学手段。使用数学语言描述的事物就称为数学模型,这个建立数学模型的全过程就称为数学建模。(二)应用数学模型 应用数学去解决各类实际问题,把错综复杂的实际问题简化、抽象为合理的数学结构。通过调查、收集数据资料,观察和研究实际对象的固有特征和在规律,抓住问题的主要矛盾,建立起反映实际问题的数量关系,然后利用数学的理论和方法去分析和解决问题。需要诸如数理统计、最优化、图论、微分方程、计算方法、神经网络、层次分析法、模糊数学,数学软件包如 Mathematica,Matlab,Lingo,Spss,Mapple的使用,甚至排版软件等知识的基础。

(三)数学建模的特点 数学建模具有难度大、涉及面广、形式灵活,对教师和学生要求高等特点;数学建模的教学本身是一个不断探索、不断创新、不断完善和提高的过程。(四)数学建模的指导思想 数学建模的指导思想就是:以实验室为基础、以学生为中心、以问题为主线、以培养能力为目标来组织教学工作。 (五)数学建模的意义 数学建模是联系数学与实际问题的桥梁,是数学在各个领械广泛应用的媒介,是数学科学技术转化的主要途径。通过教学使学生了解利用数学理论和方法去分析和解决问题的全过程,提高他们分析问题和解决问题的能力;提高他们学习数学的兴趣和应用数学的意识与能力,使他们在以后的工作中能经常性地想到用数学去解决问题,提高他们尽量利用计算机软件及当代高新科技成果的意识,能将数学、计算机有机地结合起来去解决实际问题。 1.培养创新意识和创造能力; 2.训练快速获取信息和资料的能力; 3.锻炼快速了解和掌握新知识的技能; 4.培养团队合作意识和团队合作精神; 5.增强写作技能和排版技术;

中南大学校内数学建模竞赛题目

2007年中南大学数学建模竞赛题 A题西部地区农村建设规划问题 在我国西北部某些干旱地区,水资源量不足是发展农牧业生产的主要限制因素之一。紧密配合国家西部大开发和新农村建设的方针政策,合理利用水资源,加强农田水利工程建设,加速西部农牧业发展,这是当地政府的一个重要任务。在水利工程建设中,如何合理规划,发挥最大的水利经济效益,是值得研究的一个问题。现有问题如下: 问题1:某地区现有耕地可分为两种类型,第Ⅰ类耕地各种水利设施配套,土地平整,排灌便利;第Ⅱ类耕地则未具备以上条件。其中第Ⅰ类耕地有2.5万亩,第Ⅱ类耕地有8.2万亩,此外尚有宜垦荒地3.5万亩。该地区主要作物是小麦,完全靠地表水进行灌溉。由于地表水的供应量随季节波动,在小麦扬花需水时恰逢枯水季节,往往由于缺水使一部分麦田无法灌溉,影响产量。而且由于第Ⅱ类耕地条件差,土地不平整,所以灌溉定额高,浪费水量比较大,并且产量还不及第Ⅰ类耕地高。进一步合理利用水资源的措施有二:其一是进行农田建设,把一部分第Ⅱ类耕地改造成为第Ⅰ类耕地,以节约用水,提高单产;其二是修建一座水库,闲水期蓄水,到小麦扬花需水的枯水期放水,从而调节全年不用季节的水量。目前该地区在整个小麦生长期的地表水资源可利用量为96.5百万方,其中小麦扬花需水季节可供水量为7.5百万方。水库建成后在小麦扬花需水季节可多供水量为6.5百万方。修建水库需要投资5.5百万元,将第Ⅱ类耕地改造为第Ⅰ类耕地每亩需要投资20元,将荒地开垦为第Ⅱ类耕地每亩需要投资85元,将荒地直接开垦为第Ⅰ类耕地每亩需要投资100元。规划期内,计划总投资额为9百万元。该地区对小麦的需求量及国家征购指标共计2万吨,超额向国家交售商品粮每吨可加价100元。各种条件下水的灌溉额及净收益情况如下表1: 表1:规划年各种条件下的灌溉定额及净收益

2020全国大学生数学建模竞赛试题

A题炉温曲线 在集成电路板等电子产品生产中,需要将安装有各种电子元件的印刷电路板放置在回焊炉中,通过加热,将电子元件自动焊接到电路板上。在这个生产过程中,让回焊炉的各部分保持工艺要求的温度,对产品质量至关重要。目前,这方面的许多工作是通过实验测试来进行控制和调整的。本题旨在通过机理模型来进行分析研究。 回焊炉内部设置若干个小温区,它们从功能上可分成4个大温区:预热区、恒温区、回流区、冷却区(如图1所示)。电路板两侧搭在传送带上匀速进入炉内进行加热焊接。 图1 回焊炉截面示意图 某回焊炉内有11个小温区及炉前区域和炉后区域(如图1),每个小温区长度为30.5 cm,相邻小温区之间有5 cm的间隙,炉前区域和炉后区域长度均为25 cm。 回焊炉启动后,炉内空气温度会在短时间内达到稳定,此后,回焊炉方可进行焊接工作。炉前区域、炉后区域以及小温区之间的间隙不做特殊的温度控制,其温度与相邻温区的温度有关,各温区边界附近的温度也可能受到相邻温区温度的影响。另外,生产车间的温度保持在25oC。 在设定各温区的温度和传送带的过炉速度后,可以通过温度传感器测试某些位置上焊接区域中心的温度,称之为炉温曲线(即焊接区域中心温度曲线)。附件是某次实验中炉温曲线的数据,各温区设定的温度分别为175oC(小温区1~5)、195oC(小温区6)、235oC(小温区7)、255oC(小温区8~9)及25oC(小温区10~11);传送带的过炉速度为70 cm/min;焊接区域的厚度为0.15 mm。温度传感器在焊接区域中心的温度达到30oC时开始工作,电路板进入回焊炉开始计时。 实际生产时可以通过调节各温区的设定温度和传送带的过炉速度来控制产品质量。在上述实验设定温度的基础上,各小温区设定温度可以进行oC范围内的调整。调整时要求小温区1~5中的温度保持一致,小温区8~9中的温度保持一致,小温区10~11中的温度保持25oC。传送带的过炉速度调节范围为65~100 cm/min。 在回焊炉电路板焊接生产中,炉温曲线应满足一定的要求,称为制程界限(见表1)。 表1 制程界限 界限名称 最低值 最高值

国赛历届数学建模赛题题目与解题方法

历届数学建模题目浏览:1992--2009 1992年 (A) 施肥效果分析问题(北京理工大学:叶其孝) (B) 实验数据分解问题(华东理工大学:俞文此; 复旦大学:谭永基) 1993年 (A) 非线性交调的频率设计问题(北京大学:谢衷洁) (B) 足球排名次问题(清华大学:蔡大用) 1994年 (A) 逢山开路问题(西安电子科技大学:何大可) (B) 锁具装箱问题(复旦大学:谭永基,华东理工大学:俞文此) 1995年 (A) 飞行管理问题(复旦大学:谭永基,华东理工大学:俞文此) (B) 天车与冶炼炉的作业调度问题(浙江大学:刘祥官, 李吉鸾) 1996年 (A) 最优捕鱼策略问题(北京师范大学:刘来福) (B) 节水洗衣机问题(重庆大学:付鹂) 1997年 (A) 零件参数设计问题(清华大学:姜启源) (B) 截断切割问题(复旦大学:谭永基,华东理工大学:俞文此) 1998年 (A) 投资的收益和风险问题(浙江大学:陈淑平) (B) 灾情巡视路线问题(上海海运学院:丁颂康) 1999年 (A) 自动化车床管理问题(北京大学:孙山泽) (B) 钻井布局问题(郑州大学:林诒勋) 1999年(C) 煤矸石堆积问题(太原理工大学:贾晓峰)

(D) 钻井布局问题(郑州大学:林诒勋) 2000年 (A) DNA序列分类问题(北京工业大学:孟大志) (B) 钢管订购和运输问题(武汉大学:费甫生) (C) 飞越北极问题(复旦大学:谭永基) (D) 空洞探测问题(东北电力学院:关信) 2001年 (A) 血管的三维重建问题(浙江大学:汪国昭) (B) 公交车调度问题(清华大学:谭泽光) (C) 基金使用计划问题(东南大学:陈恩水) (D) 公交车调度问题(清华大学:谭泽光) 2002年 (A) 车灯线光源的优化设计问题(复旦大学:谭永基,华东理工大学:俞文此) (B) 彩票中的数学问题(解放军信息工程大学:韩中庚) (C) 车灯线光源的优化设计问题(复旦大学:谭永基,华东理工大学:俞文此) (D) 赛程安排问题(清华大学:姜启源) 2003年 (A) SARS的传播问题(组委会) (B) 露天矿生产的车辆安排问题(吉林大学:方沛辰) (C) SARS的传播问题(组委会) (D) 抢渡长江问题(华中农业大学:殷建肃) 2004年 (A) 奥运会临时超市网点设计问题(北京工业大学:孟大志) (B) 电力市场的输电阻塞管理问题(浙江大学:刘康生) (C) 酒后开车问题(清华大学:姜启源)

数学建模竞赛试题--基因识别问题及其算法实现

基因识别问题及其算法实现 一、背景介绍 DNA 是生物遗传信息的载体,其化学名称为脱氧核糖核酸(Deoxyribonucleic acid ,缩写为DNA )。DNA 分子是一种长链聚合物,DNA 序列由腺嘌呤(Adenine, A ),鸟嘌呤(Guanine, G ),胞嘧啶(Cytosine, C ),胸腺嘧啶(Thymine, T )这四种核苷酸(nucleotide )符号按一定的顺序连接而成。其中带有遗传讯息的DNA 片段称为基因(Gene )(见图1第一行)。其他的DNA 序列片段,有些直接以自身构造发挥作用,有些则参与调控遗传讯息的表现。 在真核生物的DNA 序列中,基因通常被划分为许多间隔的片段(见图1第二行),其中编码蛋白质的部分,即编码序列(Coding Sequence )片段,称为外显子(Exon ),不编码的部分称为内含子(Intron )。外显子在DNA 序列剪接(Splicing )后仍然会被保存下来,并可在 图1真核生物DNA 序列(基因序列)结构示意图 蛋白质合成过程中被转录(transcription )、复制(replication )而合成为蛋白质(见图2)。DNA 序列通过遗传编码来储存信息,指导蛋白质的合成,把遗传信息准确无误地传递到蛋白质(protein )上去并实现各种生命功能。 DNA 序列 外显子(Exon ) 内含子(Intron)

DNA序列 剪接、转录、复制 蛋白质序列 图2蛋白质结构示意图 对大量、复杂的基因序列的分析,传统生物学解决问题的方式是基于分子实验的方法,其代价高昂。诺贝尔奖获得者W.吉尔伯特(Walter Gilbert,1932—;【美】,第一个制备出混合脱氧核糖核酸的科学家)1991年曾经指出:“现在,基于全部基因序列都将知晓,并以电子可操作的方式驻留在数据库中,新的生物学研究模式的出发点应是理论的。一个科学家将从理论推测出发,然后再回到实验中去,追踪或验证这些理论假设。” 随着世界人类基因组工程计划的顺利完成,通过物理或数学的方法从大量的DNA序列中获取丰富的生物信息,对生物学、医学、药学等诸多方面都具有重要的理论意义和实际价值,也是目前生物信息学领域的一个研究热点。 二、数字序列映射与频谱3-周期性: 对给定的DNA序列,怎么去识别出其中的编码序列(即外显子),也称为基因预测,是一个尚未完全解决的问题,也是当前生物信息学的一个最基础、最首要的问题。 基因预测问题的一类方法是基于统计学的[1]。很多国际生物数据网站上也有“基因识别”的算法。比如知名的数据网站https://www.360docs.net/doc/5117319671.html,/GENSCAN.html提供的基因识别软件GENSCAN(由斯坦福大学研究人员研发的、可免费使用的基因预测软件),主要就是基于隐马尔科夫链(HMM)方法。但是,它预测人的基因组中有45000个基因,相当于现在普遍认可数目的两倍。另外,统计预测方法通常需要将编码序列信息已知的DNA序列作为训练数据

数学建模校内赛

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C中选择一项填写): C 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名):数模组 日期: 2012 年 8 月 20 日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号

游船业务优化设计模型 摘要 旅游业是一种集多种产业和功能于一体的综合产业,乘游船旅游作为旅游业务中的朝阳产业,它与经济的发展有着密切的联系。合理地选择游船规模与制定订票策略成为提高游船效益的关键,本文根据收益最大化原则,利用数值积分模型,用matlab 软件编程对游船最大规模问题进行了求解。 在求解问题一中三种游船业务的最佳规模时,本文首先采用MATLAB软件编程画出三种游船乘坐人数的正态分布图,观察其分布特点,从而确定出有效的求解方法;其次设出游船最佳业务规模M,建立数值积分模型表示出了每个区段游船的购票人数,根据题意确定成本,利用最大收益原则,进而确定收益的数值积分模型,利用matlab软件编程分别求出了三种游船的最佳业务规模,用matlab工具箱绘制出游船收益图。 在求解问题二中A→C游船业务的最佳规模时,根据问题一中的方法分别建立出短途旅程A→B、B→C的收益的数值积分模型,对两者进行求和,利用matlab软件编程求出A→B、B→C段相等的游船最大业务规模,再与问题一中求出的A→C的最大规模求和,从而求解出 A→C游船业务的最佳规模为826。 在制定问题三中的订票策略时,为减小空座率,我们首先设定A→B、B→C的限售票额为都为m,则A→C 的限售票额为826-m,进而根据问题一中的求解方法确定游船A→C的总体最大收益的数值积分模型,利用matlab软件编程解出A→B、B→C的限售票额m均为267,A→C的限售票额为559,即为游船制定的订票策略。 关键词:收益最大化数值积分 MATLAB软件正态分布概率密度函数

美国大学生数学建模竞赛赛题翻译

2015年美国大学生数学建模竞赛赛题翻译 2015年美国大学生数学竞赛正在进行,比赛时间为北京时间:2015年2月6日(星期五)上午9点—2月10日上午9点.竞赛以三人(本科生)为一组,在四天时间内,就指定的问题,完成该实际问题的数学建模的全过程,并就问题的重述、简化和假设及其合理性的论述、数学模型的建立和求解(及软件)、检验和改进、模型的优缺点及其可能的应用范围的自我评述等内容写出论文。 2015 MCM/ICM Problems 总计4题,参赛者可从MCM Problem A, MCM Problem B,ICM Problem C orICM Problem D等四道赛题中自由选择。 2015Contest Problems MCM PROBLEMS PROBLEM A: Eradicating Ebola The worldmedical association has announced that theirnewmedicationcould stop Ebola andcurepatients whose disease is not advanced. Build a realistic, sensible, andusefulmodel thatconsiders not onlythespread of the disease,thequantity of themedicine needed,possible feasible delivery systems(sending the medicine to where itis needed), (geographical)locations of delivery,speed of manufacturing of the va ccine ordrug, but also any othercritical factors your team considers necessaryas partof themodel to optimize theeradicationofEbola,orat least its current strain. Inadd ition to your modeling approach for thecontest, prepare a1—2 page non-technical letter for the world medicalassociation touse intheir announcement. 中文翻译: 问题一:根除埃博拉病毒 世界医学协会已经宣布他们的新药物能阻止埃博拉病毒并且可以治愈一些处于非晚期疾病患者。建立一个现实的,合理的并且有用的模型,该模型不仅考虑了疾病的蔓延,需要药物的量,可能可行的输送系统,输送的位置,疫苗或药物的生产速度,而且也要考虑其他重要的因素,诸如你的团队认为有必要作为模型的一部分来进行优化而使埃博拉病毒根除的一些因素,或者至少考虑当前的状态。除了你的用于比赛的建模方法外,为世界医学协会准备一份1-2页的非技术性的信,方便其在公告中使用。 PROBLEMB: Searchingforalost plane Recall the lostMalaysian flight MH370.Build agenericmathematicalmodel that could assist "searchers" in planninga useful search for a lost planefeared to have crashed in open water suchas the Atlantic, Pacific,Indian, Southern,or Arctic Ocean whil eflyingfrom PointA to Point B. Assume that there are no signals fromthe downed plane。Your model should recognize thattherearemany different types of planes forw

相关文档
最新文档