基于多特征提取的识别算法--历年数学建模优秀论文大全

基于多特征提取的识别算法--历年数学建模优秀论文大全
基于多特征提取的识别算法--历年数学建模优秀论文大全

重庆大学本科学生毕业设计(论文)基于多特征提取的中文识别算法

学生:刘平净

学号:20031711

指导教师:何光辉

专业:信息与计算科学

重庆大学数理学院学院

二OO七年六月

Graduation Design(Thesis) of Chongqing University

A Chinese Character Recognition Algorithm

Based on Multi- characteristics

Undergraduate: Liu Pingjing

Supervisor: He Guanghui

Major:Information and Computing Science

College of Mathematical&Physical Science

Chongqing University

June 2007

摘要

该文提出了一种基于多特征提取的手写汉字识别算法及其实现。该算法同时运用了基于统计特征和基于结构特征的汉字识别算法并对它们做了相应改进。

算法在匹配判别阶段采用了分类判别思想,在汉字图像输入的同时,记录汉字图像的输入结构特点,在此基础上得到输入的未知汉字的笔划特征,由笔划特征即可对未知汉字做粗分类,这样可以缩小判别时的汉字范围。经过汉字粗分类后,提取整个汉字图像的统计特征,该步骤采用了网格划分方法,即先对图像做划分,再计算每一网格内文字相素与整个图像中文字相素的比值,通过这些特征对文字图像做细分类即可得到识别结果.

基于多特征提取的识别算法对汉字的识别十分有效,能使识别率达到90%以上,该文同时也给出了对书写不规范的字的解决方案。

关键词:文字识别,特征提取,模式匹配,模式识别

ABSTRACT

The article proposes an algorithm for hand-written Chinese character recognition and its realization . The algorithm is based on the multi-characteristics, it unifies and improves the algorithm based on the statistic characteristic and the algorithm based on the structure characteristics.

The algorithm adopts the classified distinction through the match distinction stage. It takes down the character image’s input unique feature when the image input. With the input unique feature, it can obtains the pen delimits characteristics of the unknown character image. The first classification can be managed based on these steps, thus the range of the second classification will smaller. After the first classification, it must withdraws the statistic characteristics of the image. The algorithm adopts the grid division method in this step. It makes a division to the image and then compute the element ratio of every areas. As a result, the character image can be recognized by the steps above.

The recognition algorithm based on multi-characteristics is extremely effective to the Chinese character recognition.The recognition rate can achieves above 90% .This article also provide methods for the characters written standardless.

Key words:Writing recognition, Characteristic withdraws, Pattern matching, Pattern recognition

目录

中文摘要 (Ⅰ)

ABSTRACT (Ⅱ)

目录........................................................................................................... III 图片索引目录. (Ⅳ)

绪论 (1)

1 汉字识别原理及常用算法 (4)

1.1 汉字识别的原理 (4)

1.2 基于统计决策方法的汉字识别 (5)

1.3基于结构特征方法的汉字识别 (6)

2 基于多特征提取的识别算法 (9)

2.1手写汉字识别的现行算法分析 (9)

2.1.1以笔划序列为特征的识别算法 (9)

2.1.2基于统计特征的汉字识别算法 (11)

2.2现行算法的结合和改进 (12)

3 识别算法对应的VC代码 (14)

3.1输入预处理 (15)

3.2识别算法 (18)

4 算法实现结果和分析 (20)

4.1 模拟结果介绍 (20)

4.2 结果分析 (21)

5 总结与展望 (24)

5.1 论文总结 (24)

5.2 算法的前景展望 (24)

参考文献 (25)

附:图片索引目录

图1.1 汉字识别原理框图 (4)

图 1.2 汉字图像的粗外围图 (5)

图 2.1 二维平面的划分图 (9)

图 2.4 汉字图像的统计特征图 (11)

图 2.6 汉字识别算法流程图 (13)

图 4.1 程序运行界面 (20)

图 4.2 汉字的写入 (20)

图 4.3 系统识别写入的汉字图像 (21)

图 4.4 通过“学习”过程向字库中添加汉字特征 (21)

图 4.5 能够识别的汉字图像示例 (22)

图 4.6 不能识别的汉字图像示例 (22)

绪论

世界上的文字有两大类,一种是拼音类文字(如英文),另一种是象形类或图形类文字(如汉字)。在人机交互中,拼音文字显示出了极大的优越性,利用键盘可以把一个个字母很自然很方便的输入计算机,而对与图形类文字,一直没有适当的输入设备。从80年代开始,微机大量地进入我国,许多用于中文信息处理,但输入设备仍然只是键盘,为了将汉字输入计算机,涌现出了各种各样的汉字编码方案,所谓编码方案就是通过人为的规则,把汉字转换成字符或数字以方便利用键盘输入。利用编码方案进行汉字输入需要记忆,这给计算机在生活领域的普及带来了很大的不便,利用西文键盘输入汉字的限制成了计算机普及应用的瓶颈和桎酷。随着科学技术的发展,人们意识到要用图形输入设备输入汉字,输入后由计算机自动识别并转化成内码,至于计算机怎样把输入的汉字图像识别出来,就是汉字识别技术。

从学科上来说,汉字识别属于模式识别与图像处理的范畴,还涉及到人工智能、形式语言与自动机、统计决策理论、模糊数学、信息论、语言文字学、计算机科学等学科,是一门综合性技术科学。由于汉字数量多,结构复杂,相似字很多,所以汉字识别是难度较大的文字识别。近年来,随着模式识别技术及计算机科学技术的发展,汉字识别也取的了极大的进展。汉字识别的基本过程包括汉字输入、预处理、特征提取、分类识别、识别后处理五个大步骤。

根据识别对象的不同,汉字识别分为手写体汉字识别和印刷体汉字识别两种,前者因为各人的书写习惯不同和手写汉字变化太大而显的比较困难,后者要相对容易一些。

在手写汉字识别这个范畴中,根据汉字输入方式不同又可以分为联机手写汉字识别和脱机手写汉字识别。通俗地讲,联机手写就是在书写的同时,根据笔划顺序等特征对汉字进行识别,该技术较多地应用在汉字输入设备如手机的手写板中。与联机手写汉字识别不同,脱机手写汉字识别主要是多一副汉字图像进行分类识别,多用于签名识别,笔迹鉴别等领域。

汉字识别应用在以下几个方面:

(1)使汉字高速自动地输入计算机,以彻底解决汉字信息处理系统中手动输入效率底这个关键

(2)办公自动化和下一代印刷技术的文字信息自动输入。

(3)做为新一代计算机智能接口的重要组成部分

(4)汉字文本高倍压缩存储和传输。

下面讲述汉字识别的研究现状和发展前景。汉字识别研究始于20世纪60年代,当时大多数文字识别研究者都集中在英文印刷体文本识别,美国科学家Casey 和Nagy率先进行印刷体汉字识别的研究工作,并于1966年发表了第一篇有关汉字识别的论文,随后在这个领域有了大量的研究,这些严重主要是在亚洲进行的,如日本、中国大陆、台湾等地。

我国在70年代末开始了汉字识别的研究工作,到现在关于这方面的研究非常活跃,有些产品已经进入市场。眼下印刷体汉字识别系统对实际文本的识别率一般达94%~98%,识别速度为5~10字每秒;联机手写汉字识别系统的识别率最高可大95%;脱机非特定手写汉字识别率最高达85%,速度为1字每秒;脱机特定手写汉字的识别率85%~93%,速度3~5字每秒;其中前两个已经达到实用化要求,台湾的研究水平与大陆相当,日本的研究水平比大陆稍高。

从总体来说,汉字识别技术的广泛应用将产生一个新的产业,而这个产业将覆盖社会生活的各个方面,从笔式电脑到办公自动化设备,从邮政信函的自动分拣到各种表格的自动录入,从证件识别到证券识别,从自动阅读机到智能视觉系统。而与汉字识别密切相关的笔迹鉴别设备将会广泛应用于银行、保安等部门。

汉字识别最直接的用途是汉字输入。针对我国汉字录入的现状,汉字识别技术能很好地满足不同层次的单位、个人需要。对有大量汉字录入任务的单位如报社、出版社、印刷厂等,一方面可以大幅度提高汉字输入的效率,建设汉字输入时间,另一方面还能缩小庞大的录入员队伍及相应的设备。

汉字识别的另一大用途是在笔式电脑中。笔式电脑没有键盘,用笔进行输入和操作。该设备的一个技术关键是联机手写字符识别技术。笔式电脑是计算机发展的一个重要趋势。目前已经有多中英文笔式电脑产品。笔式电脑的市场前景很大,据IDG预测,到1966年,英文笔式电脑的全球销售量将达到500万台。中文笔式电脑的市场前景同样也是十分巨大的,所以汉字识别技术的研究十分重要。

邮政信函的分拣也是汉字识别技术应用前景看好的领域,目前我国使用的邮政信函分拣机是依据邮政编码的,也就是手写数字识别。但是单纯基于邮政编码识别的正确分拣率只能达到30%左右,所以手写汉字识别技术将使邮政信函的分拣更加完善。

表格信息自动录入也是汉字识别技术大有可为的方向。表格信息的自动录入需要印刷体汉字识别技术、脱机手写汉字识别技术及手写数字识别技术。同样地汉字识别技术还将应用于证件识别和证券识别、智能计算机的智能接口和视觉系统、笔迹鉴别等,由于篇幅有限,不在细述。

在本文的第一部分我们将介绍汉字识别的一般算法和原理,以便对汉字识别

实现算法形成初步认识;第二部分主要讲述现在用的比较多的两个算法以及将它们改进结合形成的新的方法,第三和第四部分将对算法模拟工具(vc)和主要程序代码做必要讲解,第五部分为对结果的分析。

1 汉字识别的原理及常用算法

1.1 汉字识别的原理

和其他模式识别一样,汉字识别的基本思想也是匹配判别。抽取代表未知汉字模式本质的表达形式(如各种特征)和预先存储在机器中的标准汉字模式表达形式的集合(称为辞典)逐一匹配,用一定的准则进行判别,并在机器存储的标准汉字模式表达形式的集合中,找出最接近输入文字的模式表达形式,该表达形式对应的字就是识别结果。

汉字识别的原理框图见图1.1。光电扫描纸面文字产生模拟电信号,经模数转换成为带灰度值的数字信号送至预处理环节。预处理的内容和要求取决于识别方法。一般包括行、字切分,二值化,细化和抽取轮廓,平滑,规范化等。预处理后,汉字模式成为规范化的二值数字点阵,其中‘1’代表笔画,‘0’代表文字的空白背景。预处理后即可对文字图像提取特征(一种类型的表达式),和存储在辞典里的已知标准汉字表达形式进行匹配判别,就可识别出输入的未知汉字。

图1.1 汉字识别原理框图

在上图中中间横线以下是系统的学习部分,学习是根据多个未知子样(一个文字的不同字样称为子样)提取出的模式表达形式,自动构成或修改、充实辞典,不断提高系统的识别率。

汉字的模式表达式和相应的辞典形式有多种,每一种形式可以选择不同的特征(或基元),每种特征又有不同的提取方法。这些造成了判别方法和准则以及所用的数学工具的不同,形成了种类繁多、形式各异的汉字识别方法。不过,所有这些方法可以归结为两类一般的处理方法——统计决策方法和句法结构方法。最近还有人提出用人工智能方法识别汉字。接下来的两节中将对上面来种常用算法分别阐述。

必须指出的是,汉字识别有联机识别和脱机识别之分。在联机的情况下,汉字结构的输入顺序可以做为重要特征来识别汉字,在第二章将详细介绍这种方法及其实现。

1.2 基于统计决策方法的汉字识别

汉字识别的统计决策方法提取字符图像的特征形成特征矢量,特征矢量并不直接表示笔迹,而是表示字符图像的特性。统计字符识别方法根据训练样本集估计特征矢量的分布,具有优异的抗干扰能力,因此在汉字识别中得到广泛应用.该方法需要一个表达样本分布的函数,多变量正态分布概率密度函数通常被认为是样本分布的近似函数.汉字的统计特征种类很多,比如笔划密度特征,汉字粗外围特征、汉字网格特征等。下面简单介绍汉字粗外围特征的提取。

1.2.1汉字粗外围特征的提取

汉字轮廓结构包含了汉字特征的重要信息, 粗外围特征(即从汉字四边向中间扫描, 以第1 次碰到笔划象素所经过的行程值作为特征) 分类就是抽取汉字四周轮廓信息作为特征来进行分类的, 它被认为是印刷体汉字识别方面比较有效的粗分类方法。也可以采用一种改进的粗外围特征来进行粗分类,其基本思路是对原图进行变换, 以使内部结构受外围信息影响, 以图1.2为例,具体实现过程为: 先从文字四边框对文字进行扫描, 然后把原文字背景部分中, 从所有方向都不能连续扫描到的区域设为笔划部分, 这样就得到所谓的粗外围图. 由其实现过程可以看出, 原文字内部区域的特征也受轮廓影响, 如图1.2 (b) 所示, 其中“件”字内部一小块区域原来是背景(黑象素) , 但因为轮廓的影响, 变换后成为笔划区域(白象素).特征的计算方法为: 首先将36×36 点阵的粗外围图划分为4×4= 16 个网格(每个网格包括9×9pixel) , 再统计其中的白象素数, 以构成16 维粗外围特征. 实际上, 虽然特征实现时仍然使用了粗外围特征, 但原始粗外围特征仅考虑汉字的轮廓信息, 而改进方法则在利用汉字内部结构信息的基础上, 又加强了粗外围轮廓信息在特征量中的比重.

图1.2 汉字图像粗外围图

1.3基于结构特征方法的汉字识别

目前,文字结构特征的提取有两种方法,第一种方法是基于像素的字符轮廓获取方法,这种方法没有考虑全局信息和结构信息,因而结果中存在诸如毛边和交叉点变形等问题. 为此,研究人员提出了其它一些特征提取方法 ,但这使得基于像素的字符识别更加复杂而不稳定。第二种方法是用一组线段及它们相互间的关系来描述文字并进行识别,但是这些方法步骤繁多、计算复杂,难以实现,而且易受边界噪声和交叉点的影响。

无约束手写汉字数量庞大、结构复杂、形近字多而且无规则变形严重,所以各种不同字体手写汉字的识别是字符识别领域中一个极为困难的问题,被认为是该领域最具挑战性的研究课题和最高目标之一 . 在已有的方法中,有些只能识别相对简单的手写数字,有些虽然可以识别少量的手写汉字 ,但它们都无法从根本上克服误识别率高这一不足。贝叶斯分类器等传统的模式识别方法因先验知识不足而无法取得理想的效果,语法推理法和继电器法等新的识别方法因编码过程复杂、计算量大或可识别的文字数量有限等原因而难以实现。神经网络具有很强的知识获取能力和分类能力,有很高的容错性和鲁棒性,可以在特征空间内形成任意复杂的决策区域,它所具有的自组织、自学习功能大大放宽了传统模式识别方法所受的约束条件,为汉字识别提供了新的有力工具。

1.3.1 文字输入预处理及特征提取

因为手写汉字大小不一,所以在提取结构特征和进行识别时首先需要对其进行归一化处理。目前,大小归一化有两种方法,一是在水平和垂直方向都进行归一化;二是仅在一个方向归一化,同时保持输入汉字的形状比例。前者在减小不同人的手写汉字差异方面较为有效,但可能使汉字在某一方向上发生失真。这里根据手写汉字特征提取和识别的需要,对不同的输入手写汉字采用不同的归一化策略. 设原始手写汉字为Y 行*X 列,归一化后为width

height?列, 则: (1) 如果X ≤width且Y height

≤,文字只做平移操作; (2) 如果X>width且Y height ,则将文字高度归一化为height,宽度按比例归一化; (4) 如果X >width且Y >height,则将文字归一化为height行×width列。

现在来讨论归一化手写汉字的结构特征提取问题。该方法选择的结构特征包括:特征点、线段、基本笔画以及笔画方向图等。基本笔画定义为长度有限的直线,而笔画方向图描述了字符几何结构特征,其提取是以笔画方向为基础的。考虑了沿逆时针与水平方向夹角分别为0°,45°,90°和135°的四个方向,并用1 ,2 ,3 ,4 以及- 1 , - 2 , - 3 , - 4 分别标记这四个方向及其反方向. 令)

g为像素

x

(y

,

),(y x 的灰度级,对于黑色像素1),(=y x g ,对于白色像素0),(=y x g ,字符是由黑

色像素组成的图像。 一个黑色像素的方向码是根据沿四个方向经过该像素的笔画长度而确定的。该方法定义d 向笔画为沿方向d 的一系列连续黑色像素(d = 1 ,2 ,3 ,4) ,将经过黑色像素),(y x 的最长d 向笔画的方向定义为该点的方向码。 具有相同方向码的相连黑色像素构成一个像块,且称方向码为d 的像块为d 向像块。 如果某个像块与其它像块交叉或相接,则需要将该块进而分解为笔画段和交叉段。下面来提取结构特征量。首先需要提取的是轮廓段,它是从笔画段中提取出来的, 对于方向代码为d 的笔画段,它可以分解成一组连续的d 向笔画,提取轮廓段之前先确定该组两端的d 向笔画,将它们用一条直线连接起来,形成笔画段的轮廓. 虽然根据其方向码可将轮廓段分为四种,但轮廓段可能是任意方向. 如果某个轮廓段的长度小于或等于一个允许长度,就称其为短轮廓段. 如果短轮廓段的两端都不与交叉点相接,即为一个孤立轮廓段,则认为该短轮廓段是噪声. 如果只有一段与交叉点相接,这样的短轮廓段称为毛边.该算法根据这样的逻辑去除了所提取的轮廓段中的噪声和毛边现象。

接下来提取交叉点和轮廓。 假设交叉段只包括一个交叉点,当程序发现一个交叉段后,就首先计算交叉度和交叉点的位置,然后延长所有与该交叉段相接的轮廓段到该交叉点处,从而形成完整的字符轮廓。 假设Nd 代表方向代码同为d 且与同一个交叉段相接的轮廓段的个数,令Df 为该交叉段的交叉度,则有

4321N N N N Df +++=。 为了确定交叉点的位置,本文按照方向代码考虑了全部

四种不同的情况:

(1) 0=Df ,即没有轮廓段。

(2) 1=Df ,只有一个轮廓段,确定该轮廓段方向上与白色像素相邻接的黑色像素为交叉点。

(3) 1>Df 且4,3,2,1N N N N 至少有两个轮廓段,而且一个方向上最多只有一个轮廓段。 选择任意两个轮廓段并沿各自的方向将其延长,延长线的交点即为交叉点。 (4) 11>N ,24,3,2≥N N N ,至少有两个具有相同方向代码的轮廓段. 如果有一对延伸方向相反的d 向轮廓段,则标识量Flagd 置为1 ,相反则为0.此时确定交叉点时需要分三种情况讨论:

(a) 04321=+++Flag Flag Flag Flag ,不存在延伸方向相反的一对轮廓段. 如果有两个轮廓段方向码不相同,则将其沿各自的方向延长后必然会形成一个交叉点. 而如果所有轮廓段的方向码都相同,则将其中一段按估计的笔画宽度的某一倍数延长后即得到所期望的交叉点。

(b) 14321=+++Flag Flag Flag Flag ,只存在一对延伸方向相反的轮廓段. 用一段直线将它们连接起来,取该直线的中点作为交叉点。

(c) 14321>+++Flag Flag Flag Flag ,至少存在两个延伸方向相反的轮廓段. 任选两对轮廓段,将每对用一条直线相连,两条直线的交点便是所期望的交叉点。

提取出一个交叉点后,将每个在该交叉点相接的轮廓段与该交叉点连接起来,这样把所有轮廓段和交叉点都连接起来便构成了字符轮廓,即瘦化字符。

在提取出交叉点和轮廓段(即点特征和线段特征) 后,就可根据这两种信息进而提取基本笔画,根据轮廓段信息还可以提取出笔画方向图. 该处用一种简单的轮廓段合并策略将轮廓段合并成基本笔画. 依次检查各个交叉点处所有相接的轮廓段中是否有两个轮廓段共线,如果有就将它们合并成一个新的轮廓段,即基本笔画. 记φ1 和φ2 分别为两个轮廓段的方向角,令φ= min (| φ1 - φ2 | ,360°- | φ1- φ2 | ) 为两段的夹角,若155< φ<180°,则允许将两段合并. 然后以合并后的轮廓段取代原来的两个轮廓段,且更新轮廓段和交叉点的端点标记,同时选择与新轮廓段方向最接近的方向代码作为新的方向代码d 。当检查完所有交叉点后,全部基本笔画便最终确定了。

最后根据各轮廓段的方向代码来绘制笔画方向图. 首先将n n ?字符沿水平和垂直方向分成k k ?个单元,每个单元为m m ?,其中n mk =。选择每个单元中像素数目最多的轮廓段的方向代码为该单元方向码。如果某单元没有轮廓段经过,则其方向码置空(null ) ,所有单元的方向代码一起就构成了笔画方向图.

2 基于多特征提取的识别算法

现在对于联机手写体的汉字识别算法很多,在本章第一节,我们先对这些算法做初步的分析认识,然后在其基础上导出多特征提取的算法,而用于实现这些算法的代码将在下章给出。

2.1 手写汉字识别的现行算法分析

2.1.1 以笔划序列为特征的算法

该算法将汉字的笔画分为若干类,然后根据各类笔画的输入顺序做为一个汉字的特征并存入字库,当汉字联机输入时,得到该文字图像的笔画序列特征并和字库中的特征进行比较,若有一组特征与该图像特征的差别很小,即可认为是同一字。下面我们先介绍笔画的分类方法,然后在分别介绍图像的预处理和距离定义。

在介绍笔划的划分前,我们先把二维平面做一个划分,如下图所示:

图2.1 二维平面的划分

在上图基础上,笔划通常划分为以下几种:

(1)横,用数字1标识,方向为1;

(2)竖,用数字2标识,方向为3;

(3)撇,用数字3标识,方向为4;

(4)捺,用数字4标识,方向为2;

(5) 折,用数字5标识,有至少两个方向;

在有些算法中,又把折细分为顺时针方向折、逆时针方向折和混合方向折三种,在此不再细述。

将笔划分类以后,我们就要面临一个问题,如何从文字图像的读入过程中得到方向序列,自然地我们会想到斜率,即得到一个笔划中每一相素点的斜率,然后依照上图得到该笔划的方向,但严格来讲,用斜率表示并不明智,比如方向3和7的斜率根本不存在。得到一个相素点方向的可行方法是:用该相素后面第二个点的坐标与该相素坐标做比较,如下: 1、 若point[a+2].y=point[a].y 且point[a+2].x>point[a].x,方向1。 2、 若point[a+2].y=point[a].y 且point[a+2].xpoint[a].y,方向3。 4、 若point[a+2].x=point[a].x 且point[a+2].ypoint[a].x 且point[a+2].y>point[a].y,方向2。 6、 若point[a+2].x>point[a].x 且point[a+2].ypoint[a].y,方向4。 8、

若point[a+2].x

为得到一笔划方向,在得到该笔划内各相素的方向后,我们还要做一些去噪处理。比如为消除下笔和收笔时的抖动误差而去除两边若干相素点、为消除书写时的歪曲而除去若干奇异点等。得到笔划方向序列后,就必须为以后的匹配定义距离,即定义何谓相似的标准。通常做以下定义:

距离d=)1(1

∑=-m

i i a m

2.2

其中m 为输入文字图像的笔划数,i a 为输入文字图像第i 笔test[i]的笔划与字库中某组待比较特征的第i 笔的相似度,经过大量的调查分析,i a 一般取值如下表:

表2.3 笔划的相似度表

该算法的一般步骤如下:

(1) 从输入端得到输入点序列。

(2) 由输入点序列去噪、计算得到方向码序列。 (3) 将方向码序列去噪处理得到笔画码序列。

(4) 根据笔画码序列参照表2.3得到距离d ,匹配判别识别汉字。

根据此定义得到距离后与事先设定的阙值dis 进行比较,若d

相同,即对手写汉字图像做了识别。这种识别算法原理简单且易于实现,但也有其不足之处,例如:汉字“六”和“文”的笔划序列都是“4134”,所以无法正确识别。

2.1.2 基于统计特征的汉字识别算法

统计特征即汉字图像的相素分布特征]5[,为简化起见,一般把汉字图像转换成二值图像再做处理,通常把一副汉字图像分成4*4=16或3*3=9个区,统计每个区的黑色相素点数,然后与字库里已有特征做比较,将距离最小的做为匹配字符。这种算法中的距离也有多种定义,通常采用两种方法,方差距离和绝对值距离,下面以绝对值距离为例,讲述一下该方法的具体应用。

下图是一个汉字图像并对其做了4*4划分,其中各区的特征值如图所示:

图2.4 汉字图像的统计特征图

现在把其特征表示为一个数组即test.p[16],若字库中第i 组特征为tez[i].p[16],则待识别汉字图像与字库里第i 个字的距离为:

|][].[][.|16

j p i tez j p test d j ∑=-=

2.5

为了便于识别,需要定义阙值dis,若d

至此该算法的步骤可以归纳如下:

(1) 对输入图形进行4*4分区,统计每区黑色相素点数。

(2) 将每区黑色相素点数除以图像总黑相素点数,的到p[i],i=1,2……9。 (3) 由2.5式得到距离d ,然后匹配判别。

该方法形象直观,也很容易实现,但其弊端很多,表现在以下几个方面,

(1)这种方法只局限于一种字体且多用于印刷体汉字的识别,手写体汉字由于字形变化、歪曲教大,只使用该方法收效甚微。

(2)由于汉字图像大小不一,在读如图像后需要对其做规范化预处理。

(3)在汉字中存在很多字形十分相似的字,如“冢”和“家”,“狼”和“狠”

等,基于统计的识别算法对这些字不能区分。

(4)由于直接对图像进行分析,所以该方法主要用于脱机汉字识别。

2.2 现行算法的结合和改进

上节我们分别讲述了基因笔划特征和基于基于统计特征的的汉字识别算法,也讲了两种方法的优缺点,下面我面介绍怎么将两种算法结合并改进以进行联机手写汉字识别。

汉字是一种结构文字,即它的输入有一定的顺序,每一笔也有一定的结构,所以在进行联机手写汉字识别时,笔划信息一定要充分利用起来,同时我们知道,单纯的笔划特征不足以区分所有汉字,现在我们考虑将输入汉字图像分别从笔划和相素角度做两次分类识别,以下分别称为粗分类和细分类。

在粗分类阶段,我们根据2.1.1小节中的算法先把汉字定位于小范围内,即根据笔划数和笔划顺序从字库选出几个可能的汉字,至于怎样从这几个汉字中找出正确的对应字符就由细分类部分完成。

在细分类阶段,可以根据2.1.2小节中的算法对粗分类后的若干汉字进行识别,由于范围已经很小,所以该步骤不需要划分太细,通常情况下做3*3分区即可取得理想结果。注意,正如2.1.2小节中所说,用该方法要对汉字图像做规范化处理,我们可以稍做改进,把每区的黑色相素点数改为次数与汉字总相素点数的比值,这样就可以排除汉字大小不一的干扰。

在以上两个阶段,阙值的选取都十分重要,阙值太大则无法选出具体的汉字,阙值太小又可能由于书写不规范而无法识别,具体值可以根据多次实践、观察结果分析得出,同样处理的还有2.1.1小节的笔划相似度表,若结果不理想可以适当修改该表。

至此我们已经很详细的讲述了要采取联机手写汉字的识别算法,但不管什么算法都需要一种计算机语言去实现(通常使用高级语言),在下章,我们将给出各步骤实现的vc 代码,以便分析结果。

附注:

在下图中给出了基于多特征提取的联机手写汉字识别算法的流程图,借助此图可以更清晰地理解该算法。

图2.6 汉字识别算法流程图

3 识别算法对应的vc代码

在本章中,我们将介绍文字预处理、识别、识别后处理的代码,语句一般大

都简单,有难度的语句后面都有文章注释,所以在文中不在详细讲解,每一程序都在vc平台中调试过并成功运行,如不能允许请检查代码是否抄错。因为篇幅原因,用户界面、鼠标手写笔模拟等程序代码不再给出,有需要可自行查阅参考数

目。首先介绍一下程序实现所需的数据结构:

int num,Time;

int xmax,ymax,xmin,ymin;//随时记录最大x,y坐标

int mouseDown;//鼠标按下标记

int fxm[15][300];//方向码

int zong;//字库中的字符总数

struct

{

int x;

int y;

}store[15][300];//一笔划点序列

//备份的序列

struct

{

int x;

int y;

}storeback[15][300];

struct

{

char zifu[2];//代表字符

int total;//总的笔划数

int bh[15];//每个笔划的点数

double p[9];//每区相素比重

}tez[4000];

struct

{

char zifu[2];

int total;//笔画数

int bh[15];//笔画码序列

double p[9];//每区相素比重

}test;//意义同上,为测试点的结构

全国数学建模竞赛一等奖论文

交巡警服务平台的设置与调度 摘要 由于警务资源有限,需要根据城市的实际情况与需求建立数学模型来合理地确定交巡警服务平台数目与位置、分配各平台的管辖范围、调度警务资源。设置平台的基本原则是尽量使平台出警次数均衡,缩短出警时间。用出警次数标准差衡量其均衡性,平台与节点的最短路衡量出警时间。 对问题一,首先以出警时间最短和出警次数尽量均衡为约束条件,利用无向图上任意两点最短路径模型得到平台管辖范围,并运用上下界网络流模型优化解,得到A区平台管辖范围分配方案。发现有6个路口不能在3分钟内被任意平台到达,最长出警时间为5.7分钟。 其次,利用二分图的完美匹配模型得出20个平台封锁13个路口的最佳调度方案,要完全封锁13个路口最快需要8.0分钟。 最后,以平台出警次数均衡和出警时间长短为指标对方案优劣进行评价。建立基于不同权重的平台调整评价模型,以对出警次数均衡的权重u和对最远出警距离的权重v 为参数,得到最优的增加平台方案。此模型可根据实际需求任意设定权重参数和平台增数,由此得到增加的平台位置,权重参数可反映不同的实际情况和需求。如确定增加4个平台,令u=0.6,v=0.4,则增加的平台位置位于21、27、46、64号节点处。 对问题二,首先利用各区平台出警次数的标准差和各区节点的超距比例分析评价六区现有方案的合理性,利用模糊加权分析模型以城区的面积、人口、总发案次数为因素来确定平台增加或改变数目。得出B、C区各需改变2个平台的位置,新方案与现状比较,表明新方案比现状更合理。D、E、F区分别需新增4、2、2个平台。利用问题一的基于不同权重的平台调整评价模型确定改变或新增平台的位置。 其次,先利用二分图的完美匹配模型给出80个平台对17个出入口的最优围堵方案,最长出警时间12.7分钟。在保证能够成功围堵的前提下,若考虑节省警力资源,分析全市六区交通网络与平台设置的特点,我们给出了分阶段围堵方案,方案由三阶段构成。最多需调动三组警力,前后总共需要29.2分钟可将全市路口完全封锁。此方案在保证成功围堵嫌疑人的前提下,若在前面阶段堵到罪犯,则可以减少警力资源调度,节省资源。 【关键字】:不同权重的平台调整评价模糊加权分析最短路二分图匹配

数学建模算法分类

数学模型按照不同的分类标准有许多种类: 1.按照模型的数学方法分,有几何模型,图论模型,微分方程模型。概率模型,最优控制模型,规划论模型,马氏链模型。 2.按模型的特征分,有静态模型和动态模型,确定性模型和随机模型,离散模型和连续性模型,线性模型和非线性模型。 3.按模型的应用领域分,有人口模型,交通模型,经济模型,生态模型,资源模型。环境模型。 4.按建模的目的分,有预测模型,优化模型,决策模型,控制模型等。 5.按对模型结构的了解程度分,有白箱模型,灰箱模型,黑箱模型。 数学建模的十大算法: 蒙特卡洛算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,比较好用的算法。) 数据拟合、参数估计、插值等数据处理算法(比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用matlab作为工具。) 线性规划、整数规划、多元规划、二次规划等规划类问题(建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用lingo、lingdo软件实现)图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备。) 动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中) 最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法(这些问题时用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需谨慎使用) 网格算法和穷举法(当重点讨论模型本身而情史算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具) 一些连续离散化方法(很多问题都是从实际来的,数据可以是连续的,而计算机只认得是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的。 数值分析算法(如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用。) 图像处理算法(赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用matlab来处理问题。) 数学建模方法 统计:1.预测与预报2.评价与决策3.分类与判别4.关联与因果 优化:5.优化与控制 预测与预报 ①灰色预测模型(必须掌握) 满足两个条件可用: a数据样本点个数少,6-15个 b数据呈现指数或曲线的形式 ②微分方程预测(备用) 无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式

2013全国数学建模大赛a题优秀论文

车道被占用对城市道路通行能力的影响 摘要 随着城市化进程加快,城市车辆数的增加,致使道路的占用现象日益严重,同时也导致了更多交通事故的发生。而交通事故发生过程中,路边停车、占道施工、交通流密增大等因素直接导致车道被占用,进而影响了城市道路的通行能力。本文在视频提供的背景下通过数据采集,利用数据插值拟合、差异对比、车流波动理论等对这一影响进行了分析,具体如下: 针对问题一,首先根据视频1中交通事故前后道路通行情况的变化过程运用物理观察测量类比法、数学控制变量法提取描述变量(如事故横断面处的车流量、车流速度以及车流密度)的数据,从而通过研究各变量的变化,来分析其对通行能力的影响。而视频1中有一些时间断层,我们可根据现有的数据先用统计回归对各变量数据插值后再进行拟合,拟合过程中利用残差计算值的大小来选择较好的模型来反应各变量与事故持续时间的关系,进而更好地说明事故发生至撤离期间,事故所处横断面实际通行能力的变化过程。 针对问题二:沿用问题一中的方法,对视频2中影响通行能力的各个变量进行数据采集,同样使用matlab对时间断层处进行插值拟合处理,再将所得到的的变化图像与题一中各变量的变化趋势进行对比分析,其中考虑到两视频的时间段与两视频的事故时长不同,从而采用多种对比方式(如以事故发生前、中、后三时段比较差值、以事故相同持续时间进行对比、以整个事故时间段按比例分配时间进行对比)来更好地说明这一差异。由于小区口的位置不同、时间段是否处于车流高峰期以及1、2、3道车流比例不同等因素的影响,采用不同的数据采集方式使采集的变量数据的实用性更强,从而最后得到视频1中的道路被占用影响程度高于视频2中的影响程度,再者从差异图像的变化波动中得到验证,使其合理性更强。 针对问题三:运用问题1、2中三个变量与持续时间的关系作为纽带,再根据附件5中的信号相位确定出车流量的测量周期为一分钟,测量出上游车流量随时间的变化情况,而事故横断面实际通行能力与持续时间的关系已在1、2问中由拟合得到,所以再根据波动理论预测道路异常下车辆长度模型的结论,结合采集数据得到的函数关系建立数学模型,最后得出事故发生后,车辆排队长度与事故横断面实际通行能力、事故持续时间以及路段上游车流量这三者之间的关系式。 针对问题四:在问题3建立的模型下,利用问题4中提供的变量数据推导出其它相关变量值,然后代入模型,估算出时间长度,以此检验模型的操作性及可靠性。 关键词:通行能力车流波动理论车流量车流速度车流密度

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写):B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3.

指导教师或指导教师组负责人(打印并签名): ?(论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取消评奖资格。) 日期: 2014 年 9 月15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

数学建模算法大全层次分析法

第八章 层次分析法 层次分析法(Analytic Hierarchy Process ,简称AHP )是对一些较为复杂、较为模糊的问题作出决策的简易方法,它特别适用于那些难于完全定量分析的问题。它是美国运筹学家T. L. Saaty 教授于70年代初期提出的一种简便、灵活而又实用的多准则决策方法。 §1 层次分析法的基本原理与步骤 人们在进行社会的、经济的以及科学管理领域问题的系统分析中,面临的常常是一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统。层次分析法为这类问题的决策和排序提供了一种新的、简洁而实用的建模方法。 运用层次分析法建模,大体上可按下面四个步骤进行: (i )建立递阶层次结构模型; (ii )构造出各层次中的所有判断矩阵; (iii )层次单排序及一致性检验; (iv )层次总排序及一致性检验。 下面分别说明这四个步骤的实现过程。 1.1 递阶层次结构的建立与特点 应用AHP 分析决策问题时,首先要把问题条理化、层次化,构造出一个有层次的结构模型。在这个模型下,复杂问题被分解为元素的组成部分。这些元素又按其属性及关系形成若干层次。上一层次的元素作为准则对下一层次有关元素起支配作用。这些层次可以分为三类: (i )最高层:这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果,因此也称为目标层。 (ii )中间层:这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则,因此也称为准则层。 (iii )最底层:这一层次包括了为实现目标可供选择的各种措施、决策方案等,因此也称为措施层或方案层。 递阶层次结构中的层次数与问题的复杂程度及需要分析的详尽程度有关,一般地层次数不受限制。每一层次中各元素所支配的元素一般不要超过9个。这是因为支配的元素过多会给两两比较判断带来困难。 下面结合一个实例来说明递阶层次结构的建立。 例1 假期旅游有1P 、2P 、3P 3个旅游胜地供你选择,试确定一个最佳地点。 在此问题中,你会根据诸如景色、费用、居住、饮食和旅途条件等一些准则去反复比较3个侯选地点。可以建立如下的层次结构模型。 目标层O 选择旅游地 准则层C 景色 费用 居住 饮食 旅途 措施层P 1P 2P 3P 1.2 构造判断矩阵 层次结构反映了因素之间的关系,但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的心目中,它们各占有一定的比例。 在确定影响某因素的诸因子在该因素中所占的比重时,遇到的主要困难是这些比重常常不易定量化。此外,当影响某因素的因子较多时,直接考虑各因子对该因素有多大程度的影响时,常常会因考虑不周全、顾此失彼而使决策者提出与他实际认为的

全国数模竞赛优秀论文

一、基础知识 1.1 常见数学函数 如:输入x=[-4.85 -2.3 -0.2 1.3 4.56 6.75],则: ceil(x)= -4 -2 0 2 5 7 fix(x) = -4 -2 0 1 4 6 floor(x) = -5 -3 -1 1 4 6 round(x) = -5 -2 0 1 5 7 1.2 系统的在线帮助 1 help 命令: 1.当不知系统有何帮助内容时,可直接输入help以寻求帮助: >>help(回车) 2.当想了解某一主题的内容时,如输入: >> help syntax(了解Matlab的语法规定) 3.当想了解某一具体的函数或命令的帮助信息时,如输入: >> help sqrt (了解函数sqrt的相关信息)

2 lookfor命令 现需要完成某一具体操作,不知有何命令或函数可以完成,如输入: >> lookfor line (查找与直线、线性问题有关的函数) 1.3 常量与变量 系统的变量命名规则:变量名区分字母大小写;变量名必须以字母打头,其后可以是任意字母,数字,或下划线的组合。此外,系统内部预先定义了几个有特殊意 1 数值型向量(矩阵)的输入 1.任何矩阵(向量),可以直接按行方式 ...输入每个元素:同一行中的元素用逗号(,)或者用空格符来分隔;行与行之间用分号(;)分隔。所有元素处于一方括号([ ])内; 例1: >> Time = [11 12 1 2 3 4 5 6 7 8 9 10] >> X_Data = [2.32 3.43;4.37 5.98] 2 上面函数的具体用法,可以用帮助命令help得到。如:meshgrid(x,y) 输入x=[1 2 3 4]; y=[1 0 5]; [X,Y]=meshgrid(x, y),则 X = Y =

数学建模优秀论文设计模版

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括、电子、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的 资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参 考文献中明确列出。 我们重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则 的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展 示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): 我们的参赛报名号为(如果赛区设置报名号的话): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): 日期:年月日赛区评阅编号(由赛区组委会评阅前进行编号):

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):

题目(黑体不加粗三号居中) 摘要(黑体不加粗四号居中) (摘要正文小4号,写法如下) (第1段)首先简要叙述所给问题的意义和要求,并分别分析每个小问题的特点(以下以三个问题为例)。根据这些特点对问题 1 用······的方法解决;对问题 2 用······的方法解决;对问题3 用······的方法解决。 (第2段)对于问题1,用······数学中的······首先建立了······ 模型I。在对······模型改进的基础上建立了······模型II。对模型进行了合理的理论证明和推导,所给出的理论证明结果大约为······,然后借助于······数学算法和······软件,对附件中所提供的数据进行了筛选,去除异常数据,对残缺数据进行适当补充,并从中随机抽取了3 组数据(每组8 个采样)对理论结果进行了数据模拟,结果显示,理论结果与数据模拟结果吻合。(方法、软件、结果都必须清晰描述,可以独立成段,不建议使用表格) (第3段)对于问题2用······ (第4段)对于问题3用······ 如果题目单问题,则至少要给出2种模型,分别给出模型的名称、思想、软 件、结果、亮点详细说明。并且一定要在摘要对两个或两个以上模型进行比较, 优势较大的放后面,这两个(模型)一定要有具体结果。 (第5段)如果在……条件下,模型可以进行适当修改,这种条件的改变可能来自你的一种猜想或建议。要注意合理性。此推广模型可以不深入研究,也可以没有具体结果。 关键词:本文使用到的模型名称、方法名称、特别是亮点一定要在关键字里出现,5~7个较合适。 注:字数700-1000 之间;摘要中必须将具体方法、结果写出来;摘要写满几乎 一页,不要超过一页。摘要是重中之重,必须严格执行!。 页码:1(底居中)

数学建模常用方法

数学建模常用方法 建模常用算法,仅供参考: 1、蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必 用的方法) 2、数据拟合、参数估计、插值等数据处理算法(比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用M a t l a b作为工具) 3、线性规划、整数规划、多元规划、二次规划等规划类问题(建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通 常使用L i n d o、L i n g o软件实现) 4、图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备) 5、动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中) 6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法(这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用) 7、网格算法和穷举法(网格算法和穷举法都是暴力搜索最优点的算法,在很多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种 暴力方案,最好使用一些高级语言作为编程工具) 8、一些连续离散化方法(很多问题都是实际来的,数据可以是连续的,而计 算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的) 9、数值分析算法(如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用) 10、图象处理算法(赛题中有一类问题与图形有关,即使与图形无关,论文 中也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用M a t l a b进行处理) 一、在数学建模中常用的方法: 1.类比法 2.二分法 3.量纲分析法 4.差分法 5.变分法 6.图论法 7.层次分析法 8.数据拟合法 9.回归分析法 10.数学规划(线性规划、非线性规划、整数规划、动态规划、目标规划) 11.机理分析 12.排队方法

全国数学建模优秀论文

上海世博会影响力的定量评估 摘要 本文主要针对世博会对上海市的发展产生的影响力进行定量评估。 在模型一中,首先我们从上海的城市基础设施建设这一侧面定量评估世博会对上海市的发展产生的影响,而层次分析法是对社会经济系统进行系统分析的有力工具。所以我们运用层次分析法,构造成对比矩阵a,找到最大特征值 ,运用 进行一致性检验,这样对成对比矩阵a进行逐步修正,最终可以确定权向量。再运用模糊数学的综合评价法,通过组合权向量就可以得出召开世博会比没有召开世博会对上海城市基本设施建设的影响要高出40%。 在模型二中,上海世博会的影响力直接体现在GDP上,我们直接以GDP这个硬性直接指标来衡量上海世博会对上海的影响。因此我们运用线性回归的模型预测出在有无上海世博会这两者情况下的GDP的值,并将运用线性回归得到的数据与上海统计年鉴中的相关数据进行比较运算,算出误差在1.2%左右,这说明我们用线性回归得到的模型能准确地反映出世博会对上海GDP的影响。运用公式 可以计算出世博对上海GDP的影响力的大小为 。 关键词:层次分析法模糊数学线性回归城市基础建设 GDP 1 问题重述

2010年上海世博会是首次在中国举办的世界博览会。从1851年伦敦的“万国工业博览会”开始,世博会正日益成为各国人民交流历史文化、展示科技成果、体现合作精神、展望未来发展等的重要舞台。请你们选择感兴趣的某个侧面,建立数学模型,利用互联网数据,定量评估2010年上海世博会的影响力。 2 问题分析 对于模型一,为了定量评估2010年上海世博会的影响力,我们首先选取城市基础设施建设的投入这一个侧面,因为通过查找相关数据,我们发现,城市基础设施建设的投入在上海整个GDP的增长中占有很大的比重,对GDP的贡献占主体地位。而层次分析法是对社会经济系统进行系统分析的有力工具。为此,我们通过研究上海统计局的相关数据,使用层次分析法来评估世博会的召开对基础设施建设的投入的影响,目标层为世博会的召开对基础设施建设的投入的影响,准则层依次为电力建设、交通运输、邮电通信、公用事业、市政建设,方案层依次为没有召开世博时的影响、召开世博时的影响。首先我们通过层次分析法算出电力建设、交通运输、邮电通信、公用事业、市政建设的相对权重,然后应用模糊数学中的综合评价法对上海世博会对城市基础设施建设的影响作出综合的评价,应用综合评价法计算出没有召开世博和召开世博两种情况下的权重,从而得出上海世博会的召开对城市基础设施建设的影响。 对于模型二,直接以GDP这个硬性直接指标来衡量上海世博会对上海的影响。先根据上海没有申办世博会的GDP总额的相关数据,建立线性回归模型,由此预测不举办世博会情况下2010年上海市的GDP总额;再由2002年至2009年的GDP值用线性回归预测出举办世博会情况下2010年上海市的GDP总额,并将两种情况进行对比得出世博会对上海GDP的影响。 3 模型假设 3.1假设非典和奥运等重大事件对世博前的城市基础建设的投入影响很小,可以忽略。

数学建模十种常用算法

数学建模有下面十种常用算法, 可供参考: 1.蒙特卡罗算法(该算法又称随机性模拟算法,是通过计算机仿真来解决问 题的算法,同时可以通过模拟可以来检验自己模型的正确性,是比赛时必用的方法) 2.数据拟合、参数估计、插值等数据处理算法(比赛中通常会遇到大量的数 据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具) 3.线性规划、整数规划、多元规划、二次规划等规划类问题(建模竞赛大多 数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo软件实现) 4.图论算法(这类算法可以分为很多种,包括最短路、网络流、二分图等算 法,涉及到图论的问题可以用这些方法解决,需要认真准备) 5.动态规划、回溯搜索、分治算法、分支定界等计算机算法(这些算法是算 法设计中比较常用的方法,很多场合可以用到竞赛中) 6.最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法(这些 问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用) 7.网格算法和穷举法(网格算法和穷举法都是暴力搜索最优点的算法,在很 多竞赛题中有应用,当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具) 8.一些连续离散化方法(很多问题都是实际来的,数据可以是连续的,而计 算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的) 9.数值分析算法(如果在比赛中采用高级语言进行编程的话,那一些数值分 析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用) 10.图象处理算法(赛题中有一类问题与图形有关,即使与图形无关,论文中 也应该要不乏图片的,这些图形如何展示以及如何处理就是需要解决的问题,通常使用Matlab 进行处理)

数学建模国家一等奖优秀论文

2014高教社杯全国大学生数学建模竞赛 承诺书 我们仔细阅读了《全国大学生数学建模竞赛章程》和《全国大学生数学建模竞赛参赛规则》(以下简称为“竞赛章程和参赛规则”,可从全国大学生数学建模竞赛网站下载)。 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛章程和参赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛章程和参赛规则,以保证竞赛的公正、公平性。如有违反竞赛章程和参赛规则的行为,我们将受到严肃处理。 我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。

我们参赛选择的题号是(从A/B/C/D中选择一项填写): B 我们的报名参赛队号为(8位数字组成的编号): 所属学校(请填写完整的全名): 参赛队员 (打印并签名) :1. 2. 3. 指导教师或指导教师组负责人 (打印并签名): (论文纸质版与电子版中的以上信息必须一致,只是电子版中无需签名。以 上内容请仔细核对,提交后将不再允许做任何修改。如填写错误,论文可能被取 消评奖资格。) 日期:2014 年9 月 15日 赛区评阅编号(由赛区组委会评阅前进行编号):

2014高教社杯全国大学生数学建模竞赛 编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):

美国大学生数学建模竞赛优秀论文翻译

优化和评价的收费亭的数量 景区简介 由於公路出来的第一千九百三十,至今发展十分迅速在全世界逐渐成为骨架的运输系统,以其高速度,承载能力大,运输成本低,具有吸引力的旅游方便,减少交通堵塞。以下的快速传播的公路,相应的管理收费站设置支付和公路条件的改善公路和收费广场。 然而,随着越来越多的人口密度和产业基地,公路如花园州公园大道的经验严重交通挤塞收费广场在高峰时间。事实上,这是共同经历长时间的延误甚至在非赶这两小时收费广场。 在进入收费广场的车流量,球迷的较大的收费亭的数量,而当离开收费广场,川流不息的车辆需挤缩到的车道数的数量相等的车道收费广场前。因此,当交通繁忙时,拥堵现象发生在从收费广场。当交通非常拥挤,阻塞也会在进入收费广场因为所需要的时间为每个车辆付通行费。 因此,这是可取的,以尽量减少车辆烦恼限制数额收费广场引起的交通混乱。良好的设计,这些系统可以产生重大影响的有效利用的基础设施,并有助于提高居民的生活水平。通常,一个更大的收费亭的数量提供的数量比进入收费广场的道路。 事实上,高速公路收费广场和停车场出入口广场构成了一个独特的类型的运输系统,需要具体分析时,试图了解他们的工作和他们之间的互动与其他巷道组成部分。一方面,这些设施是一个最有效的手段收集用户收费或者停车服务或对道路,桥梁,隧道。另一方面,收费广场产生不利影响的吞吐量或设施的服务能力。收费广场的不利影响是特别明显时,通常是重交通。 其目标模式是保证收费广场可以处理交通流没有任何问题。车辆安全通行费广场也是一个重要的问题,如无障碍的收费广场。封锁交通流应尽量避免。 模型的目标是确定最优的收费亭的数量的基础上进行合理的优化准则。 主要原因是拥挤的

数学建模方法详解种最常用算法

数学建模方法详解--三种最常用算法 一、层次分析法 层次分析法[1] (analytic hierarchy process,AHP)是美国著名的运筹学家T.L.Saaty教授于20世纪70年代初首先提出的一种定性与定量分析相结合的多准则决策方法[2,3,4].该方法是社会、经济系统决策的有效工具,目前在工程计划、资源分配、方案 排序、政策制定、冲突问题、性能评价等方面都有广泛的应用. (一) 层次分析法的基本原理 层次分析法的核心问题是排序,包括递阶层次结构原理、测度原理和排序原理[5].下面分别予以介绍. 1.递阶层次结构原理 一个复杂的结构问题可以分解为它的组成部分或因素,即目标、准则、方案等.每一个因素称为元素.按照属性的不同把这 些元素分组形成互不相交的层次,上一层的元素对相邻的下一层的全部或部分元素起支配作用,形成按层次自上而下的逐层支配 关系.具有这种性质的层次称为递阶层次. 2.测度原理 决策就是要从一组已知的方案中选择理想方案,而理想方案一般是在一定的准则下通过使效用函数极大化而产生的.然而对 于社会、经济系统的决策模型来说,常常难以定量测度.因此,层次分析法的核心是决策模型中各因素的测度化.3.排序原理

层次分析法的排序问题,实质上是一组元素两两比较其重要性,计算元素相对重要性的测度问题.(二) 层次分析法的基本步骤 层次分析法的基本思路与人对一个复杂的决策问题的思维、判断过程大体上是一致的[1] . 1.成对比较矩阵和权向量 为了能够尽可能地减少性质不同的诸因素相互比较的困难,提高结果的准确度.T .L .Saaty 等人的作法,一是不把所有因 素放在一起比较,而是两两相互对比,二是对比时采用相对尺度. 假设要比较某一层n 个因素n C C ,,1对上层一个因素O 的影响,每次取两个因素i C 和j C ,用ij a 表示i C 和j C 对O 的影响之比, 全部比较 结 果 可 用 成 对 比 较 阵 1 ,0,ij ij ji n n ij A a a a a 表示,A 称为正互反矩阵.一般地,如果一个正互反阵 A 满足: , ij jk ik a a a ,,1,2,,i j k n (1) 则A 称为一致性矩阵,简称一致阵.容易证明n 阶一致阵A 有下列性质: ①A 的秩为1,A 的唯一非零特征根为n ;②A 的任一列向量都是对应于特征根 n 的特征向量. 如果得到的成对比较阵是一致阵,自然应取对应于特征根n 的、归一化的特征向量(即分量之和为1)表示诸因素n C C ,, 1对 上层因素O 的权重,这个向量称为权向量.如果成对比较阵A 不是一致阵,但在不一致的容许范围内,用对应于A 最大特征根(记

全国数学建模获奖论文

承诺书 我们仔细阅读了数学建模竞赛选拔的规则. 我们完全明白,在做题期间不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人研究、讨论与选拔题有关的问题。 我们知道,抄袭别人的成果是违反选拔规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守选拔规则,以保证选拔的公正、公平性。如有违反选拔规则的行为,我们将受到严肃处理。 我们选择的题号是(从A/B/C中选择一项填写): 队员签名:1. 2. 3. 日期:年月日

2012年河南科技大学数学建模竞赛选拔 编号专用页 评阅编号(评阅前进行编号): 评阅记录(评阅时使用): 评 阅 人 评 分 备 注

C题数学建模竞赛成绩评价与预测 一、摘要 近20 年来,CUMCM 的规模平均每年以20%以上的增长速度健康发展,是目前全国高校中规模最大的课外科技活动之一。本文对数学建模竞赛成绩的评价与预测问题进行了建模、求解和相关分析。 对于问题一,首先对广东赛区各院校2008-2011年建模奖励数据进行统计分析,将决策问题分为三个层次,建立多层次模糊综合评判模型。在该模型中,将因素集{国家一等奖,国家二等奖,省一等奖,省二等奖,省三等奖}看作准则层,将2008-2011各年建模情况看作方案层,结合实际情况,给出改进综合评判模型,解得广东金融学院、华南农业大学的总体综合评定成绩分别2.9474、2.7141,排名第一、第二。 对于问题二,首先建立单年的综合评定模型,得出广州赛区各院校2008-2011年的综合评定成绩。鉴于仅有4组数据,分别采用GM(1,1)法、回归曲线最小二乘法、移动平均法进行建模,最后结合实际情况并根据结果对比以上三种模型,确定了移动平均法方案最优,最终得出广东金融学院、华南农业大学的综合评定成绩分别为0.7369、0.6785,依旧排名第一、第二,较好地解决了问题二。 对于问题三,鉴于附件2所给数据冗杂庞大,故从中抽取2008-2011年的建模数据作为样本,分别统计出本科组和专科组在这四年中每年获得国家一等奖和国家二等奖的人数;将问题一中国家一等奖、二等奖的权重进行归一化处理,建立类似问题一的特殊综合评判模型,得出本科组哈尔滨工业大学、解放军信息工程大学的综合评定成绩分别为5.5117、4.6609;专科组海军航空工程学院、太原理工轻纺与美术学院的综合评定成绩分别为1.3931、1.3095,名列各组第一、第二,问题三得到了较好解决。 对于问题四,除全国竞赛成绩、赛区成绩外,讨论了学生的能力、参赛队数、师资力量、学校的综合实力、硬件设施等因素对建模成绩评估的影响,考虑首先对因素集进行模糊聚类分析,然后用层次分析法来进行评价,用BP神经网络结合Matlab软件来进行预测,理论上问题四能够得到较好地得到解决。 关键词: 模糊综合评判模型GM(1,1)模型移动平均法综合评定成绩

数学建模优秀论文模板(全国一等奖模板)

Haozl觉得数学建模论文格式这么样设置 版权归郝竹林所有,材料仅学习参考 版权:郝竹林 备注☆ ※§等等字符都可以作为问题重述左边的。。。。。一级标题 所有段落一级标题设置成段落前后间距13磅 图和表的标题采用插入题注方式题注样式在样式表中设置居中五号字体 Excel中画出的折线表字体采用默认格式宋体正文10号 图标题在图上方段落间距前0.25行后0行 表标题在表下方段落间距前0行后0.25行 行距均使用单倍行距 所有段落均把4个勾去掉 注意Excel表格插入到word的方式在Excel中复制后,粘贴,word2010粘贴选用使用目标主题嵌入当前 Dsffaf 所有软件名字第一个字母大写比如E xcel 所有公式和字母均使用MathType编写 公式编号采用MathType编号格式自己定义

农业化肥公司的生产与销售优化方案 摘 要 要求总分总 本文针对储油罐的变位识别与罐容表标定的计算方法问题,运用二重积分法和最小二乘法建立了储油罐的变位识别与罐容表标定的计算模型,分别对三种不同变位情况推导出的油位计所测油位高度与实际罐容量的数学模型,运用matlab 软件编程得出合理的结论,最终对模型的结果做出了误差分析。 针对问题一要求依据图4及附表1建立积分数学模型研究罐体变位后对罐容表的影响,并给出罐体变位后油位高度间隔为1cm 的罐容表标定值。我们作图分析出实验储油罐出现纵向倾斜 14.时存在三种不同的可能情况,即储油罐中储油量较少、储油量一般、储油量较多的情况。针对于每种情况我们都利用了高等数学求容积的知识,以倾斜变位后油位计所测实际油位高度为积分变量,进行两次积分运算,运用MATLAB 软件推导出了所测油位高度与实际罐容量的关系式。并且给出了罐体倾斜变位后油位高度间隔为1cm 的罐容标定值(见表1),最后我们对倾斜变位前后的罐容标定值残差进行分析,得到样本方差为4103878.2-?,这充分说明残差波动不大。我们得出结论:罐体倾斜变位后,在同一油位条件下倾斜变位后罐容量比变位前罐容量少L 243。 表 1.1 针对问题二要求对于图1所示的实际储油罐,试建立罐体变位后标定罐容表的数学模型,即罐内储油量与油位高度及变位参数(纵向倾斜角度α和横向偏转角度β)之间的一般关系。利用罐体变位后在进/出油过程中的实际检测数据(附件2),根据所建立的数学模型确定变位参数,并给出罐体变位后油位高度间隔为10cm 的罐容表标定值。进一步利用附件2中的实际检测数据来分析检验你们模型的正确性与方法的可靠性。我们根据实际储油罐的特殊构造将实际储油罐分为三部分,左、右球冠状体与中间的圆柱体。运用积分的知识,按照实际储油罐的纵向变位后油位的三种不同情况。利用MATLAB 编程进行两次积分求得仅纵向变位时油量与油位、倾斜角α的容积表达式。然后我们通过作图分析油罐体的变位情况,将双向变位后的油位h 与仅纵向变位时的油位0h 建立关系表达式01.5(1.5)cos h h β=--,从而得到双向变位油量与油位、倾斜角α、偏转角β的容积表达式。利用附件二的数据,采用最小二乘法来确定倾斜角α、偏转角β的值,用matlab 软件求出03.3=α、04=β α=3.30,β=时总的平均相对误差达到最小,其最小值为0.0594。由此得到双向变位后油量与油位的容积表达式V ,从而确定了双向变位后的罐容表(见表2)。 本文主要应用MATLAB 软件对相关的模型进行编程求解,计算方便、快捷、准确,整篇文章采取图文并茂的效果。文章最后根据所建立的模型用附件2中的实际检测数据进行了误差分析,结果可靠,使得模型具有现实意义。 关键词:罐容表标定;积分求解;最小二乘法;MATLAB ;误差分

数学建模算法大全排队论

第六章排队论模型 排队论起源于1909年丹麦电话工程师A. K.爱尔朗的工作,他对电话通话拥挤问题进行了研究。1917年,爱尔朗发表了他的著名的文章—“自动电话交换中的概率理论的几个问题的解决”。排队论已广泛应用于解决军事、运输、维修、生产、服务、库存、医疗卫生、教育、水利灌溉之类的排队系统的问题,显示了强大的生命力。 排队是在日常生活中经常遇到的现象,如顾客到商店购买物品、病人到医院看病常常要排队。此时要求服务的数量超过服务机构(服务台、服务员等)的容量。也就是说,到达的顾客不能立即得到服务,因而出现了排队现象。这种现象不仅在个人日常生活中出现,电话局的占线问题,车站、码头等交通枢纽的车船堵塞和疏导,故障机器的停机待修,水库的存贮调节等都是有形或无形的排队现象。由于顾客到达和服务时间的随机性。可以说排队现象几乎是不可避免的。 排队论(Queuing Theory)也称随机服务系统理论,就是为解决上述问题而发展的一门学科。它研究的内容有下列三部分: (i)性态问题,即研究各种排队系统的概率规律性,主要是研究队长分布、等待时间分布和忙期分布等,包括了瞬态和稳态两种情形。 (ii)最优化问题,又分静态最优和动态最优,前者指最优设计。后者指现有排队系统的最优运营。 (iii)排队系统的统计推断,即判断一个给定的排队系统符合于那种模型,以便根据排队理论进行分析研究。 这里将介绍排队论的一些基本知识,分析几个常见的排队模型。 §1 基本概念 1.1 排队过程的一般表示 下图是排队论的一般模型。 凡要求服务的对象统称为顾客,为顾客服务的人或物称为服务员,由顾客和服务员组成服务系统。对于一个服务系统来说,如果服务机构过小,以致不能满足要求服务的众多顾客的需要,那么就会产生拥挤现象而使服务质量降低。因此,顾客总希望服务机构越大越好,但是,如果服务机构过大,人力和物力方面的开支也就相应增加,从而会造成浪费,因此研究排队模型的目的就是要在顾客需要和服务机构的规模之间进行权衡决策,使其达到合理的平衡。 1.2 排队系统的组成和特征 一般的排队过程都由输入过程、排队规则、服务过程三部分组成,现分述如下: 1.2.1 输入过程 输入过程是指顾客到来时间的规律性,可能有下列不同情况: (i)顾客的组成可能是有限的,也可能是无限的。 (ii)顾客到达的方式可能是一个—个的,也可能是成批的。 (iii)顾客到达可以是相互独立的,即以前的到达情况对以后的到达没有影响;否则是相关的。 (iv)输入过程可以是平稳的,即相继到达的间隔时间分布及其数学期望、方差等数字特征都与时间无关,否则是非平稳的。

数学建模常用算法模型

数学模型的分类 按模型的数学方法分: 几何模型、图论模型、微分方程模型、概率模型、最优控制模型、规划论模型、马氏链模型等 按模型的特征分: 静态模型和动态模型,确定性模型和随机模型,离散模型和连续性模型,线性模型和非线性模型等 按模型的应用领域分: 人口模型、交通模型、经济模型、生态模型、资源模型、环境模型等。 按建模的目的分: 预测模型、优化模型、决策模型、控制模型等 一般研究数学建模论文的时候,是按照建模的目的去分类的,并且是算法往往也和建模的目的对应 按对模型结构的了解程度分: 有白箱模型、灰箱模型、黑箱模型等 比赛尽量避免使用,黑箱模型、灰箱模型,以及一些主观性模型。 按比赛命题方向分: 国赛一般是离散模型和连续模型各一个,2016美赛六个题目(离散、连续、运筹学/复杂网络、大数据、环境科学、政策) 数学建模十大算法 1、蒙特卡罗算法 (该算法又称随机性模拟算法,是通过计算机仿真来解决问题的算法,同时可以通过模拟可以来检验自己模型的正确性,比较好用的算法) 2、数据拟合、参数估计、插值等数据处理算法 (比赛中通常会遇到大量的数据需要处理,而处理数据的关键就在于这些算法,通常使用Matlab作为工具) 3、线性规划、整数规划、多元规划、二次规划等规划类问题 (建模竞赛大多数问题属于最优化问题,很多时候这些问题可以用数学规划算法来描述,通常使用Lindo、Lingo软件实现) 4、图论算法 (这类算法可以分为很多种,包括最短路、网络流、二分图等算法,涉及到图论的问题可以用这些方法解决,需要认真准备)

5、动态规划、回溯搜索、分治算法、分支定界等计算机算法 (这些算法是算法设计中比较常用的方法,很多场合可以用到竞赛中) 6、最优化理论的三大非经典算法:模拟退火法、神经网络、遗传算法 (这些问题是用来解决一些较困难的最优化问题的算法,对于有些问题非常有帮助,但是算法的实现比较困难,需慎重使用) 7、网格算法和穷举法 (当重点讨论模型本身而轻视算法的时候,可以使用这种暴力方案,最好使用一些高级语言作为编程工具) 8、一些连续离散化方法 (很多问题都是从实际来的,数据可以是连续的,而计算机只认的是离散的数据,因此将其离散化后进行差分代替微分、求和代替积分等思想是非常重要的) 9、数值分析算法 (如果在比赛中采用高级语言进行编程的话,那一些数值分析中常用的算法比如方程组求解、矩阵运算、函数积分等算法就需要额外编写库函数进行调用) 10、图象处理算法 (赛题中有一类问题与图形有关,即使与图形无关,论文中也应该要不乏图片的这些图形如何展示,以及如何处理就是需要解决的问题,通常使用Matlab进行处理) 算法简介 1、灰色预测模型(必掌握) 解决预测类型题目。由于属于灰箱模型,一般比赛期间不优先使用。 满足两个条件可用: ①数据样本点个数少,6-15个 ②数据呈现指数或曲线的形式 2、微分方程预测(高大上、备用) 微分方程预测是方程类模型中最常见的一种算法。近几年比赛都有体现,但其中的要求,不言而喻。学习过程中 无法直接找到原始数据之间的关系,但可以找到原始数据变化速度之间的关系,通过公式推导转化为原始数据的关系。 3、回归分析预测(必掌握) 求一个因变量与若干自变量之间的关系,若自变量变化后,求因变量如何变化; 样本点的个数有要求: ①自变量之间协方差比较小,最好趋近于0,自变量间的相关性小; ②样本点的个数n>3k+1,k为自变量的个数;

全国大学生数学建模竞赛b题全国优秀论文

基于打车软件的出租车供求匹配度模型研究与分析 摘要 目前城市“出行难”、“打车难”的社会难题导致越来越多的线上打车软件出现在市场上。“打车难”已成为社会热点。以此为背景,本文将要解决分析的三个问题应运而生。 本文运用主成分分析、定性分析等分析方法以及部分经济学理论成功解决了这三个问 题,得到了不同时空下衡量出租车资源供求匹配程度的指标与模型以及一个合适的补贴 方案政策,并对现有的各公司出租车补贴政策进行了分析。 针对问题一,根据各大城市的宏观出租车数据,绘制柱形图进行重点数据的对比分 析,首先确定适合进行分析研究的城市。之后,根据该市不同地区、时间段的不同特点 选择多个数据样本区,以数据样本区作为研究对象,进行多种数据(包括出租车分布、 出租车需求量等)的采集整理。接着,通过主成分分析法确定模型的目标函数、约束条 件等。最后运用spss软件工具对数据进行计算,求出匹配程度函数F 与指标的关系式, 并对结果进行分析。 针对问题二,在各公司出租车补贴政策部分已知的情况下,综合考虑出租车司机以 及顾客两个方面的利益,分别就理想情况与实际情况进行全方位的分析。在问题一的模 型与数据结果基础上,首先分别从给司机和乘客补贴两个角度定性分析了补贴的效果。 重点就给司机进行补贴的方式进行讨论,定量分析了目前补贴方案的效果,得出了如果 统一给每次成功的打车给予相同的补贴无法改善打车难易程度的结论,并对第三问模型 的设计提供了启示,即需要对具有不同打车难易程度和需求量的区域采取分级的补贴政 策。 针对问题三,在问题二的基础上我们设计了一种根据不同区域打车难易程度和需求

量来确定补贴等级的方法。设计了相应的量化指标,以极大化各区域打车难易程度降低 的幅度之和作为目标,建立该问题的规划模型。目的是通过优化求解该模型,使得通过 求得的优化补贴方案,能够优化调度出租车资源,使得打车难区域得到缓解。通过设计 启发式原则和计算机模拟的方法进行求解,并以具体案例分析得到,本文方法相对统一 的补贴方案而言的确可以一定程度缓解打车难的程度。 关键词:主成分分析法,供求匹配度,最优化模型,出租车流动平衡 1

相关文档
最新文档