数学建模之主成分分析法

数学建模之主成分分析法
数学建模之主成分分析法

主成分分析

主成分分析的主要目的是希望用较少的变量去解释原来资料中的大部分变量,将我们手中许多相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。

1、主成分分析的应用

(1)我国各地区普通高等教育发展水平综合评价。

(2)投资效益的分析和排序等。

2、主成分分析法的步骤

①对原始数据进行标准化处理

用12,,,m x x x 表示主成分分析指标的m 个变量,评价对象有n 个,ij a 表示第

i 个评价对象对应于第j 个指标的取值。将每个指标值ij a 转化为标准化指标ij a

,即 ,(1,2,,;1,2,,)ij j

ij j a a i n j m s μ-=== 式中:11n j ij i a n μ==∑,21

1()1n j ij j i s a n μ==--∑ 相应地,标准化指标变量为

,(1,2,,)j j

j j x x j m s μ-==

②计算相关系数矩阵R

()ij m m R r ?= 1,(,1,2,,)1

n ki

kj k ij a

a r i j m n =?==-∑ 其中:1,ii ij ji r r r ==,ij r 是第i 个指标和第j 指标之间的相关系数。 ③计算相关系数矩阵的特征值与特征向量

解特征方程0=-R I λ,得到特征值(1,2,,)i i m λ= 12,0m λλλ≥≥≥≥ ;再求出相对应的特征值i λ的特征向量(1,2,,)i u i m = ,其中12(,,,)T j j j mj u u u u = ,由特征向量组成的m 个新的指标变量为

11112121212122221122m m m m m m m mm m y u x u x u x y u x u x u x y u x

u x u x =+++??=+++????=+++? 其中:1y 为第1主成分,2y 为第1主成分,?,m y 为第m 主成分

④选择p (p ≤m )个主成分,计算综合评价值。

(1)计算特征值(1,2,,)j j m λ= 的信息贡献率和累积贡献率

用j b 表示主成分i y 的信息贡献率,则有

1(1,2,,)j

j m k

k b j m λλ

===∑ 用p a 表示主成分12,,,p y y y 的累积贡献率,则有

11p k k p m k

k a λλ

===∑∑ 若p a 接近于1(一般p a 的范围为85%—95%)时,则用前p 个指标变量12,,,p y y y 作为p 个主成分,代替原来m 个指标变量,再对p 个主成分进行综合分析。

⑤计算综合得分

用j b 表示第j 个主成分的信息贡献率,则有

1p

j j j Z b y ==∑

根据综合得分值进行评价。

例题:

高等教育是依赖高等院校进行的,高等教育的发展状况主要体现在高等院校的相关方面。遵循可比性原则,从高等教育的五个方面选取十项评价指标,具体如图1。

《中国统计年鉴,1995》和《中国教育统计年鉴,1995》除以各地区相应的人口数得到十项指标值见表1。其中:1x 为每百万人口高等院校数;2x 为每十万人口高等院校毕业生数;3x 为每十万人口高等院校招生数;4x 为每十万人口高等院校在校生数;5x 为每十万人口高等院校教职工数;6x 为每十万人口高等院校专职教师数;7x 为高级职称占专职教师的比例;8x 为平均每所高等院校的在校生数;9x 为国家财政预算内普通高教经费占国内生产总值的比重;10x 为生均教育经费。

图1高等教育的十项评价指标

表1 我国各地区普通高等教育发展状况数据

请对各地区高教发展水平进行综合评价值及排序。

解:定性考察反映高等教育发展状况的五个方面十项评价指标,可以看出,某些指标之间可能存在较强的相关性。比如每十万人口高等院校毕业生数、每十万人口高等院校招生数与每十万人口高等院校在校生数之间可能存在较强的相关性,每十万人口高等院校教职工数和每十万人口高等院校专职教师数之间可能存在较强的相关性。为了验证这种想法,计算十个指标之间的相关系数。可以看出某些指标之间确实存在很强的相关性,如果直接用这些指标进行综合评价,必然造成信息的重叠,影响评价结果的客观性。主成分分析方法可以把多个指标转化为少数几个不相关的综合指标,因此,可以考虑利用主成分进行综合评价。

利用MATLAB软件对十个评价指标进行主成分分析,相关系数矩阵的前几个特征根及其贡献率如表2。

表2主成分分析结果

可以看出,前两个特征根的累计贡献率就达到90%以上,主成分分析效果很好。下面选取前四个主成分(累计贡献率就达到98%)进行综合评价。前四个特征根对应的特征向量见表3。

表3 标准化变量的前4个主成分对应的特征向量

由此可得四个主成分分别为:

112102121031210412100.34970.3590.24520.19720.0340.2860.16390.10840.86370.10220.22660.2457y x

x x y x

x x y x

x x y x x x =+++=-++-=--++=--+-

从主成分的系数可以看出,第一主成分主要反映了前六个指标(学校数、学生数和教师数方面)的信息,第二主成分主要反映了高校规模和教师中高级职称的比例,第三主成分主要反映了生均教育经费,第四主成分主要反映了国家财政预算内普通高教经费占国内生产总值的比重。把各地区原始十个指标的标准化数据代入四个主成分的表达式,就可以得到各地区的四个主成分值。

分别以四个主成分的贡献率为权重,构建主成分综合评价模型:

12340.75020.15770.05360.0206Z y y y y =+++

把各地区的四个主成分值代入上式,可以得到各地区高教发展水平的综合评价值以及排序结果如表4。

表4 排名和综合评价结果

分析:

各地区高等教育发展水平存在较大的差异,高教资源的地区分布很不均衡。北京、上海、天津等地区高等教育发展水平遥遥领先,主要表现在每百万人口的学校数量和每十万人口的教师数量、学生数量以及国家财政预算内普通高教经费占国内生产总值的比重等方面。陕西和东北三省高等教育发展水平也比高。贵州、广西、河南、安徽等地区高等教育发展水平比较落后,这些地区的高等教育发展需要政策和资金的扶持。值得一提的是西藏、新疆、甘肃等经济不发达地区的高等教育发展水平居于中上游水平,可能是由于人口等原因。

数学建模主成分分析方法

主 成分分析方法 地理环境是多要素的复杂系统,在我们进行地理系统分析时,多变量问题是经常会遇到的。变量太多,无疑会增加分析问题的难度与复杂性,而且在许多实际问题中,多个变量之间是具有一定的相关关系的。因此,我们就会很自然地想到,能否在各个变量之间相关关系研究的基础上,用较少的新变量代替原来较多的变量,而且使这些较少的新变量尽可能多地保留原来较多的变量所反映的信息事实上,这种想法是可以实现的,这里介绍的主成分分析方法就是综合处理这种问题的一种强有力的方法。 一、主成分分析的基本原理 主成分分析是把原来多个变量化为少数几个综合指标的一种统计分析方法,从数学角度来看,这是一种降维处理技术。假定有n个地理样本,每个样本共有p个变量描述,这样就构成了一个n×p阶的地理数据矩阵:

111212122212p p n n np x x x x x x X x x x ???=????L L L L L L L (1) 如何从这么多变量的数据中抓住地理事物的内在规律性呢要解决这一问题,自然要在p 维空间中加以考察,这是比较麻烦的。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标来代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多指标所反映的信息,同时它们之间又是彼此独立的。那么,这些综合指标(即新变量)应如何选取呢显然,其最简单的形式就是取原来变量指标的线性组合,适当调整组合系数,使新的变量指标之间相互独立且代表性最好。 如果记原来的变量指标为x 1,x 2,…,x p ,它们的综合指标——新变量指标为z 1,z 2,…,zm (m≤p)。则 11111221221122221122,,......................................... ,p p p p m m m mp p z l x l x l x z l x l x l x z l x l x l x =+++??=+++????=+++?L L L (2)

层次分析报告法在数学建模中的应用

层次分析法在数学建模中的应用 摘要:人们在生活中处理一些决策问题的时候,要考虑的因素有多有少,有大有小,但是 一个共同的特点是它们通常都涉及到经济 、社会、 人文等方面的因素。在作比较、 判断 、 评价、 决策时,这些因素的重要性 影响力或者优先程度往往难以量化,人的主观选择会起 着相当主要的作用,这就给用一般的数学方法解决问题带来本质上的困难。这是就有人提出 了一种能有效地处理这样一类问题的实用方法,称为层次分析法,这是一种定性和定量相结 合的、系统化、层次化的分析方法。以及在对层次分析法的引入基础之上,建立层次分析模 型,并给出了层次分析的求解过程,以及在现实生活中的应用。 关键词:层次分析法;成对比较矩阵;权向量;一致性指标;一致性比率 一. 问题的提出:人们在日常生活中常常碰到许多决策问题:请朋友吃饭要筹划是办家宴还是去饭店,是吃中餐、西餐还是自助餐;假期旅游和科研成果的评价。诸如此类问题面临抉择,就要慎重考虑,反复比较,尽可能满意的决策。 然而人们在处理上面这些决策问题的时候,要考虑的因素有多有少,有大有小,但是一个共同的特点是它们通常都涉及经济社会和人文等方面的因素。在做比较、判断、评价、决策时,这些因素的重要性、影响力或者优先程度难以量化,人的主观选择会起着相当重要的作用。T.L.Saaty 等人在20世纪70年代提出了一种能有效地处理这样一类问题的实用方法,称为层次分析法(简称AHP ),这是一种定性和定量相结合的、系统化、层次化的分析方法。 二. 层次分析法的基本步骤 1.将决策问题分解为三个层次。最上层为目标层,最下层为方案层,中间层为准则层。 2.通过相互比较确定各准则对于目标的权重,及各方案对于每一准则的权重,这些权重在人的思想过程常是定性的,而在层次分析法中则要给出得到权重的定量方法。 3.将方案层对准则层的权重及准则层对目标层的权重进行综合,最终确定方案层对目标层的权重。在层次分析法中要给出进行综合的计算方法。 三. 构造成对比较阵、计算权向量并做一致性检验;计算组合权向量并做组合一致性检验。 1.成对比较矩阵和权向量 所有因素两两相互对比,对比时采用相对尺度,以尽可能减少性质不同的诸因素相互对比的困难,提高准确度。 假设要比较某一层n 个因素对12,n c c c 上层一个因素O 的影响,每次取两个

基于层次分析法的数学建模

基于层次分析法研究云南烟草品牌竞争力 摘要 与国外知名烟草品牌相比,国内的烟草品牌存在着品牌集中度不够,品牌多、杂、散、小;品牌定位模糊,市场占有率低;品牌形象乱,品牌美誉度低,消费者购买行为习惯化导致忠诚度差等问题,因此,本文采用层次分析法对在中国烟草行业中有着举足轻重地位的云南省烟草品牌竞争力进行了评价研究,分析云南烟草业品牌现状,提出品牌竞争力的影响因素,对提高云南烟草业的品牌竞争力、解决烟草业存在的问题提供一定的帮助。 关键词:烟草品牌云南烟草品牌竞争力层次分析法 一、问题重述 近年来,我国一直推进实施卷烟工业的整合重组、卷烟品牌的淘汰和优化。但是,由于之前的卷烟品牌众多;截止到 2009 年底我国的烟草企业有 30 家,卷烟品牌 138 个,所以目前我国烟草企业之间的竞争非常激烈,行业内有众多势均力敌的竞争对手。当今卷烟产品差异化日渐缩小,消费者购买时会更看重品牌价值和品牌文化,使烟草行业内部面临着激烈的竞争,以具有代表性的云烟为实证,分析云南烟草企业的品牌竞争力及影响品牌竞争力的主要因素,并提出提高云烟品牌竞争力的对策建议。

二、问题分析 (1)云南卷烟近年情况分析 图1为云产卷烟在全国各地区的销量情况,有颜色部分为云南卷烟销量均超过15.58万箱,在全国卷烟销售中占有很大份额。2008 年卷烟品牌为16个,比2003年的36个减少了 20个。作为全国卷烟产销量最大的省份,2009 年云南的产销量达到 3667.9 亿支。在卷烟产量增幅较小的情况下,2008 年云南烟草工业税利为 577 亿元,比2003 年的 330 亿元增加了 247 亿元。因此,分析云南卷烟品牌竞争力有助于对云南卷烟品牌做出适当的规划调整,很大程度上能够促进云南经济的发展。(数据为云南中烟系统中2015年 云产卷烟销量数据) 图1

数学建模-主成分分析法模板

根据主成分分析的方法,分析……的数据。步骤如下: Step 1:为了消除不同变量的量纲的影响,首先需要对变量进行标准化,设检测数据样本共有n 个,指标共有p 个,分别设1X ,2X ,p X ,令ij X (i=1,2,…,n;j=1,2,…,p)为第i 个样本第j 个指标的值。作变换 ) Var(X )E(X X Y j j j j -= (j=1,2,…,p) 得到标准化数据矩阵j j ij ij s x x y -= ,其中∑==i 1i ij j x n 1x ,∑=-=n 1 i 2j ij 2 j )x x (n 1s Step 2:在标准化数据矩阵p n ij )y (Y ?=的基础上计算p 个原始指标相关系数矩阵 ??? ??? ????? ???==?pp 2 p 1p p 22221p 112 11p p ij r r r r r r r r r )r (R ΛM M M M Λ Λ 其中,∑∑∑===----= n 1 k n 1 k 2 j k j 2i k i n 1 k j k j i k i ij )x x ()x x () x x )(x x (r (i,j=1,2,…,p) Step 3:求相关系数矩阵R 的特征值并排序0p 21≥λ≥≥λ≥λΛ,再求出R 的特征值相应的正则化特征向量)e ,,e ,e (e ip i21i i K =,则第i 个主成分表示为各指标k X 的组合∑=?=p 1i k ik i X e Z 。 Step 4:计算累积贡献率确定主成分的数目。主成分i Z 的贡献率为 )p ,,2,1i (w p 1 k k i i Λ=λ λ= ∑= 累计贡献率为 ) p ,,2,1i (p i 1 k k Λ=λ∑=

数学建模之层次分析法

第四讲层次分析法 在现实世界中,往往会遇到决策的问题,比如如何选择旅游景点的问题,选择升学志愿的问题等等。在决策者作出最后的决定以前,他必须考虑很多方面的因素或者判断准则,最终通过这些准则作出选择。 比如选择一个旅游景点时,你可以从宁波、普陀山、浙西大峡谷、雁荡山和楠溪江中选择一个作为自己的旅游目的地,在进行选择时,你所考虑的因素有旅游的费用、旅游地的景色、景点的居住条件和饮食状况以及交通状况等等。这些因素是相互制约、相互影响的。我们将这样的复杂系统称为一个决策系统。这些决策系统中很多因素之间的比较往往无法用定量的方式描述,此时需要将半定性、半定量的问题转化为定量计算问题。层次分析法是解决这类问题的行之有效的方法。层次分析法将复杂的决策系统层次化,通过逐层比较各种关联因素的重要性来为分析、决策提供定量的依据。 一、建立系统的递阶层次结构 首先要把问题条理化、层次化,构造出一个有层次的结构模型。一个决策系统大体可以分成三个层次: (1) 最高层(目标层):这一层次中只有一个元素,一般它是分析问题的预定目标或理想结果; (2) 中间层(准则层):这一层次中包含了为实现目标所涉及的中间环节,它可以由若干个层次组成,包括所需考虑的准则、子准则; (3) 最低层(方案层):这一层次包括了为实现目标可供选择的各种措施、决策方案等。 比如旅游景点问题,我们可以得到下面的决策系统: 目标层——选择一个旅游景点 准则层——旅游费用、景色、居住、饮食、交通 方案层——宁波、普陀山、浙西大峡谷、雁荡山、楠溪江 二、构造成对比较判断矩阵和正互反矩阵 在确定了比较准则以及备选的方案后,需要比较若干个因素对同一目标的影响,从额确定它们在目标中占的比重。如旅游问题中,五个准则对于不同决策者在进行决策是肯定会有不同的重要程度,而不同的方案在相同的准则上也有不同的适合程度表现。层次结构反映了因素之间的关系,但准则层中的各准则在目标衡量中所占的比重并不一定相同,在决策者的

(完整版)数学建模之层次分析法

层次分析法 层次分析法是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的课题。 缺点: (1)层次分析法的主观性太强,模型的搭建,判断矩阵的输入都是决策者的主观判断,往往会因为决策者的考虑不周、顾此失彼而造成失误。 (2)层次分析法模型的内部结构太过理想化,完全分离、彼此独立的层次结构在实践中很难做到。 (5)层次分析法只能从给定的决策方案中去选择,而不能给出新的、更优的策略。 1.模型的应用 用于解决多目标的复杂问题的定性与定量相结合的决策分析。 (1)公司选拔人员, (2)旅游地点的选取, (3)产品的购买等, (4)船舶投资决策问题(下载文档), (5)煤矿安全研究, (6)城市灾害应急能力, (7)油库安全性评价, (8)交通安全评价等。 2.步骤 ①建立层次结构模型 首先明确决策目标,再将各个因素按不同的属性从上至下搭建出一个有层次的结构模型,模型如下图所示。

目标层 准则层 方案层 目标层:表示解决问题的目的,即层次分析要达到的总目标。通常只有一个总目标。 准则层:表示采取某种措施、政策、方案等实现预定总目标所涉及的中间环节。 方案层:表示将选用的解决问题的各种措施、政策、方案等。通常有几个方案可选。 注意: (1)任一元素属于且仅属于一个层次;任一元素仅受相邻的上层元素的支配,并不是任一元素与下层元素都有联系; (2)虽然对准则层中每层元素数目没有明确限制,但通常情况下每层元素数最好不要超过 9 个。这是因为,心理学研究表明,只有一组事物在 9 个以内,普通人对其属性进行判别时才较为清楚。当同一层次元素数多于 9 个时,决策者对两两重要性判断可能会出现逻辑错误的概率加大,此时可以通过增加层数,来减少同一层的元素数。 ②构造判断(成对比较)矩阵 以任意一个上一层的元素为准则,对其支配的下层各因素之间进行两两比 a重要程度的衡量用Santy的1—9较。得到判断矩阵,再求出各元素的权重。 ij 标度方法给出。即

层次分析法-数学建模

层次分析法 一、分析模型和一般步骤 二、建立层次结构模型 三、构造成对比较矩阵 四、作一致性检验 五、层次总排序及决策 一. 层次分析模型和一般步骤 层次分析法是一种定性与定量分析相结合的多因素决策分析方法。这种方法将决策者的经验判断给于数量化,在目标因素结构复杂且缺乏必要数据的情况下使用更为方便,因而在实践中得到广泛应用。 层次分析的四个基本步骤: (1)在确定决策的目标后,对影响目标决策的因素进行分类,建立一个多层次结构; (2)比较同一层次中各因素关于上一层次的同一个因素的相对重要性,构造成对比较矩阵; (3)通过计算,检验成对比较矩阵的一致性,必要时对成对比较矩阵进行修改,以达到可以接受的一致性; (4)在符合一致性检验的前提下,计算与成对比较矩阵最大特征值相对应的特征向量,确定每个因素对上一层次该因素的权重; 计算各因素对于系统目标的总排序权重并决策。 二. 建立层次结构模型 将问题包含的因素分层:最高层(解决问题的目的);中间层(实现总目标而采取的各种措施、必须考虑的准则等。也可称策略层、约束层、准则层等);最低层(用于解决问题的各种措施、方案等)。把各种所要考虑的因素放在适当的层次内。用层次结构图清晰地表达这些因素的关系。 〔例1〕购物模型 某一个顾客选购电视机时,对市场正在出售的四种电视机考虑了八项准则作为评估依据,建立层次分析模型如下:

例2〕选拔干部模型 对三个干部候选人、、,按选拔干部的五个标准:品德、才能、资历、年龄和群众关系,构成如下层次分析模型:假设有三个干部候选人、、,按选拔干部的五个标准:品德,才能,资历,年龄和群众关系,构成如下层次分析模型 例3〕评选优秀学校 某地区有三个学校,现在要全面考察评出一个优秀学校。主要考虑以下几个因素: (1)教师队伍(包括平均学历和年龄结构)

数学建模各种分析报告方法

现代统计学 1.因子分析(Factor Analysis) 因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量),以较少的几个因子反映原资料的大部分信息。 运用这种研究技术,我们可以方便地找出影响消费者购买、消费以及满意度的主要因素是哪些,以及它们的影响力(权重)运用这种研究技术,我们还可以为市场细分做前期分析。 2.主成分分析 主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,和cluster analysis一起使用,c,和判别分析一起使用,比如当变量很多,个案数不多,直接使用判别分析可能无解,这时候可以使用主成份发对变量简化。(reduce dimensionality)d,在多元回归中,主成分分析可以帮助判断是否存在共线性(条件指数),还可以用来处理共线性。 主成分分析和因子分析的区别 1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。 2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。 3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。 4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。 5、在因子分析中,因子个数需要分析者指定(spss根据一定的条件自动设定,只要是特征值大于1的因子进入分析),而指定的因子数量不同而结果不同。在主成分分析中,成分的数量是一定的,一般有几个变量就有几个主成分。 和主成分分析相比,由于因子分析可以使用旋转技术帮助解释因子,在解释方面更加有优势。大致说来,当需要寻找潜在的因子,并对这些因子进行解释的时候,更加倾向于使用因子分析,并且借助旋转技术帮助更好解释。而如果想把现有的变量变成少数几个新的变量(新的变量几乎带有原来所有变量的信息)来进入后续的分析,则可以使用主成分分析。当然,这中情况也可以使用因子得分做到。所以这中区分不是绝对的。 总得来说,主成分分析主要是作为一种探索性的技术,在分析者进行多元数据分析之前,用主成分分析来分析数据,让自己对数据有一个大致的了解是非常重要的。主成分分析一般很少单独使用:a,了解数据。(screening the data),b,

数学建模-主成分分析法模板

根据主成分分析的方法,分析 ……的数据。步骤如下: Step 1为了消除不同变量的量纲的影响,首先需要对变量进行标准化,设检测 数据样本 共有n 个,指标共有p 个,分别设X i ,X 2,X p ,令 X j (i=1,2,…,n;j=1,2,…,p)为第i 个样本第j 个指标的值。作变换 X 乂」已心“,…,p ) Var(X j ) Step 2:在标准化数据矩阵Y (y j )np 的基础上计算p 个原始指标相关系数矩阵 R (r j )pp r 11 *2 r 21 r 22 r 1p r 2p r p1 r p2 r pp n (X ki X i )(x kj X j ) 其中,r j k 1 (i j=1 2 -?? p) n n ( I,J=I ,2, ,p) (X ki X i ) (X X j )2 .k 1 k 1 Step 3:求相关系数矩阵 R 的特征值并排序1 2 p 0,再求出R 的特征 值相应的正则化特征向量 e i (e i1 , e i2 , ,e ip ) , 则第i 个主成分表示为各指标X k p 的组合Z i e ik X k i 1 Step 4:计算累积贡献率确定主成分的数目。主成分 累计贡献率为 (i 1,2, ,p) 得到标准化数据矩阵y j X ij S j 仝,其中X j 2 X j ,S j n i i (X j X j )2 n i i w i i p k k 1 (i 1,2, ,p) 乙的贡献率为

般取累计贡献率达85%~95%的特征值 1, 2 , m 所对应的第1、第2,…, 2 / 5 第m (m W p )个主成分 Step 5:计算主成分载荷,确定综合得分。当主成分之间不相关时,主成分载荷 是主成分 和各指标的相关系数,相关系数越大,说明主成分对该指标变量的代 表性就越好,计算公式为 l j P ( Z i ,xj ... i e j (i,j 1,2, ,p) Step 6:各主成分的得分,确定综合评分函数。得到各主成分的载荷以后,可以 计算各主 成分的得分 m 则第i 个样本的综合得分f i W k Z ik (i=1,2,…,n); k 1 附件中共有28个月的数据,这里仅随机选择 2005年4月的数据来说明利 分析进行水质综合评价的过程(同理可进行其他月份的数据分析)。 调用MATLAB 统计工具箱princomp 函数,格式为: [pc,score,late nt,tsquare]=pri ncomp(i ngredie nts) 其中in gredie nts 指标准化后的样本指标矩阵,pc 是指各主成分关于指标的线性 组合的系数矩阵,score 为各主成分得分,late nt 是方差矩阵的特征值,tsquare 为 Hotelling T 2 统计量。 各种指标的相关系数矩阵: Z i 111 X i l 12 X 2 l 1p X Z 2 1 21 X 1 1 2 2 X 2 2p X p m1X 1 1 m 2X 2 m p X p Z (Z j )n Z 11 Z 12 Z 21 Z 22 Z 1 m Z 2m ,其中z ij 表示第i 个样本第j 个主成分得分, Z n1 Z n2 z nm

主成分分析在数学建模中的应用

第一讲 主成分分析在数学建模中的应用 1.学习目的 1、理解主成分分析的基本思想; 2、会用SAS 软件编写相关程序,对相关数据进行主成分分析; 3、会用SAS 软件编程结合主成分分析方法解决实际问题。 2.学习要求 1、理解主成分分析的基本原理,掌握主成分分析的基本步骤; 2、会用SAS 软件编写相关程序,对相关数据进行分析处理与假设检验; 3、撰写不少于3000字的小论文; 4、 精读一篇优秀论文。 3. 理论基础 3. 1基本思想 在实际问题的研究中,往往会涉及众多的变量。但就是,变量太多不但会增加 计算的复杂性,而且也给合理地分析问题与解释问题带来困难。一般来说,虽然每个变量提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数较少的互不相关的新变量来反映原来变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析就就是在这种降维的思想下产生的处理高维数据的方法。 3、2 基本原理 (1)、总体的主成分 定义1、设'12(,,)X X X =p …,X 为P 维随机向量,称' i i Z a X =为X 的第i 主成分(i=1,2,… P),如果: (1) ' 1(1,2,);i i a a i ==…,p (2) 当i>1时,' 0(1,2,);i j a a j ==∑…i-1 (3) ''' 1,0(1,) ()max ()j i a a a a j Var Z Var a X ====∑…i-1 定理1、设' 12(,,)X X X =p …,X 就是P 维随机向量,且()D X =∑,∑的特征值为

主成分分析在数学建模中的应用

第一讲 主成分分析在数学建模中的应用 1.学习目的 1.理解主成分分析的基本思想; 2.会用SAS 软件编写相关程序,对相关数据进行主成分分析; 3.会用SAS 软件编程结合主成分分析方法解决实际问题。 2.学习要求 1.理解主成分分析的基本原理,掌握主成分分析的基本步骤; 2.会用SAS 软件编写相关程序,对相关数据进行分析处理和假设检验; 3.撰写不少于3000字的小论文; 4. 精读一篇优秀论文。 理论基础 1基本思想 在实际问题的研究中,往往会涉及众多的变量。但是,变量太多不但会增加计算的复杂性,而且也给合理地分析问题和解释问题带来困难。一般来说,虽然每个变量提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数较少的互不相关的新变量来反映原来变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析就是在这种降维的思想下产生的处理高维数据的方法。 基本原理 (1).总体的主成分 定义1.设' 12(,,)X X X =p …,X 为P 维随机向量,称' i i Z a X =为X 的第i 主成分(i=1,2,…P ),如果: (1) ' 1(1,2,);i i a a i ==…,p (2) 当i>1时,' 0(1,2,);i j a a j ==∑…i-1 (3) ''' 1,0(1,) ()max ()j i a a a a j Var Z Var a X ====∑…i-1 定理 1.设' 12(,,)X X X =p …,X 是P 维随机向量,且()D X =∑, ∑的特征值为 120p λλλ≥≥≥≥…,12,,p a a a …,为相应的单位正交特征向量,则X 的第i 主成分为 'i i Z a X = (1,2,).i =…,p

用层次分析法评选优秀学生进行数学建模

用层次分析法评选优秀学生 一.实验目的 运用层次分析法,建立指标评价体系,得到学生的层次结构模型,然后构造判断矩阵,求得各项子指标的权重,最后给出大学生综合评价得分计算公式并进行实证分析,为优秀大学生的评选提出客观公正,科学合理的评价方法。 二.实验内容 4.用层次分析法解决一两个实际问题; (1)学校评选优秀学生或优秀班级,试给出若干准则,构造层次结构模型。可分为相对评价和绝对评价两种情况讨论。 解:层次分析发法基本步骤:建立一套客观公正、科学合理的素质评价体系,对于优秀大学生的评选是至关重要的。在此我们运用层次分析法(AHP),以德、智、体三个方面作为大学生综合评价的一级评价指标,每个指标给出相应的二级子指标以及三级指标,然后构造判断矩阵,得到各个子指标的权重,结合现行的大学生评分准则,算出各项子指标的得分,将这些得分进行加权求和得到大学生综合评价得分,根据分配名额按总分排序即可选出优秀大学生。大学生各项素质的指标体系。如下表所示:

符号说明 设评价指标共有n 个,为1x ,2x ..... n x 。它们对最高层的权系数分别为1w ,2w , ... n w , 于是建立综合评价模型为: = y ∑=n i i i x w 1 解决此类问题关键就是确定权系数,层次分析法给出了确定它们的量化过程,其步骤具体如下: 确定评价指标集 P=(1P ,2P ,3 P ) 1P =(11P ,12P ) 2P =(21P ,22P ) 2P =(31P ,32P )

11P =(1x ,2x ) 12P =(3x ,4x ) 21P =(5x ,6x ,7x ) 22P =(8x ,9x ,10x ) 31P =(11x ,12x ) 31P =(13x ,14x ) 建立两两比较的逆对称判断矩阵 从1x ,2x .....n x 中任取i x 与 j x ,令 =ij a i x /j x ,比较它们对上一层某个因素的重要性时。 若=ij a 1,认为 i x 与 j x 对上一层因素的重要性相同; 若=ij a =3,认为i x 比 j x 对上一层因素的重要性略大; 若=ij a 5,认为i x 比j x 对上一层因素的重要性大; 若=ij a 7,认为i x 比 j x 对上一层因素的重要性大很多; 若=ij a 9,认为 i x 对上一层因素的重要性远远大于 j x ; 若 = ij a 2n ,n=1,2,3,4,元素 i x 与 j x 的重要性介于 = ij a 2n ? 1与 = ij a 2n + 1之间; 用已知所有的 i x /j x ,i ,j =1,2 ... n ,建立n 阶方阵P=n m j i x x ?) /(,矩阵P 的第i 行与 第j 列元素为i x /j x ,而矩阵P 的第j 行与第i 列元素为j x /i x ,它们是互为倒数的,而对 角线元素是1。 判断矩阵 ???? ???????? =11/51/4P 51341/31P P P 321 321P P P 0858.3max =λ 0740.0CI = 0359.6max =λ 0758.0=CI max λ=6.2255 CI =0.0364 max λ=6.0359 CI =0.0758 max λ=15.1382 CI =0.0558 max λ=14.2080 CI =0.0102 max λ=14.3564 CI =0.0175 max λ=15.1972 CI =0.0758 max λ=14.1043 CI =0.0051 max λ=14.2017 CI =0.0099 利用加法迭代计算权重 即取判断矩阵ne 个列向量的归一化的算术平均值近似作为权重向量

数学建模层次分析法题目及程序

假期旅游问题 现有三个目的地可供选择(方案):风光绮丽的杭州(),迷人的北戴河(),山水甲 天下的桂林()。有5个行动方案准则:景色、费用、居住、饮食、旅途情况。 目标层 准则层 方案层 选择旅游地的层次结构 1-9的标度方法 1-9的标度方法是将思维判断数量化的一种好方法。首先,在区分事物的差别时,人们 总是用相同、较强、强、很强、极端强的语言。再进一步细分,可以在相邻的两级中插入折衷的提法,因此对于大多数决策判断来说,1-9级的标度是适用的。其次,心理学的实验表 明,大多数人对不同事物在相同程度属性上差别的分辨能力在5-9级之间,采用1-9的 标度反映多数人的判断能力。再次,当被比较的元素其属性处于不同的数量级时,一般需要将较高数量级的元素进一步分解,这可保证被比较元素在所考虑的属性上有同一个数量级或比较接近,从而适用于1 -9的标度。 选择旅游地 J景费居饮旅 色用住食途 C2 C 3 C4 C5 C1 G 『1 1/2 4 3 3、 C2 2 1 7 5 5 A = C3 1/4 1/7 1 1/2 1/3 C4 1/3 1/5 2 1 1 C5 订/3 1/5 3 1 1」

相对于旅途 R P 2 F 3 P 「1 1 1/4、 B 5 =R 2 1 1 1/4 讥4 4 1」 程序: A=[1 1/2 4 3 3; 2 1 7 5 5; 1/4 1/7 1 1/2 1/3; 1/3 1/5 2 1 1; 1/3 1/5 3 1 1]; [x,y]=eig(A); eige nvalue=diag(y); m=max(eige nvalue); lamda=m n=fin d(m==eige nvalue); y_lamda=x(:,n); s=sum(y_lamda); W2=y_lamda./s B1=[ 1 2 5; 1/2 1 2; 相对于景色 P P 2 R P 1 f 1 2 5 B 1 =P 2 1/2 1 2 P 3 <1/5 1/2 '1 相对于费用 R P 2 P 3 R (1 1/3 1/8 B 2 =F2 3 1 1/3 叭 3 '1 ; B 3 R 『1 3 4 、 B 4 =P 2 1/3 11 F 3 '^1/4 1 '1』

数学建模层次分析法

数学建模层次分析法Document number : WTWYT-WYWY-BTGTT-YTTYU-2018GT

实验报告 实验报告课程名称:数学模型与实验 课题名称:层次分析法 专业:信息与计算科学姓名:班级: 完成日期:2016年6月22日姓名评分

实验报告 一、实验名称 层次分析法 二、实验目的 人们在进行社会的、经济的以及科学管理领域问题的系统分析中,面临的常常是一个由相互关联、相互制约的众多因素构成的复杂而往往缺少定量数据的系统。 在这样的系统中,人们感兴趣的问题之一是:就n个不同事物所共有的某一性质而言,应该怎样对任一事物的所给性质表现出来的程度(排序权重)赋值,使得这些数值能客观地反映不同事物之间在该性质上的差异 层次分析法为这类问题的决策和排序提供了一种新的、简洁而实用的建模方法。它把复杂问题分解成组成因素,并按支配关系形成层次结构,然后用两两比较的方法确定决策方案的相对重要性。 三、实验原理 运用层次分析法解决问题,大体可以分为四个步骤: 1?建立问题的递阶层次结构; (1)将决策问题分为三层,最上面为目标层,最下面为方案

层,中间是准则 层或指标层; (2)通过相互比较确定各准则对于目标的权重,及各方案对于每一准则的权重; (3)将方案层对准则层的权重及准则层对目标层的权重进行综合,最终确定方案层对目标层的权重匚 2.构造成对比较矩阵; 3?层次单排序及一致性检验; 判断矩阵一致性检验的步骤如下: (1)计算一致性指标.: (2)查找平均随机一致性指标.; (3)计算一致性比例.: 当.V时.一般认为判断矩阵的一致性是可以接受的。否则应对判断矩阵作适当的修正。 4?层次总排序及其一致性检验。 当CR<时,认为层次总排序通过一致性检验。到此’根据最下层(决策层)的层次总排序做出最后决策。 —、旅游问题 (1)建模

数学建模之层次分析法

层次分析法 层次分析法就是一种解决多目标的复杂问题的定性与定量相结合的决策分析方法。该方法将定量分析与定性分析结合起来,用决策者的经验判断各衡量目标能否实现的标准之间的相对重要程度,并合理地给出每个决策方案的每个标准的权数,利用权数求出各方案的优劣次序,比较有效地应用于那些难以用定量方法解决的课题。 缺点: (1)层次分析法的主观性太强,模型的搭建,判断矩阵的输入都就是决策者的主观判断,往往会因为决策者的考虑不周、顾此失彼而造成失误。 (2)层次分析法模型的内部结构太过理想化,完全分离、彼此独立的层次结构在实践中很难做到。 (5)层次分析法只能从给定的决策方案中去选择,而不能给出新的、更优的策略。 1、模型的应用 用于解决多目标的复杂问题的定性与定量相结合的决策分析。 (1)公司选拔人员, (2)旅游地点的选取, (3)产品的购买等, (4)船舶投资决策问题(下载文档), (5)煤矿安全研究, (6)城市灾害应急能力, (7)油库安全性评价, (8)交通安全评价等。 2、步骤 ①建立层次结构模型 首先明确决策目标,再将各个因素按不同的属性从上至下搭建出一个有层次的结构模型,模型如下图所示。

准则层 目标层 方案层 目标层:表示解决问题的目的,即层次分析要达到的总目标。通常只有一个总目标。 准则层:表示采取某种措施、政策、方案等实现预定总目标所涉及的中间环节。 方案层:表示将选用的解决问题的各种措施、政策、方案等。通常有几个方案可选。 注意: (1)任一元素属于且仅属于一个层次;任一元素仅受相邻的上层元素的支配,并不就是任一元素与下层元素都有联系; (2)虽然对准则层中每层元素数目没有明确限制,但通常情况下每层元素数最好不要超过 9 个。这就是因为,心理学研究表明,只有一组事物在 9 个以内,普通人对其属性进行判别时才较为清楚。当同一层次元素数多于 9 个时,决策者对两两重要性判断可能会出现逻辑错误的概率加大,此时可以通过增加层数,来减少同一层的元素数。 ②构造判断(成对比较)矩阵 以任意一个上一层的元素为准则,对其支配的下层各因素之间进行两两比较。得到判断矩阵,再求出各元素的权重。ij a 重要程度的衡量用Santy 的1—9标度方法给出。即 设各元素C 1,C 2,… , C n 对目标O 两两比较后的重要性 ,(),ij i j ij n n a C A a ?==0,1ij ji ij a a a >=,则得到比较矩阵

层次分析法数学建模范例

承诺书 我们仔细阅读了中国大学生数学建模竞赛的竞赛规则. 我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。 我们知道,抄袭别人的成果是违反竞赛规则的, 如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。 我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。 我们参赛选择的题号是(从A/B/C/D中选择一项填写): A 我们的参赛报名号为(如果赛区设置报名号的话):A甲0616 所属学校(请填写完整的全名): 参赛队员(打印并签名) :1. 2. 3. 指导教师或指导教师组负责人(打印并签名): 日期: 2011 年 8 月20 日

编号专用页 赛区评阅编号(由赛区组委会评阅前进行编号): 赛区评阅记录(可供赛区评阅时使用): 评 阅 人 评 分 备 注 全国统一编号(由赛区组委会送交全国前编号): 全国评阅编号(由全国组委会评阅前进行编号):

对学生建模论文的综合评价分析 摘要 本文研究的是五篇建模论文的评价和比较问题。首先,研读分析了五篇论文,并写出评语。其次,进行综合量化评价,主要运用的方法是层次分析法和模糊综合评判。最后,依据所得权重大小对论文排序。 针对问题一,我们对论文进行了横向比较和纵向分析。依据数学建模竞赛论文评分基本原则,首先,在研读论文的基础上,对论文分块进行了横向比较,并按照优、良、中、差四个等级作出评价。其次,采取纵向分析的方法,找到论文的优点与不足,写出每篇论文的评语。最后,结合横向比较和纵向分析对论文综合评价。 针对问题二,在建立数学模型时,首先从建模理念的应用意识、数学建模、创新意识出发利用模糊评判的二级评判模型把所给论文的建模摘要、模型与求解、模型评价与推广、其他作为第一级因素集,把问题描述等作为第二级因素集。在用模糊综合评判方法时,确定评估数据(评判矩阵)和权重分配是两项关键性的工作,求权重分配时,我们通过往年评分标准确定数据后用层次分析法计算出二级权重和一级权重;对于评判矩阵,我们通过对五篇论文进行评阅打分(用平均分数作为每项得分),用每一项得分占五篇论文该项得分的比重(商值法),建立评价矩阵。 最终,我们通过matlab编程处理得出的综合量化比较结果是所给5篇论文由好到差依次为论文4,论文2,论文1,论文5,论文3。并在模型结束时付上了对五篇论文的评语。 关键词:层次分析法;模糊综合评判;统计分析:matlab编程;论文评价

主成分分析训练题

主成分分析在数学建模 中的应用 朱宁 2012年11月13日

第一讲 主成分分析在数学建模中的应用 1.学习目的 1.理解主成分分析的基本思想; 2.会用SAS 软件编写相关程序,对相关数据进行主成分分析; 3.会用SAS 软件编程结合主成分分析方法解决实际问题。 2.学习要求 1.理解主成分分析的基本原理,掌握主成分分析的基本步骤; 2.会用SAS 软件编写相关程序,对相关数据进行分析处理和假设检验; 3.撰写不少于3000字的小论文; 4. 精读一篇优秀论文。 3. 理论基础 3. 1基本思想 在实际问题的研究中,往往会涉及众多的变量。但是,变量太多不但会增加 计算的复杂性,而且也给合理地分析问题和解释问题带来困难。一般来说,虽然每个变量提供了一定的信息,但其重要性有所不同,而在很多情况下,变量间有一定的相关性,从而使得这些变量所提供的信息在一定程度上有所重叠。因而人们希望对这些变量加以“改造”,用为数较少的互不相关的新变量来反映原来变量所提供的绝大部分信息,通过对新变量的分析达到解决问题的目的。主成分分析就是在这种降维的思想下产生的处理高维数据的方法。 3.2 基本原理 (1).总体的主成分 定义 1.设'12(,,)X X X =p …,X 为P 维随机向量,称' i i Z a X =为X 的第i 主成分 (i=1,2,…P ),如果: (1) ' 1(1,2,);i i a a i ==…,p (2) 当i>1时,' 0(1,2,);i j a a j ==∑…i-1

(3) ''' 1,0(1,) ()max ()j i a a a a j Var Z Var a X ====∑…i-1 定理 1.设' 12(,,)X X X =p …,X 是P 维随机向量,且()D X =∑,∑的特征值为 120p λλλ≥≥≥≥…,12,,p a a a …,为相应的单位正交特征向量,则X 的第i 主成分为 'i i Z a X = (1,2,).i =…,p 定义 2.我们称1 / p k i i λλ =∑为主成分k Z 的贡献率;又称 1 1 /p m k i k i λλ ==∑∑为主成分 1,,()m Z Z m p <…的累计贡献率。记()ij σ∑=,12(,)p diag λλλΛ=…,其中 12p λλλ≥≥≥…为∑的特征值,12,,p a a a …,是相应的单位正交特征向量,记正交矩阵 12(,,).p A a a a =…,主成分'1(,)p Z Z Z =…,其中'(1,2,).i i Z a i ==…,p 则总体主成分有如 下的性质: 性质1. ()D Z =Λ,即P 个主成分的方差为:()(1,2,)i i Var Z i λ==…,p ,且它们是互不相关的。 性质2. 1 1 p p ii i i i σ λ===∑∑,通常称1 p ii i σ=∑为原总体X 的总方差(或称总惯量)。 性质3.主成分k Z 与原始变量i X 的相关系数(,)k i Z X ρ为 (,)k i ik Z X ρ= (,1,2,)k i =…p 并把主成分k Z 与原始变量i X 的相关系数称为因子负荷量。 性质4. 2 2 11(,)1(1,2,)p p k ik k i k k ii a Z X i λρσ=====∑∑…,p 。 性质5. 2 1 (,)(1,2,).p ii k i k i Z X k σ ρλ===∑…,p 若记2()()i i i i E X Var X μσ==,,即令 *i i i i X X μσ-= = (1,2,)i =…,p 这时标准化后的随机向量***'12(,,)X X X =*p …X 的协方差阵* ∑就是原随机向量X 的相 关阵R 。从相关阵R 出发求主成分,记主成分向量为***'1(,,)p Z Z Z =…,则* Z 有与总体主

数学建模5-层次分析法

数学建模5-(离散模型)层次分析法 层次分析法的基本步骤如下: 层次结构分析模型实例:(选择旅游地) 每次取两个因素C i和C j,用a ij表示C i和C j对上层因素O的影响之比,全部结果可用成对比较矩阵表示:a ij=1(i=j)

由成对比较阵求权向量的特征根法: (原理)一致阵的概念:a ij·a jk=a ik,I,j,k=1,2,……,n 一致阵的性质:1.R(A)=1,A的唯一非零特征根为n;2.A的任一列向量都是对应于特征根n的特征向量。 若A不是一致阵在不一致容许的范围内,用对应于A最大特征根(记作λ)的特征向量(归一化后)作为权向量w,即w满足Aw=λw。 (实现方法)——和法 例子: 一致性检验: 一致性指标:(CI越大A的不一致程度越严重) 随机一致性指标:

一致性比率:当时,认为A的不一致程度在容许范围内。 组合权向量的计算 组合一致性检验: 关于层次分析法的一些问题: 1.不完全层次结构中组合权向量的计算: 例:

如何得到合理结果? 用支配因素的数量对权向量进行加权修正 2.成对比较阵残缺时的处理: 设Θ表示残缺; 3.本节讨论的内容主要是逐阶层次结构(层次内部因素无相互影响或支配,层 次自上而下,逐层传递的支配关系) 对于更复杂的层次结构,可能存在层次内部因素之间的相互影响,下层反过来对上层有支配作用,层次之间存在反馈作用等。 附:层次分析法的简单MATLAB实现 clc; clear; A=[1 1.2 1.5 1.5; 0.833 1 1.2 1.2; 0.667 0.833 1 1.2; 0.667 0.833 0.833 1]; %因素对比矩阵A,只需要改变矩阵A [m,n]=size(A); %获取指标个数 RI=[0 0 0.58 0.90 1.12 1.24 1.32 1.41 1.45 1.49 1.51]; R=rank(A); %求判断矩阵的秩 [V,D]=eig(A); %求判断矩阵的特征值和特征向量,V特征值,D特征向量; tz=max(D); B=max(tz); %最大特征值 [row, col]=find(D==B); %最大特征值所在位置 C=V(:,col); %对应特征向量 CI=(B-n)/(n-1); %计算一致性检验指标CI CR=CI/RI(1,n); if CR<0.10 disp('CI=');disp(CI); disp('CR=');disp(CR); disp('对比矩阵A通过一致性检验,各向量权重向量Q为:'); Q=zeros(n,1); for i=1:n Q(i,1)=C(i,1)/sum(C(:,1)); %特征向量标准化 end end Q

相关文档
最新文档