计量地理学名词解释和简答题(杨令宾版)

一、名词解释:

计量地理学:是将数学和电子计算机技术应用于地理学的一门综合性学科,是研究地理环境及其与人类活动之间相互关系的综合性交叉学科

系统:是由若干相互联系并与其环境发生关系的组合部门综合而成的、具有特定结构和功能的有机整体。(贝塔朗菲)

要素:是构成系统的基本单元,是对系统组合成分或个体的抽象概括。一个系统的要素至少有两个以上。

相互关系:系统各要素之间以及系统与环境之间通过某种方式相互影响,相互制约,相互依存的性质。其实就是系统各要素之间以及系统与环境之间发生着广泛的能流、物流、信息流的交换。

空间数据:主要用来描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范围以及空间联系的数据。

属性数据:主要用来描述地理实体、地理要素、地理事件、地理过程的有关属性特征的数据。包括数量标志数据和品质标志数据

地理数据的变换:是将原始数据的每一个数据通过某种特定的运算把它们变成一个新值,而且数值的变化不依赖于数据集合中其他数据的值。目的:去伪存真、易识规律、减小变幅、便于建模

分布式数据库:是数据库和网络技术相结合的产物,分布式数据库是物理上分散在计算机网络节点上,而逻辑上属于同一个系统的数据集合。

方差分析:把平方和与自由度进行分解,并用F检验法对整个回归方程进行显著性检验的方法,叫方差分析。

地理相关:就是应用相关分析法来研究各地理要素间的相关关系和联系强度的一种度量指标。

秩相关系数:是将两要素的样本值按照数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。表示两个要素顺序间直线相关程度和方向的系数,称为秩相关系数,不但适用于量的资料的相关分析,同时亦适用于质的资料。

偏相关系数:在多要素所构成的地理系统中,当研究某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视为常数,即暂不考虑其他要素的影响,而单独研究两个要素之间的相关关系的密切程度时,则称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。

几何平均数:n个观测数的连乘积再开n次方所得的方根数。常用来分析平均发展速度和平均增长速度(等于平均发展速度-1)。偏相关系数可用单相关系数来计算

Logistic型:有些社会经济现象的发展速度初期缓慢,然后逐渐加快,发展到一定程度后又逐渐慢下来,逐渐接近一个最高限,即趋近于一条渐近线。它的散点图象一条压扁了的S 型曲线,故也称为S型曲线。Logistic曲线常用于那些在开始时期增长速度较慢,成长时期增长速度逐渐加快,最后达到成熟和饱和期,其增长量虽然还有,但增长率逐渐降低,终至平缓的地理现象。y=1/(k+ab)

趋势面:是一种光滑的数学曲面,它能集中地代表地理数据在大范围内的空间变化趋势。趋势面与实际上的地理曲面不同,它只是实际曲面的一种近似值。因此实际曲面应包括趋势面和剩余曲面两部分。

趋势面分析:用数学的方法,以数学模型来模拟地理数据的空间分布及其区域性变化趋势的方法,称为趋势面分析

时间序列:也叫时间数列或动态数列,它是表现地理要素特征的数据按照时间顺序变动排列而形成的一种数列,它反映了地理要素随着时间变化的发展过程。

长期趋势:是指由于某种根本性原因的影响,在一段较长的时间内,是地理要素特征值的时间数列呈现逐渐增长或逐渐减小的变化。

灰色动态模型:是以灰色模块概念为基础,以微分方程拟合为核心的五步建模方法。灰色系统建模思想是直接将时间序列转化为微分方程,从而建立的是系统发展变化的动态模型,简记为GM。

季节变动因素:是指由于自然、经济、社会等条件或因素的影响,地理信息要素在一年内随季节的变动而产生的周期变化。

循环周期变动:是指地理要素特征值以若干年为周期,波浪起伏形态的变动。

柯本—道格拉斯生产函数:即在技术经济条件不变的条件下,产出Q与投入的劳动力L以及资本A的关系可表示为Q=KAα Lβ

马尔科夫链预测:对某一事物变化过程而言,如果该事物由一种状态转移到另一种状态具有转移概率,且这种转移概率可以根据其紧接的前项状态推算出来,就称该过程为马尔科夫过程。其特点是:当过程在t0时刻所处的状态为已知状态的情况下,其t时刻所处的状态与过程在t0时刻前的状态无关。这种性质称为马尔科夫链的后无效性。由一系列的这种转换过程构成的整体称为马尔科夫链。

聚类分析:是根据地理变量的属性或特征的相似性、亲疏程度,用数学的方法把它们逐步地分型划类,最后得到一个能反映个体与站点之间、群体之间亲疏关系的分类系统(谱系图)。谱系图:通过聚类分析,关系密切的站点便聚合到一小类,而关系疏远的站点则聚合到一大类,直到把所有的站点都聚合完毕,最后便可根据各类间的亲疏关系,逐步画成一张完整的分类系统图。

费歇准则:即要求类间均值差与类内方差之比最大,这样就能把地理类型区分得最清楚。贝叶斯准则:要求把已知的地理数据分成几类,然后计算出未知地理类型或区域归属于各已知类型的概率值,它归属于哪一类的概率值最大,就把它划归该类;另外,还可计算出划归各已知类的错分损失,即错分哪一类的平均损失为最小,就把它定为该类。

区域性:是指不同的地区区域系统在状态、水平、结构、效益、优势、潜力、功能和发展速度等方面存在的显著性差异。

区域系统结构:是指区域系统内部各子区域、各部门、各要素、各方面及其相互之间的关系和有机联系。一般可以从两方面研究区域系统结构:一是区域系统各种比例关系,这是区域系统结构最直接的反映。二是区域系统内部各方面的相互联系与相互作用的方式。

基尼系数就是洛伦兹曲线和对角线所夹的面积B和横坐标所夹的面积A之比。

ISM法,也叫也是结构模型法,它首先是把一个复杂的地理系统分解成不同层次的子系统;并找出各子系统之间或要素之间的因果关系、作用方向以及大小;然后进一步揭示出一个条理分明的递阶层次结构。这一过程也就是按一定的矩阵运算法则,求解系统结构模型。

投入产出分析,又称“部门平衡”分析,或称产业联系分析,最早是由美国经济学家瓦•列昂捷夫提出来的。它主要通过编制投入产出表以及建立相应的数学模型,反映经济系统各个部门之间的相互关系。

最终产品系数:表示向社会提供单位最终产品所需消耗的其他或本部门的产品的数量。

主成分载荷:是主成分与原始变量间的相关关系。

单纯形法:是根据规划问题的具体数据,找出初始可行解;判别、检查所有的检查系数是否满足最优性,如果满足,则已完成求解,否则,进行迭代,重复此过程,直至所有的检查系数都满足最优性为止。

战略决策模型:即层次分析法AHP。根据对一定客观现实的判断就每一层次的相对重要性给予定量表示,确定每一层次中的元素相对重要次序的权值,通过排序结果,分析和解决问题,从而为战略决策服务。

例:北京市近地表气温与5cm平均气温的关系

1、存在极其紧密的能流、物流、信息流的关系。因为r≥0.9995≥r0.001

2、该关系可以用y ̂=0.8378+1.0493x表示

3、当气温为0时,北京市5cm地温为恒定的,当土温为0时,北京市气温为,有农业生产上面的意义。

4、根据方程可以预测该地区任何土温或者气温数值的变化。

5、预测是一个区间,而不是一个值。y ̂+s=68%

6、该研究具有区域对比的意义。

二、简答

老新三论:系统论、控制论、信息论;突变论、耗散结构、协同学

计量地理学的研究对象:①空间与过程的研究,这是关于地域分布与地域过程的研究;②生态与环境研究,这主要是指人地关系的研究;③区域研究,地理区域的相似性和差异性研究。地理数据基本特征:数量化、形式化与逻辑化;不确定性;多种空间尺度;多维性

地理系统分析:是指扬弃地理事物繁琐的枝节,抓住实质抽象出地理事物在结构与功能上的主线,并能揭示地理事物动态演变的方法和强度,预测其状态变化和稳定性程度等,从而面对复杂的、高级的地理系统简化为次一级的简单的系统,进而探讨地理要素之间的数量关系。统计分组的步骤:1求变数的全距,即极差2确定组数3计算组距4确定组限5计算组中值数据库具有以下特点:1面向全组织的复杂的数据结构。2数据的冗余度少,易扩充。3具有较高的数据和程序独立性。4统一的数据控制功能(安全、完整性、并发控制),功能共享程度高。

偏相关系数的性质:偏相关系数分布在[-1,1]之间。当r12•3为正值时表示在x3固定时,则x1与x2之间为正相关;当r12•3为负值时,表示在x3固定时,则x1与x2之间为负相关;偏相关系数的绝对值越大,表示其偏相关程度越大。偏相关系数的绝对值必小于或最多等于同一系列资料所求的负相关系数,即R12•3≥∣r12•3∣。

地理数据库的建立步骤:1用户需求调查2系统分析。对用户需求,数据源状况和硬软件资源进行可行性分析,为购置有关硬件软件和系统设计服务。本阶段应提出地理数据库的基本结构和功能。3系统设计包括计算机硬件设备的选配、软件设计、地理数据库和数据文件设计。4系统调试与运行地理数据库设计完成后,即可在调试后投入使用。

回归分析的地理意义:1概括地理系统要素的自变量和因变量2在数学模型中可以揭示出地理自变量对因变量的影响,以及地理因变量对自变量的反作用。3通过回归分析可以预测、控制、回带、补差等来求算另一个变量的变化。

回归分析和相关分析的关系:都是研究和处理变量之间相互关系的一种数理统计方法,他们之间既有联系,又有联系。相关说明的是相关关系,回归说明的是依存关系。相关分析主要是研究要素之间联系的紧密程度,并没有严格的自变量与因变量之分(复相关除外),而回归分析则主要是研究要素之间联系的数学表达形式,因而有自变量与因变量之分,而且回归分析有地理预测的性质。

回归分析的主要内容:从一组地理数据出发,确定这些要素间的定量数学表达式,即回归模型;根据一个或几个要素的值来预测或控制另一个要素的取值;从而影响某一地理过程中的许多要素中,找出哪些要素是主要的,哪些要素是次要的,以及要素间的关系。

相关系数的检验:左边的f称为自由度,其数值为f=n-k-1,这里n为样本数;上方的α代表不同的置信水平;表内的数字代表不同的置信水平下相关系数ρ=0的临界值,即rα。对于偏相关系数,一般采用t检验法。对于复相关系数,一般采用F检验法

时间序列的基本特点:相邻观测值的依赖性;观测值的趋势性、随机性、季节性和周期性;观测值的增长和下降性;观测值的可分解性;观测值的可预测性。

五步建模法:1.语言描述(语言模型)2.计算累加(或累减)生成数据序列——弱化随机性,增大平稳性3.运用矩阵运算构建微分方程,算出a、u(,并算出此方程对应的响应方程(显方程)时间响应函数:(x(1)(t+1)=[x(0)(1)-u/a]e-at+u/a )4.方程检验,P、C检验5.意义分析。建立GM模型注意问题:

1根据预测的需要选择数列的长度。最少5个数据

2为提高预测的精度,要不断补充新信息,使灰度逐步白化。将预测值再补充到数据序列之后,再去掉该数据序列的第一个数据,这样新陈代谢,逐个预测,依次递补,直到完成预测目的——灰度等维递补预测

3对原始数据进行平滑平均处理。

4若模型经检验不符合精度要求时,可通过对残差进行分析,建立残差模型以补充或修正原模型。

季节变动预测法的基本步骤:

第一步,将原时间序列求移动平均,目的是消除季节变动和不规则变动,保留长期趋势。第二步,将原序列y除以对应的趋势方程值,目的是分离出季节变动,即季节系数=TSCI/趋势方程值=SI

第三步,将月度的季节指标加总,已由计算误差导致的值去除理论加总值,得到一个校正系数,并以该校正系数乘以季节性指标从而获得调整后季节性指标。

第四步,进行预测。如果欲求下一年度的预测值,可简单地延长趋势线即可求出未来各月的预测值。

测定周期变动的步骤:

第一步,计算长期趋势值。即用移动平均法、平滑平均法或长期趋势模型得到时间数列的长期趋势值。

第二步,计算CI值。如果是以年度为单位的时间数列,只要用实际观测值除以长期趋势值即可;如果是以月度或季度为单位的时间数列,需要在得到长期趋势值以后,再计算季节指数,然后用实际观察值除以长期趋势值和季节指数得到CI值;

第三步,用移动平均法从CI值中剔除不规则变动因素,最后得到循环变动比率C。

马尔科夫链预测的基本方法和过程是:

1)划分预测对象(地理系统或子系统或变量)所处状态。

2)计算初始概率

3)计算状态的一重转移概率P ij

4)根据一重转移概率进行预测

5)用二重转移概率进行预测

系统聚类法的基本做法:先将n个地点看成各自成一类,并定义样品间、类与类间的距离,进而选择距离最小的一对合成一新类,以后计算新类与其他类间的距离,再将距离最近的两类合并,这样每合并一次都缩小一类,直至所有样品都成为一类为止。

判别分析和聚类分析对比:

相同处:都能确定地理类型;

不同处:判别分析兼有判别和分类的两种性质,但以判别为主,判别分析必须事先已知类型为前提,而聚类分析则不必事先已知类型,类型的划分是聚类的结果。

判别分析的作用:1、对已分好的类型进行合理性检验;2、判别某地地理类型的归属问题和确定区域界线;3、评价各要素特征值在判别分析中贡献率的大小。

ISM法的基本步骤:1选择构成系统的要素2建立邻接矩阵A和可达矩阵M3层次级别的划分4建立结构模型

主成分分析的步骤:1、原始数据的标准化处理2、计算相关系数矩阵3计算特征值和特征向量计算贡献率和累积贡献率,一般取累积贡献率达85~90%的特征值对应的主成分即可。5计算主成分载荷6计算主成分得分,得到主成分得分矩阵。

AHP决策分析法特点:思路简单明了,它将决策者的思维过程条理化、数量化,便于计算,容易被人们所接受;所需的定量化数据较少,但对问题的本质,问题所涉及的因素及其内在关系分析得比较透彻、清楚。缺点是具有较大的随意性,本身对要解决的问题的认识的局限性。

AHP决策分析方法的基本步骤:

明确问题;建立层次结构模型(目标层、准则层、措施层);构造判断矩阵;层次单排列;层次总排序;一致性检验

北京市近地表气温与5cm平均气温的关系

1.存在极其紧密的能流、物流、信息流的关系。因为r≥0.9995≥r0.001

2.该关系可以用表示

3.当气温为0时,北京市5cm地温为恒定的,当土温为0时,北京市气温为,有农业生产

上面的意义。

4.根据方程可以预测该地区任何土温或者气温数值的变化。

5.预测是一个区间,而不是一个值。

6.该研究具有区域对比的意义。

计量地理学名词解释和简答题(杨令宾版)

一、名词解释: 计量地理学:是将数学和电子计算机技术应用于地理学的一门综合性学科,是研究地理环境及其与人类活动之间相互关系的综合性交叉学科 系统:是由若干相互联系并与其环境发生关系的组合部门综合而成的、具有特定结构和功能的有机整体。(贝塔朗菲) 要素:是构成系统的基本单元,是对系统组合成分或个体的抽象概括。一个系统的要素至少有两个以上。 相互关系:系统各要素之间以及系统与环境之间通过某种方式相互影响,相互制约,相互依存的性质。其实就是系统各要素之间以及系统与环境之间发生着广泛的能流、物流、信息流的交换。 空间数据:主要用来描述地理实体、地理要素、地理现象、地理事件及地理过程产生、存在和发展的地理位置、区域范围以及空间联系的数据。 属性数据:主要用来描述地理实体、地理要素、地理事件、地理过程的有关属性特征的数据。包括数量标志数据和品质标志数据 地理数据的变换:是将原始数据的每一个数据通过某种特定的运算把它们变成一个新值,而且数值的变化不依赖于数据集合中其他数据的值。目的:去伪存真、易识规律、减小变幅、便于建模 分布式数据库:是数据库和网络技术相结合的产物,分布式数据库是物理上分散在计算机网络节点上,而逻辑上属于同一个系统的数据集合。 方差分析:把平方和与自由度进行分解,并用F检验法对整个回归方程进行显著性检验的方法,叫方差分析。 地理相关:就是应用相关分析法来研究各地理要素间的相关关系和联系强度的一种度量指标。 秩相关系数:是将两要素的样本值按照数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。表示两个要素顺序间直线相关程度和方向的系数,称为秩相关系数,不但适用于量的资料的相关分析,同时亦适用于质的资料。 偏相关系数:在多要素所构成的地理系统中,当研究某一个要素对另一个要素的影响或相关程度时,把其他要素的影响视为常数,即暂不考虑其他要素的影响,而单独研究两个要素之间的相关关系的密切程度时,则称为偏相关。用以度量偏相关程度的统计量,称为偏相关系数。 几何平均数:n个观测数的连乘积再开n次方所得的方根数。常用来分析平均发展速度和平均增长速度(等于平均发展速度-1)。偏相关系数可用单相关系数来计算 Logistic型:有些社会经济现象的发展速度初期缓慢,然后逐渐加快,发展到一定程度后又逐渐慢下来,逐渐接近一个最高限,即趋近于一条渐近线。它的散点图象一条压扁了的S 型曲线,故也称为S型曲线。Logistic曲线常用于那些在开始时期增长速度较慢,成长时期增长速度逐渐加快,最后达到成熟和饱和期,其增长量虽然还有,但增长率逐渐降低,终至平缓的地理现象。y=1/(k+ab) 趋势面:是一种光滑的数学曲面,它能集中地代表地理数据在大范围内的空间变化趋势。趋势面与实际上的地理曲面不同,它只是实际曲面的一种近似值。因此实际曲面应包括趋势面和剩余曲面两部分。 趋势面分析:用数学的方法,以数学模型来模拟地理数据的空间分布及其区域性变化趋势的方法,称为趋势面分析 时间序列:也叫时间数列或动态数列,它是表现地理要素特征的数据按照时间顺序变动排列而形成的一种数列,它反映了地理要素随着时间变化的发展过程。 长期趋势:是指由于某种根本性原因的影响,在一段较长的时间内,是地理要素特征值的时间数列呈现逐渐增长或逐渐减小的变化。 灰色动态模型:是以灰色模块概念为基础,以微分方程拟合为核心的五步建模方法。灰色系统建模思想是直接将时间序列转化为微分方程,从而建立的是系统发展变化的动态模型,简记为GM。 季节变动因素:是指由于自然、经济、社会等条件或因素的影响,地理信息要素在一年内随季节的变动而产生的周期变化。

论计量方法在当代地理学研究中的必需与必然

论计量方法在当代地理学研究中的必须与必然 本文的写作主要包含四大板块:概述、现代地理学中的计量方法、计量方法在当代地理学研究中的必然与必须、总述。第一部分主要阐述了计量地理学在我国产生和发展的4个阶段。第二部分现代地理学中的计量方法这部分主要是讲述计量方法在地理学研究中引入,并简要介绍了几种常用计量方法的作用。第三部分主要从计量方法在当代地理学研究中的必须性和必然性两个方面来阐述计量方法在当代地理学研究中的重要性。第四部分总述部分简单的说明了再当代地理学研究中计量方法的重要性。 1概述 计量方法的引入是伴随中计量地理的产生和发展的。地理学中计量地理革命开始于美国【张祖林.地理学中的计量革命与实证主义方法论.自然辩证法研究.1991年第7卷第12期】。计量地理学是将数学和电子计算机技术应用与地理学的一门新兴学科,它是随着生产发展的需要和科学技术的进步而产生和发展起来的。计量地理的发展在国内主要可以分为四

个阶段:20 世纪30 年代,概率论和数理统计方法开始应用于地理研究,这是计量地理学的萌芽。 50年代末60 年代初, 英美一些地理学家提出了地理学/ 计量革命,形成了初级阶段的计量地理学, 即运用一般统计方法, 对地理要素进行统计分析。60年代后期, 随着计算机的发展, 计量地理学也得到发展。70 年代后期, 计量地理学开始具有较浓厚的理论色彩, 逐步走向成熟【于小秦. 我国计量地理学研究进展述要及其评价. 甘肃联合大学学报( 自然科学版)。2007 年1 月第21 卷第1 期】。本文着重论述的计量方法是计量地理学的重要组成部分。本文在简要介绍计量方法外,主要是阐述计量方法在当代地理学研究中的必须与必然。 2 现代地理学中的计量方法 一门学科要想从经验科学发展成为理论科学, 首先必须成为一门实证科学, 而数量化方法乃是实证化的前提。经过近几十年的发展,大量的计量方法被引进到地理学的研究中。运用在当代地理学研究中的计量方法也在不断的完善、不断的成熟。它们已经涉及数学及其相关学科的各个领域。它们不但继承了计量运动的成果,而且还吸收了近几十年来数学、系统论、系统分析方法、计算机科学、现代计算理论及计算方法等领域中的相关成功,其内容已经十分丰富了【徐建华.计量地理.高等教育出版社.1-18页】。 据不完全统计,目前在地理学研究中较常使用的计量方法有大约四十种,如概率论、相关分析、主成分分析、遗传算法等。在当代地理学的研究中计量方法的应用十分广泛,内容也较为复杂。这些计量方法的使用是地理学定量研究的前提。 3 计量方法在当代地理学研究中的必然与必须 3.1 计量方法在当代地理学研究中的必须性。 在20世纪50年代以描述性为主的传统地理学开始受到质疑。一些学者认为,传统描述性的研究方法对于地理现象的描述是冗长、乏味、没有生气。传统地理学对于区域的划分,都是很不成熟、不科学的。这些问题从一定程度上表明传统的描述性的研究方法在一定程度上束缚了地理学的进一步发展了。为了建立地理学法则,探索地理现象发生的本质,地理学研究过程中对数学、物理学、社会学等学科的理论和研究方法引入已经成为了不可逆转的趋势【徐建华.计量地理.高等教育出版社.2、3页】。 1950 年代末首先在美国, 之后在英国、瑞士以至全世界掀起了建立地理学法则的运动热潮, 其目的是构筑地理学的理论, 运动的核心是逻辑实证主义指导下的地理学方法论的革命运动, 这就是所谓的计量革命。1964 年第20 届国际地理学大会上成立了地理学定量方法委员会( CQMG) , 这标志着运动的高峰。1950 年代末开始的计量革命从根本上改变了传统

计量地理学复习资料(整合版)

计量地理学复习资料 一、填空题 1、近代地理学的发展,曾形成了三种主要学派,即区域学派、人地关系学派、景观学派。 2、计量运动,主要是美国地理学家发起的。 3、计量运动的三大学派(依阿华的经济派)、(威斯康星的统计派)、(普林斯顿的社会物理学派)。 4、计量地理学的应用:相互关系分析、趋势面分析、空间相互分析、分布型分析、网络分析(总共12点,只要写几点,其余自己看书) 5、标准正态分布的偏度系数、峰度系数与0的关系。 偏度系数:g1<0表示负偏,即均值在峰值左边;g1>0即正偏,均值在峰值右边,g1=0,对称分布。 峰度系数:g2=0表示标准正态分布,g2>0高于正态分布,g2<0低于正态分布。 6、锡尔系数越大,就表示收入分配差异越大;反之,锡尔系数越小,就表示收入分配越均衡。 7、趋势拟合方法: ㈠平滑法 ⒈移动平均法(公式,可能考计算,74页)⒉滑动平均法(同上) ⒊指数平滑法(填空,75页的最后一段)

8、地理数据的统计处理内容包括哪两个方面: 进行统计整理;计算有关统计指标和参数。 9、地理数据的基本特征:一、数量化、形式化与逻辑化 二、不确定性 三、多种时空尺度 四、多维性 10、地理数据采集的渠道来源书上25页 11、填写下图的偏态类型 (1)(正态分布); (2)(正偏态); (3)(负偏态) 12、判断下列图中平均数、中位数、众数的大小。 (1)( );(2)( > >); (3)( << ) 13、空间分布的类型:点状分布类型、线状分布类型、面状分布类型(离散区域分布类型、连续区域分布类型)。 14、根据测度标准,可以将数量标志数据划分为_间隔尺度数据_和 比例尺度数据。 x x x

spss影响城市人均GDP差异因素的分析

*********** 影响城市人均GDP差异因素的分析 分院城市与环境科学学院 专业地理信息系统 姓名******** 学号**********

影响城市人均GDP差异因素的分析 *** (******** 城市与环境科学学院, 中国长春130000;) 摘要:首先选取2001年全国30个省、市、自治区的11个指标(出生率、人口自然增产率、期望寿命、平均受教育年龄、识字率、人均GDP、城乡居民储蓄年底余额、人均社会消费额、成年劳动力比重、城市人口比重、第三产业人口比重),应用SPSS统计软件对此进行了主成分分析;然后结合主成分分析结果,利用聚类分析方法得到了全国综合人均GDP发展水平的区域谱系图;最后在此基础上,探讨了全国省际综合发展水平的区域相似性和差异性。研究结果表明:利用主成分分析和系统聚类方法分析中国省际综合交通发展水平,不仅可以克服传统的基于人工选用指标进行综合分析所存在的数据不易处理的缺陷,而且结果准确性高,是对中国城市人均GDP差异影响因素的分析的一种新的尝试。 关键词:人均GDP; 主成分分析; 系统聚类; 中国城市 1.引言 西方国家对城市经济发展状况进行的实证研究已经有很多了。一类是延续了增长经济学的方法对城市进行经济增长因素分析。除去传统的资本、劳动力和技术进步因素外,近年来则更强调与政府和地理环境有关的众多影响因素。另一类由城市最佳规模的研究产生出来,突出了集聚经济对城市经济发展的影响,认为城市规模越大,经济效益越高。人均GDP是一国经济的最大基本面,它是研究产业结构和产业演变趋势的主要解释变量,也是反映疑惑经济发展情况的重要指标,因而无论对经济政策的制定,还是投资分析均具有重要意义。 人均GDP则是一国经济的最大基本面,它是研究产业结构和产业演变趋势的主要解释变量,因而无论对经济政策的制定,还是投资分析均具有重要意义。 但是,究竟哪些因素会影响人均GDP的变化呢?为了今后能更好地了解、利用本研究选取了2001年中国30个省、市、自治区的11个指标交通,应用SPSS统计软件对此进行了主成分分析;然后结合主成分分析结果,利用聚类分析方法得到了影响人均GDP水平谱系图;最后结合各地区自身的地理状况和经济发展水平,探讨了影响人均GDP水平的区域相似性和差异性。2.全国交通运输业发展的“降维”分析 2.1 指标选取 影响人均GDP包括城乡居民储蓄年底余额、第三产业人口比重、城市人口比重、人均社会消费额、平均受教育年限等影响因子。,城市统计年鉴从1998年以后改为公布地级及地级以上城市的数据为主。所以,本文以2001年的全国30个省、市、自治区在1990年代出现了一些把县级市改为地级及以上市市辖区的情况,为了保持历年数据的一致性,将这些县级市与相应的地级及以上市合并计算。为了检验我国城市在不同规模级和不同地域上是否有差别,又将这30个城市按地区分成东部地区城市、中部地区城市、西部地区城市和按规模分成大城市、中等城市、小城市,并对这些评价指标作主成分(降维)分析。 X1——出生率(以﹪为单位)。人口出生率反映人口出生的强度,它是一年出生人口数与该年平均人口数之比。 X2——人口自然增长率(以%为单位)。人口自然增长率,是反映人口发展速度和制定人口计划的重要指

相关文档
最新文档