计量地理学复习资料(整合版)1111
计量地理学复习资料
一、填空题
1、近代地理学的发展,曾形成了三种主要学派,即区域学派、人地关系学派、景观学派。
2、计量运动,主要是美国地理学家发起的。
3、计量运动的三大学派(依阿华的经济派)、(威斯康星的统计派)、(普林斯顿的社会物理学派)。
4、计量地理学的应用:相互关系分析、趋势面分析、空间相互分析、分布型分析、网络分析(总共12点,只要写几点,其余自己看书)
5、标准正态分布的偏度系数、峰度系数与0的关系。
偏度系数:g1<0表示负偏,即均值在峰值左边;g1>0即正偏,均值在峰值右边,g1=0,对称分布。
峰度系数:g2=0表示标准正态分布,g2>0高于正态分布,g2<0低于正态分布。
6、锡尔系数越大,就表示收入分配差异越大;反之,锡尔系数越小,就表示收入分配越均衡。
7、趋势拟合方法:
㈠平滑法
⒈移动平均法(公式,可能考计算,74页)⒉滑动平均法(同上)
⒊指数平滑法(填空,75页的最后一段)
8、地理数据的统计处理内容包括哪两个方面:
进行统计整理;计算有关统计指标和参数。
9、地理数据的基本特征:一、数量化、形式化与逻辑化二、不确定性
三、多种时空尺度四、多维性
10、地理数据采集的渠道来源----书上25页
11、填写下图的偏态类型
(1)(正态分布);(2)(正偏态);(3)(负偏态)
12、判断下列图中平均数、中位数、众数的大小。
(1)( =Me =Mo );(2)( > Me>Mo ); (3)( 14、根据测度标准,可以将数量标志数据划分为_间隔尺度数据_和 比例尺度数据。 15、地理现象的分布格局,常常用地理数据分布的 集中化程度 和 均衡度 来描述。 16、地统计学:以区域化变量理论为基础,以变异函数为主要工具,研究那些在空间分布上既有随机性又有结构性或空间相关和依赖性的自然现象的科学。地统计学的两个最基本函数:协方差函数和变异函数。主要方法之一:克立格法 17、克里格插值的关键是计算权重系数λi ,而权重系数的求取需要满足的2个条件是:无偏性、最优性。P142。 18、在事件的发展过程中,若每次状态的转移都只仅与前一时刻的装态 有关,而与过去的发展的状态 无后效性 。这样的状态转移过程就叫马尔可夫过程。 19、常用的统计指标与参数:P29 (1)描述地理数据一般水平的指标:平均值、中位数、众数; (2)描述地理数据分布的离散程度的指标:极差、离差、离差平方和、方差、标准差、标准差无偏估计、变异系数; (3)描述地理数据分布特征的参数:偏度系数、峰度系数。 20、时间序列的组合成份 (P72) 长期趋势(T )、季节变动(S )、循环变动(C )不规则变动(I ) 21、在聚类分析中,常用的聚类要素的数据处理方法(P83)有如下几种: 总和标准化 标准差标准化 极大值标准化 极差的标准化---(及它们的特征) 22、回归分析方法,就是研究要素之间_ 具体数量关系__的一种强有力的工具,运用这种方法能够建立反映地理要素之间具体数量关系的数学模型,即__回归模型__。 23、趋势面分析是利用数学曲面模拟地理系统要素在(空间上的分布)及变化趋势的一种数学方法。 24、变异函数四个非常重要的函数:基台值、变程(空间依赖范围)、块金值(区域不连续x x x 性值)、分维数。 25、全局空间自相关的两个指标: moran指数【-1~1】小于0 负相关,大于0正相关,等于0不相关; Geary系数【 0~2】小于1正相关,大于1负相关,等于1不相关 局部空间自相关的分析方法:LISA, G统计量,moran散点图。 26、AHP决策法的弱点随意性,基本步骤8、AHP决策的步骤:(明确问题)、(建立层次结构模型)、(构造判断矩阵)、(层次单排序)、(层次总排序)、(层次总排序一致性检验);计算方法:方根法和和积法。计算任务:求解判读矩阵的最大特征根及其所对应的特征向量。 27、地理数据的类型:(空间数据和属性数据)、(本身性质——定性和定量)、(数据来源— —社会、经济、自然资源) 28、时间系列4种成分:(长期趋势)、(季节变动)、(循环变动)、(不规则变动)。 29、全局指标:(Moran指数)、(Geary系数)。LISA包括:(局部Moran指数)和(局部Geary系数)。 30、投入产出模型:可分为(实物型)和(价值型) 31、地理要素空间分布四种类型:(点状分布类型)、(线状分布类型)、(离散区域分布类型)、(连续的区域分布) 32、最临近距离的测度,通常有(顺序法)和(区域法) 33、点状分布的测度:(最邻近距离的测度)、(中心位置及其测度)、(离散程度的测度) 离散程度的测度:(对于平均中心的离散程度)、(对于任何指定位置的离散程度)、(各点之间离散程度的测定) 二、名词解释 1、计量地理学——又称数量地理学或统计地理学或理论地理学,是用数学方法和计算机术研究地理现象及地理要素的科学,是应用地理学的分支,是数学与地理学相交叉的学科。(是将数学和电子计算机技术应用于地理学的一门新兴学科,计量地理学的出现反映了地理学朝着定量化的发展趋势。--09级的) 2、地理数据是用一定的测度方式描述和衡量地理对象的有关量化标志,是对地理问题进行定量化描述和研究的基础,是一切数学方法在地理学中应用的先决条件。 3、空间数据主要用于描述地理实体、地理要素、地理现象、地理事件及地理过程的产生、存在和发展的地理位置、区域范围及空间联系。 4、属性数据主要用于描述地理实体、地理要素、地理现象、地理事件、地理过程的有关属 性特征,包括数量标志数据与品质标志数据两种。 5、中位数:将各个数据从小到大排列,居于中间位置的那个数就是中位数。它也从一个侧 面反映了地理数据的一般水平。 6、众数:出现频率最多的那个数。它也从一个侧面反映了地理数据的一般水平。 7、离差:指每一个地理数据与平均值的差,它代表着有一个地理数据与平均值的离散程度 8、极差:指所有数据中最大值和最小值之差。 9、秩相关系数又称等级相关系数,或顺序相关系数,是将两要素的样本值按数据的大小顺序排列位次,以各要素样本值的位次代替实际数据而求得的一种统计量。 )1(61212--='∑=n n d r n i i xy 10、偏度系数(P33) 测度地理数据分布的不对称性情况,刻画以平均值为中心的偏向情况。 11、峰度系数:它测度了地理数据在均值附近的几种程度。 12、回归分析方法,就是研究要素之间具体数量关系的一种强有力的工具,运用这种方法能够建立反映地理要素之间具体数量关系的数学模型,即回归模型。 13、集中化指数:是一个描述地理数据分布的集中化程度的指数) 14、聚类分析,亦称群分析或点群分析,它是研究多要素事物分类问题的数量方法。其基本原理是,根据样本自身的属性,用数学方法按照某种相似性或差异性指标,定量地确定样本之间的亲疏关系,并按这种亲疏关系程度对样本进行聚类。 15、洛伦兹曲线:使用累计频率曲线研究工业化集中化程度的曲线被称之为罗伦次曲线。 16、可行解P156:满足约束条件(即满足线性约束和非负约束)的一组变量为可行解。 17、可行域:所有可行解组成的集合称为可行域。 18、最优解:使目标函数最大或最小化的可行解称为最优解。 19、基本可行解:满足非负约束条件的基本解,称为基本可行解。 20、可行基:对应于基本可行解的基,称为可行基。 21、马尔科夫过程: 在事件的发展过程中,若每次状态的转移都只仅与前一时刻的状态有关,而 与过去的状态无关,或者说状态的转移过程是无后效性的,则这样的状态转移过程就叫马尔科夫过程。 22、回路:起始顶点和最后顶点重合的路。 23、连通性:如无向图内任意两个顶点之间存在着一条连接它们的路,则这个无向图是连通的。 24、强连通性:在一个有向图中,它们任意两个顶点,都存在着一条连接它们的有向路。 三、简答题 1、统计整理的基本步骤:p27 ㈠统计分组——就是根据研究目的,按照一定的分组标志将地理数据分成若干组,使资料系 统化,进而研究它们的规律性和依存关系。统计分组的标志通常有品质标志和数量标志两种 类型。 ㈡计算各组的频数、频率,编制统计分组表 ㈢作频数分布图 2、地理数据统计整理中的统计分组的步骤如下:p27 A、求极差R(全距):R=Xmax-Xmin B、确定组数n:组数是根据地理数据所包含变数值个数(N)的多少来确定的。 C、计算组距h:即一组两头分界点距离h=R/n D、计算组限Yi:即各组分界点的数值 第一组下限:y=Xmin-1/2h 第一组上限=下限+组距 E、计算组中值m : m=(下限+上限)/2 3、写出对地理数据进行统计处理时常用到的统计指标与参数。并解释偏度系数和峰度系数 的含义。 答:①描述地理数据一般水平的指标:平均值、中位数、众数。 ②描述地理数据分布的离散程度的指标:极差、离差、离差平方和、方差与标准差、 变异系数。 ③描述地理数据分布特征的参数:偏度系数、峰度系数。 偏度系数测度了地理数据分布的不对称情况,刻画了以平均值为中心的偏向情况。 峰度系数测度了地理数据在均值附近的集中程度。 4、简述主成分分析法的原理和计算步骤 原理:把原来多个变量划为少数几个综合指标的一种统计分析方法,从数学角度来看,是一种降维技术。设有n个地理样本中有p个地理变量,当p较大时,如果在p维空间中考察问题,是比较麻烦的。为了克服这个困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间彼此独立的。设所有变量为主成分,求出所有变量指标的方差,把这些方差排序,挑选前几个方差最大的主成分进行问题的分析。这样既能减少变量的数目,又能抓住主要矛盾,简化了变量之间的 关系。 计算步骤:⑴计算相关系数矩阵 ⑵计算特征值和特征向量 ⑶计算主成分贡献率及累计贡献率 ⑷计算主成分载荷 (5)计算各主成分的得分 5、简述AHP决策分析方法的基本过程 答:⑴明确问题 ⑵建立层次结构模型 ⑶构造判断矩阵 ⑷层次单排序 ⑸层次总排 (6)层次总排序的一次性检验 6、趋势面分析:把实际的地理曲面分为趋势面和剩余面两部分,前者反映地理要素的宏观分布规律,属于确定性因素作用的结果,而后者对应于微观局域,是随机因素影响的结果。趋势面分析的一个基本要求,就是所选择的趋势面模型应该是剩余值最小,而趋势面最大。 7、地理数据的特征:①数量化、形式化与逻辑化。是数学的基本特征。②不确定性。不确定性是地理数据的基本特征之一。原因有:地理系统的复杂性;各种原因所导致的数据误差。 ③多时空尺度。由于地理学的研究对象具有多种时空尺度,所以描述地理现象的地理数据也具有多种时空尺度的性质。④多维性。对于一个地理对象,它的具体意义往往需要从空间、属性、时间三个方面进行综合描述。 8、乘法模型的预测步骤: ①将原时间序列求移动(或滑动)平均,目的是消除季节变动和不规则变动,保留长期趋势 ②将原序列y除以其对应的趋势方程值(或平滑值),目的是分离出季节变动(含不规则变动),即:季节系数=TSCI/趋势方程值(TC或平滑值)=SI。一般用序列中若干年的季节系数之平均值作为季节系数的改进值。 ③将月度(或季度)的季节指标加总,以由计算误差导致的值去除理论加总值,得到一个校正系数,并以该校正系数乘以季节性指标从而获得调整后季节性指标。 ④求预测模型。如果欲求下一年度的预测值,可简单地延长趋势线即可;若要求各月(季)的预测值,只需以趋势值乘各月份(季度)的季节性指标即可求得未来各月(季)的预测值。 以下大家自个打字,或者直接看书,我懒得打了,请多多包涵。 10、Moran 与Geary 的取值范围?P122 11、标准化统计量Z 的意义?P123 12、空间联系的局部指标(LISA )要满足的2个条件?P123 13、G 统计量的意义?(正值、负值)P125第二段 14、Moran 散点图的四个象限:P125 15、与局部Moran 指数相比,Moran 散点图的优势是什么?P125(总共有3点) 16、区域化变量的两个特征;P132-133(随机、结构性) 17、终极状态概率应满足的条件:P112 18、马尔科夫预测法的适用条件:P113(老师笔记) 19、线性规划的共同特征,解及其性质:p152 20、什么是多元线性回归模型?多元线性回归模型和一元线性回归模型相比有什么特点?如何对多元线性回归模型进行检验? 答:多元线性回归模型描述的是多个要素之间的线性相关关系。多元线性回归模型的结构形式为 : 式中: 为待定参数; 为随机变量。 (4分) 而一元线性回归模型描述的是两个要素之间的线性相关关系。由于地理系统是由多种要素构成的,因此多元线性回归模型比一元线性回归模型更带有普遍性意义。(4分) 模型检验:① 回归平方和U 与剩余平方和Q : (3分) ② 回归平方和U 回归平方和U 的自由度为自变量的个数k (3分) ③ 剩余平方和为 剩余平方和Q 的自由度等于n -k -1,n 为样本数。 (3分) ④ F 统计量为 计算出来F 之后,可以查F 分布表对模型进行显著性检验。 a a k a a a x x x y εββββ+++++=k 22110 k βββ,,,10 a εQ U L S yy +==总 ∑∑===-=n a n a iy i L b y y U 112)?(α∑ =-=-=n a yy a a U L y y Q 12)?()1/(/--=k n Q k U F