建筑物图像识别

建筑物图像识别
建筑物图像识别

建筑物图像识别研究

摘要:随着城市化进程的不断发展,城市人口、经济等要素密切影响着城市建筑物的几何形态与分布。从航拍图像或者卫星图像上快速准确的获取城市建筑物的信息不仅有利于地理空间数据的更新,而且对于有效监测新增建筑等城市专题信息有重要意义。不仅如此,近年来基于卫星图像或者航拍图像的建筑物识别与轮廓提取算法的提出与研究改进,更有助于实现对城市建筑物的识别和分类。其对GIS 数据的获得、对影像的理解、大比例尺制图和及其它许多对遥感数据的应用都具有重要的意义。

基于此,本文从建筑物轮廓的几何形态出发,对卫星图像中的建筑物轮廓的提取方法进行了研究。主要进行了如下几方面工作:

1、阐述了建筑物提取的基础理论。对典型城市建筑物进行了特征分析,学习并理解在建筑物的轮廓提取中所要用到的算法,从中选择合适的边缘检测与轮廓提取算法。

2、在对已有方法进行总结归纳的基础上,系统的研究了基于灰度特征与二值数学形态学的轮廓描述算法和基于边缘特征的Hough变换直线提取算法,对这两种算法进行改进,初步实现了典型城市建筑物的半自动提取。

3、针对本文出现的方法进行编程实现,并针对试验结果对这两种方法进行综合的检测与评价,分析了这两种方法的特点及不足。

关键词:卫星图像;建筑物轮廓;二值数学形态学;边缘检测;直线提取

Building Image Recognition and Research

Abstract: With the continuing developing of urbanization, the urban population, economic and other factors are closely affecting the city building’s geometry and distribution. It is not only conductive to the data updating of geospatial, but also has important significance of the thematic information for effective monitoring of new city buildings and so on that accessing information form the city buildings aerial images or satellite images fast and accurately. Moreover, in recent years, building on satellite images to identify and contour extraction or aerial imagery and research to improve the algorithm proposed, but also help achieve the identification and classification of city buildings. Its GIS data acquisition, image understanding, large scale mapping and many other applications are of great significance.

This paper is start form the geometry of the building outline, doing research of the extraction methods for the building outline which from high resolution images. Mainly for the following work areas:

1.Describes the basic theory of building extraction. Urban buildings typical

characteristic analysis, systematic study of image processing algorithms to use in extraction of the building, from which to select the appropriate algorithm for edge detection and contour extraction.

2.On the basis of summarizing the existing methods, the proposed feature

extraction based on gray and binary mathematical morphology the contour edge detection algorithm based on linear Hough transform algorithm, the semi-automatic extraction of typical urban buildings.

3.We were against the proposed method programming, and comprehensive

testing and evaluation of these two methods for the test results, the characteristics and drawbacks of the two methods.

Key words:Satellite images, Building outline, Binary mathematical morphology,Edge detection,Line Extraction

目录

1 绪论 (1)

1.1 研究背景和意义 (1)

1.1.1 研究背景 (1)

1.1.2 研究意义 (1)

1.2 研究现状 (2)

1.3 本文的主要内容 (3)

2 建筑物图像预处理的基础理论 (6)

2.1 建筑物的特征分析 (6)

2.2 建筑物几何特征分类 (6)

2.3 图像增强 (8)

2.3.1 灰度变换 (8)

2.3.2 直方图均衡变换 (14)

2.4 本章小结 (19)

3 基于灰度特征的建筑物轮廓提取 (20)

3.1 图像二值化 (20)

3.2 二值数学形态学 (25)

3.2.1 膨胀与腐蚀 (25)

3.2.2 开启与闭合 (27)

3.3 本章小结 (31)

4 基于边缘特征的建筑物轮廓提取 (32)

4.1 边缘检测 (32)

4.1.1 边缘检测技术 (32)

4.1.2 边缘的分析 (33)

4.1.3 关于梯度的概念 (33)

4.2 边缘检测算子 (34)

4.2.1 罗伯特(Robert)边缘算子 (35)

4.2.2 索贝尔(Sobel)边缘算子 (35)

4.2.3 Prewitt边缘算子 (35)

4.2.4 拉普拉斯(Laplacian)边缘算子 (36)

4.2.5 坎尼(Canny)边缘算子 (37)

4.2.6 边缘检测算子比较 (40)

4.3 直线段提取 (42)

4.3.1 基于连接的直线段提取算法 (42)

4.3.2 经典Hough变换算法 (43)

4.3.3 经典Hough变换实验结果 (46)

4.4 本章小结 (48)

5 总结与展望 (49)

5.1 总结 (49)

5.2 展望 (50)

参考文献 (51)

致谢 (53)

1 绪论

1.1 研究背景和意义

1.1.1 研究背景

近年来,不断发展的空间技术使卫星图像与遥感图像呈现出高空间分辨率、高光谱分辨率和高时间分辨率的特点。这些图像数据包含丰富的地物细节信息,为地物提取提供了丰富的数据源。人工地物是空间地理信息库中的重要元素,主要包括建筑物、桥梁、道路和大型工程构筑物,在城市区域的影像中80%的目标是建筑物和道路。建筑物作为重要的人工地物之一,与人们的生活息息相关,其提取对数字地图、GIS数据库更新、数字城市建模、虚拟城市、虚拟旅游、游戏业等的发展有很大的促进作用。基于此,建筑物信息的提取与描述方法处于不断的发展与完善过程中,是摄影测量与遥感、计算机视觉、图像理解等领域的研究热点,同时,由于问题的复杂性也是一个难点。因此,探索快速、高效、准确的从卫星影像中提取出建筑物轮廓的方法已经成为当前遥感应用研究领域一个重要的课题,急待解决。从实际应用角度来说,实现图像中建筑物的识别需要能够满足影像制图、地理信息系统的数据获取和自动更新的需要;从研究的角度出发,由于影像中目标的高度多样性和复杂性,成功的建筑物自动识别系统将为其他类型的影像理解问题提供具有普遍指导意义的理论和方法。因此,如何识别和提取图像中的建筑物是图像处理领域中的重要的研究课题之一。

1.1.2 研究意义

随着航空航天领域的技术越来越成熟,各种高分辨率卫星传感器的发射,所获取的地面图像质量也越来越高。利用卫星图像或者航空照片来对地物进行信息提取,大大提高了工作效率。伴随着海量卫星影像数据的提供,其信息提取与处理方法却相对进展缓慢。人工解译与人工判读仍然是普遍的工作方式,费时费力,成为制约高分辨率卫星影像大范围应用的主要瓶颈因素之一。从影像上自动识别地物类型并精确量测地物形状、大小,是卫星影像和摄影测量研究中的热点和难点,也是最终高度自动化地由影像获取基础地理信息的关键问题。人工地物是空间地理信息库中的重要元素。作为地物类别中的主要内容,建筑物的识别与提取占有很大的比例。作为地形图中重要的成图元素,建筑物的识别与提取,直接影响到地物绘测的自动化水平。由于建筑物具有明显的定位特征,所以对它的识别和了为特征提取、特征匹配、图像理解、制图和作为其他目标的参照体有重要的意义。从实际应用角度来说,实现影像中建筑物的识别需要能够满足遥感影像制图、地理信息系统的数据获取和自动更新的需要;从

1

研究的角度出发,由于遥感影像中目标的高度多样性和复杂性,成功的建筑物自动识别系统将为其他类型的影像理解问题提供具有普遍指导意义的理论和方法。

1.2 研究现状

图形分析的基本任务之一是从航空或者卫星图像中自动提取人造目标。特别的,建筑物是城区的重要特征,提取建筑物的技术在城市制图、城市规划、地理信息工程以及军事侦察等领域有着广泛的应用。在这些应用中,产生了许多自动提取建筑物的方法。综合目前关于利用高分辨率航空相片或卫星影像提取建筑物等人工地物信息的方法,总体上大致可以分为两类:

第一类是研究的最为广泛和深入的方法,是利用图像信息结合高程信息进行建筑物信息的提取。该方法的主要原理是利用建筑物与周围环境之间存在的高差进行建筑物屋顶的提取,已经有大量的比较成熟的算法,如CSG方法等。有些成熟的商业化软件系统就附加有此项功能。但此类方法大多需要辅助数据(如DEM、DSM等)。

另一类是利用影像信息结合图像处理与分析、机器视觉、人工智能等学科领域的新方法而实现对建筑物屋顶信息半自动甚至全自动的识别与提取。该方法的特点是不需要其它的外部信息源,也不需要多景图像,因此相对于前一种方法具有更为广泛的应用范围和应用前景。

由于后一类方法利用的信息主要是图像的灰度信息、光谱信息、建筑物的形态信息以及一部分先验知识,而缺乏对识别建筑物非常有用的表面高度信息,不像第一类方法中有大量信息可用。因此,从有限的图像表面信息中提取出建筑物的信息,其难度要较前者大。加之,高分辨率商业卫星数据的提供起步较晚,到目前为止,仍处于方法的研究和探索阶段。另外,由于建筑物本身结构的复杂性;在城市环境中,建筑物常常被一些其他人造目标或者自然目标包围,这就给提取建筑物造成影响,成为干扰因素。比如提取房屋的直线边缘时,如果该房屋边缘与道路平行且相邻,在边缘检测后的影像中很容易把道路和房屋边缘混淆;城市建筑物影像中,由于拍摄角度的倾斜容易使一部分建筑遮蔽了另一部分建筑,被遮蔽的建筑物的提取就还得根据其他信息或是采用特殊的方法来完成;另外,受光线的影响,建筑物的阴影也会对提取产生干扰,有时候阴影的灰度会与建筑物的灰度相接近,这样很难判断建筑物的边缘;还有就是我们所利用的影像还会受到成像条件、图像质量、光谱范围等因素的影响,造成信息的损失或者像片的差异较大。这些都是建筑物提取所面临的困难。

2

本文主要研究第二类方法中的基于灰度信息与建筑物形态信息的轮廓提取算法。以下列出了一些国内外的研究现状。

本类研究中对于建筑物的自动提取技术的研究,可以追溯到上世纪八十年代中后期。根据所查找的文献资料显示,南加州大学的Nevatia所领导的研究小组最早在美国国防高级研究项目管理机构的支持下展开了相关的工作,其研究成果代表了该领域研究的一个方向,A.Huertas和R.Nevada主要根据图像中线段的空间关系进行分析,结合感知分组理论对建筑物目标进行假设和验证[1]。进入二十世纪九十年代,建筑物自动提取技术的研究意义逐渐为更多的学者所认识。九十年代初期,该领域的研究逐渐展开,这一时期代表性的有R.B.Irvi,以及yuh-tay liow等,其提出了利用阴影提取建筑物的新思路,充分挖掘图像中的有用信息,利用领域知识指导目标提取[2]。C.Lin 与Nevitia等提出根据感知分组理论,利用边缘检测算法得到图像中的边缘,再对边缘图像中的边缘线段根据空间关系进行分组,搜索平行线,并在此基础上搜索矩形,以组成符合建筑物空间结构的轮廓,从而得到建筑物位置[3]。

在国内的一些专家学者对图像边缘检测以及对建筑物的半自动提取也做了比较深入的研究。赵洁等利用小波变换方法实现对遥感影像数据中的建筑物识别[4]。李魏岳等尝试使用边缘检测算子与数学形态学相结合的方法提取高分辨率多光谱影像中的建筑物信息[5]。王大莹等基于Matlab平台,采用数学形态学方法对数据实现建筑物边缘信息提取,并与LoG算子、Canny算子这两种方法进行了对比[6]。王永刚等利用数学形态学及区域标识和面积阈值分割等相关知识和技术实现提取建筑物轮廓信息提取[7],王波等用边缘检测算子进行边缘检测后,再用改进的Hough变换提取直线段来完成提取建筑物的边缘检测[8]。赵月云等利用canny算子及影像分割技术实现建筑物信息提取[9]。赵国庆等基于数学形态学进行建筑物分类提取后,再利用Hough算法实现对建筑物边缘信息的提取[10]。上述方法都能提取出建筑物边缘信息,有的方法虽然简单,但是部分建筑物边缘空间信息会被遗漏;有的方法比较复杂,计算量大,不便于在实际应用中操作。

1.3 本文的主要内容

针对遥感图像中建筑物的检测和识别已经有了很多解决方法。但是,建筑物提取的最终目的是走向实际应用,国内外虽然已经实现了一些实验系统,但是距离真正完善的自动系统还存在差距,算法完全满足实用要求依然有待探索和完善。本文的目的就是将建筑物图形轮廓的识别与提取的算法作为方向,初步实现建筑物的提取与识

3

别。本文中的图片数据均来自于谷歌地球卫星图像。本文的研究步骤如图1-1所示。

本文分为五章展开。

第一章首先介绍了建筑物提取技术的应用背景与发展现状,然后介绍了建筑物提取技术的主要研究内容和现有的研究方法,最后介绍了本文的主要研究工作与及内容安排。

第二章对建筑物的特征进行了分析,介绍了进行建筑物图像处理的的一些基础理论,包括了对建筑物图像处理前所要进行的图像增强的各种方法。

第三章提出了基于边缘特征与二值数学形态学的轮廓描述算法,对该算法进行编程实现。并针对该算法给出的试验结果进行综合的检测与分析。

第四章介绍了建筑物的边缘检测与直线提取的相关理论,并针对不同的边缘检测算子进行编程实现,对实验结果进行了比较,选择合适的边缘检测算子进行直线段提取。并对提取结果进行分析。

第五章是总结和展望,总结本文的研究内容,提出进一步研究的方向。

4

5

图1-1 论文工作流程

卫星图像

基于边缘特征的直

线提取

基于灰度特征的轮

廓描述

边缘检测算子

预处理后的图

像图像二值化

形态学开闭运

边缘检测Hough 变换提取直线

完成轮廓提取

图像预处理

2 建筑物图像预处理的基础理论

在本章中,主要介绍了建筑物图像处理的基础理论,分别对建筑物的外观特征进行了分析并对图像增强的概念进行了理论介绍。为以后章节的建筑物轮廓提取奠定了基础。

2.1 建筑物的特征分析

建筑物虽然是一类很有规律的人造目标,但是如果从其风格和外形上来分,就会有成千上万种。但是实际上,在城市模型中,绝大多数建筑物的外形主要集中在少数具有代表性的类别中。本着适应普遍建筑物的目的,在实际操作中,可以对那些具有普遍特征的建筑物运用一定方法去自动化提取,对于复杂特殊的建筑物辅以人工手段来解决。

建筑物作为一种比较规则的人工地物,如果从其风格和外形上来说,有成千上万种。但在实际上,对于城市建筑物,大多数的建筑物为矩形或矩形的组合,外形主要集中在少数具有代表性的模型当中。对于此类普遍类型的建筑物,其特征可以归结为以下几个方面:

(1)几何特征

建筑物在遥感影像上表现为面状地物,按照顶部的投影形状可以分为矩形、L 形、U形、以及由多直角构成的建筑物,它们的相邻边缘相垂直。按照顶部的立体形状分为平顶形和人字形。几何特征另外的表现就是排列比较规整,基本走向一致,大小一般是长几十米,宽十几米。

(2)灰度特征

建筑物在遥感影像上的灰度特征表现为,建筑物的边缘以及不同建筑物的连接处的灰度变化比较大,而建筑物内部灰度值相对比较均匀,与周围环境对比度比较大;屋顶与道路的光谱值相仿,但纹理不同;平顶建筑物的纹理分布均匀,人字形建筑物在同一侧具有相同的纹理。

(3)拓扑和上下文特征

建筑物在影像上表现为规则的面状地物,具有多边形的拓扑特征,大多数为矩形或由矩形组合构成的多直角形状,与道路、水系等线性地物不相交,常常受其它建筑物或树木的遮挡。建筑物边缘附近存在阴影,建筑物周围通常是水泥地或绿地。2.2 建筑物几何特征分类

本文中采用的的建筑物具有鲜明的几何特征,而几何特征的分类是以构成屋顶的

6

7

平面的个数来给大部分建筑物的屋顶进行分类[11]。大致可分为以下三种类型 (1)单平面型

实际上就是常见的平顶屋顶,整个屋顶是由一个水平平面组成。根据水平平面的外形不同又可以将其进一步分成诸如矩形、L 型、U 型、H 型和任意多边型。.它们的外形大致如图2.1所示:

图2-1 单平面屋顶类型

(2)双平面型

这种类型的建筑物一般是由两个斜平面相交形成屋顶,这也是一类比较常见的建筑物。根据两个斜平面的外形,它也可以细分为许多类型,其中较常见类别如图2.2所示:

图2-2 双平面屋顶常见外形

(3)四平面型

该类型建筑物屋顶由四个斜平面相交形成,它是双平面屋顶的一种变异,

其外形

8

如图2.3所示:

图2-3 四平面屋顶的典型外形

我们把常见的典型建筑物划分为上述3个大类。当然,这些类别不可能包括建筑物的全部类别(比如圆顶房屋),但是希望可以概括大部分建筑物的类型。对于比较复杂而且无法用上述类型概括的建筑物,我们可以利用手工采集,或者将其加入到建筑物类别库中进行再分析。利用上述建筑物模型可以大大简化我们重建建筑物的过程以及获得较高的测量精度。

2.3 图像增强

在对图像中的建筑物进行识别与提取前首先要对图像进行增强处理,这有助于后续的识别并可以增强提取效果。

图像增强技术大致分为三类:空间域法、频域法和模糊处理法。直接在图像像素空间进行处理的操作叫做空间域法;频域方法是将图像映射到某个变换域后再对图像进行处理;模糊处理方法[12]是先对图像进行模糊化映射,将其变换为特征平面上的模糊图像数据,再对该模糊图像进行相应的处理,使得经过逆映射后的图像具有特征增强的效果。从应用的角度,本节只对图像对比度增强的相关方法做简单的介绍。 2.3.1 灰度变换

灰度变换[13]是一种简单实用的方法,它可使图像动态范围增大,图像的对比度扩展,图像变清晰,特征变明显,是图像增强的重要手段之一。它分为线性变换、分段线性变换和非线性变换三种情况。令原始图像(,)f i j 的灰度范围为[a,b],线性变换后的图像'(,)f i j 的灰度范围为[a`,b`],则(,)f i j 和'(,)f i j 之间存在如下线性关系:Equation Chapter 2 Section 1

''

'(,)'((,))b a f i j a f i j a b a

-=+

-- (2-1)

在线性变换中还有一种特殊情况当图像中大部分像素的灰度值在[a,b]范围内,少部分像素在小于a 和大于b 的区间时,为了使这少部分像素压缩为a`和b`之间,

可做

9

如下变换:

',(,)'''(,)'((,)),(,)',(,)a f i j a b a f i j a f i j a a f i j b b a b f i j b

=+-≤

(2-2)

这种两端“截取式”的变换会造成一部分信息丢失。但有时这种取舍也是值得的,常用这种方法分析遥感资料降水问题。

分段线性变换是为了突出人们感兴趣的目标或亮度区间,要求局部扩展亮度值范围。它可以有效利用有限灰度级,达到最大限度增强图像中有用信息的目的。

它将[0,s 1]映射到[0,t 1],[s 1,s 2]映射到[t 1,t 2],[s 2,L-1]映射到[t 2,L-1]。

1

1121111221

2

2222

,0(),1(),11t s s s s t t

t t s s s s s s s L t s s t s s L L s ?≤≤???-=+-≤≤?-?

?---+<≤-?

--?

(2-3)

非线性变换通常采用自然对数变换把灰度空间从[a,b]扩展到[a`,b`],它可以扩展中低灰度区域的对比度、压缩高灰度值,表达式如(2-4)所示:

''

'(,)(ln (,)ln )ln ln b a f i j f i j a a b a

-=

-+-

(2-4)

10

图2-4 西安石油大学新校区图像

图2-5 新校区图像线性变换效果图

图2-6 新校区图像灰度直方图

图2-7 新校区图像线性变换灰度直方图

11

12

图2-8 哈佛大学建筑群图像

图2-9 建筑群图像线性变换效果图

图2-10 建筑群图像灰度直方图

图2-11 建筑群图像线性变换灰度直方图

13

14

上图是建筑物图像灰度线性变换前后对比效果图。通过线性变换后的效果图可以明显看出,图像变得更加清晰,从变换前后的灰度直方图也可以看出,线性变换后的图像灰度对比度明显加大,但直方图形状变化不大。

2.3.2 直方图均衡变换

直方图是表示一幅图像灰度级分布情况的统计图,反映出具有某一灰度的像素数。数字图像的直方图的横坐标是灰度,一般用r 表示,纵坐标是某一灰度值r i 的像素的个数n i 。则一幅灰度图像中灰度级r i 出现的概率近似为

()i

i i n p r n

=

(2-5)

则10

()1k i i i p r -==∑

(2-6)

其中,n 是图像像素的总和,k 为图像对应的总灰度级数。

直方图均衡化[13]是通过变换将原图像的直方图调整为平坦的直方图,然后用此均衡直方图校正原图像。直方图均衡化的变换函数如下所示:

(),0,1,...1j

i

j j i n S T r j k n

====-∑

(2-7)

其中()S T r =,T 是变换函数。

15

图2-12 西安石油大学新校区图像

图2-13 新校区图像直方图均衡化

图2-14 新校区图像灰度直方图

图2-15 新校区图像灰度均衡化后直方图

16

建筑物图像识别

建筑物图像识别研究 摘要:随着城市化进程的不断发展,城市人口、经济等要素密切影响着城市建筑物的几何形态与分布。从航拍图像或者卫星图像上快速准确的获取城市建筑物的信息不仅有利于地理空间数据的更新,而且对于有效监测新增建筑等城市专题信息有重要意义。不仅如此,近年来基于卫星图像或者航拍图像的建筑物识别与轮廓提取算法的提出与研究改进,更有助于实现对城市建筑物的识别和分类。其对GIS 数据的获得、对影像的理解、大比例尺制图和及其它许多对遥感数据的应用都具有重要的意义。 基于此,本文从建筑物轮廓的几何形态出发,对卫星图像中的建筑物轮廓的提取方法进行了研究。主要进行了如下几方面工作: 1、阐述了建筑物提取的基础理论。对典型城市建筑物进行了特征分析,学习并理解在建筑物的轮廓提取中所要用到的算法,从中选择合适的边缘检测与轮廓提取算法。 2、在对已有方法进行总结归纳的基础上,系统的研究了基于灰度特征与二值数学形态学的轮廓描述算法和基于边缘特征的Hough变换直线提取算法,对这两种算法进行改进,初步实现了典型城市建筑物的半自动提取。 3、针对本文出现的方法进行编程实现,并针对试验结果对这两种方法进行综合的检测与评价,分析了这两种方法的特点及不足。 关键词:卫星图像;建筑物轮廓;二值数学形态学;边缘检测;直线提取

Building Image Recognition and Research Abstract: With the continuing developing of urbanization, the urban population, economic and other factors are closely affecting the city building’s geometry and distribution. It is not only conductive to the data updating of geospatial, but also has important significance of the thematic information for effective monitoring of new city buildings and so on that accessing information form the city buildings aerial images or satellite images fast and accurately. Moreover, in recent years, building on satellite images to identify and contour extraction or aerial imagery and research to improve the algorithm proposed, but also help achieve the identification and classification of city buildings. Its GIS data acquisition, image understanding, large scale mapping and many other applications are of great significance. This paper is start form the geometry of the building outline, doing research of the extraction methods for the building outline which from high resolution images. Mainly for the following work areas: 1.Describes the basic theory of building extraction. Urban buildings typical characteristic analysis, systematic study of image processing algorithms to use in extraction of the building, from which to select the appropriate algorithm for edge detection and contour extraction. 2.On the basis of summarizing the existing methods, the proposed feature extraction based on gray and binary mathematical morphology the contour edge detection algorithm based on linear Hough transform algorithm, the semi-automatic extraction of typical urban buildings. 3.We were against the proposed method programming, and comprehensive testing and evaluation of these two methods for the test results, the characteristics and drawbacks of the two methods. Key words:Satellite images, Building outline, Binary mathematical morphology,Edge detection,Line Extraction

图像识别方法和设备的制作流程

本技术的实施方式提供了一种图像识别方法。该方法包括:对待识别图像进行特征提取,得到多个特征向量;确定每个特征向量对应的类别;针对每个特征向量,分别计算其所对应的类别下各样本图像的分数;将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值;将分值最高的样本图像对应的图像标识作为待识别图像的识别结果。通过上述图像识别方法,有效提取多个特征来表征待识别图像,提取的特征不受图像中物体的特性所影响,能够实现对图像的有效识别,适用范围广;且通过计算样本图像分数的方式得到识别结果,综合考虑了特征的重要性,能够获得较好的识别精度。此外,本技术的实施方式提供了一种图像识别装置。 权利要求书 1.一种图像识别方法,包括: 对待识别图像进行特征提取,得到多个特征向量; 确定每个特征向量对应的类别; 针对所述每个特征向量,分别计算其所对应的类别下各样本图像的分数;

将计算得到的同一样本图像的分数累加,得到该同一样本图像的分值; 将分值最高的样本图像对应的图像标识作为所述待识别图像的识别结果; 按照以下公式计算样本图像的分数: 其中,S表示当前样本图像的分数,A表示平均每个类别下的样本图像特征向量个数,B表示所述当前样本图像所属的类别下的所有图像标识出现次数之和,C表示所述当前样本图像所属的类别下,所述当前样本图像对应的图像标识出现次数,D表示放缩因子。 2.根据权利要求1所述的图像识别方法,其中,确定每个特征向量对应的类别,包括: 分别计算所述特征向量与预先存储的多个聚类中心向量的距离,其中,所述聚类中心向量与所述类别一一对应; 确定与所述特征向量距离最近的聚类中心向量对应的类别为所述特征向量对应的类别。 3.根据权利要求1所述的图像识别方法,其中,对待识别图像进行特征提取,得到多个特征向量,包括: 利用滑动窗口遍历所述待识别图像; 针对所述滑动窗口所处的每个区域,计算该区域的特征向量。 4.根据权利要求3所述的图像识别方法,其中,计算该区域的特征向量,包括: 将该区域划分为多个大小相同的细胞单元,其中,每个细胞单元之间不重叠;

SARPolSAR图像建筑物信息提取技术研究

SAR/PolSAR图像建筑物信息提取技术研究随着当前城市的快速发展,针对城区建筑物的遥感技术得到越来越多学者的关注。合成孔径雷达(SAR)和极化合成孔径雷达(PolSAR)由于具有全天时、全天候对地观测特点以及稳健多样的目标信息获取能力而被广泛应用于城区遥感中。 针对城区雷达遥感图像的解译需求,本文系统研究了SAR和PolSAR图像建筑物信息提取技术,重点围绕建筑物散射机理分析、建筑物检测、分割以及建筑物分类四个方面,旨在为城区雷达遥感图像提供一整套有效且稳健的信息提取方法,为城市规划、国民经济建设以及国防军事应用提供有力支撑。本文工作具体包括以下方面:(1)建筑物后向散射与极化散射特征分析,PolSAR图像城区极化目标 分解。 首先分析SAR图像建筑物后向散射特点以及PolSAR图像极化目标分解原理。进一步讨论城区极化目标分解的难点,即非平行雷达飞行方向的建筑物与森林散射机理混淆。 在深入研究当前城区极化目标分解方法及其应用范围的基础上,针对建筑物的方位向和特有散射特性,提出针对建筑物的交叉散射相干矩阵模型。该模型能有效描述建筑物产生的交叉散射,从而能与森林产生的体散射有效区分开来并消除两类目标散射机理混淆。 基于该散射模型,本文提出了多成分和四成分两种极化目标分解方法,利用星载和机载PolSAR数据分解结果验证了该交叉散射模型的有效性。最后对比分析了两种城区极化目标分解方法的不同点及其在后续建筑物检测、分类中作用。 (2)SAR和PolSAR图像建筑物检测。首先介绍了SAR图像基于纹理特征的建筑物检测方法以及PolSAR图像人造目标方位向非平稳性检测方法并分析两类方

仪表显示的图像识别算法研究

仪表显示的图像识别算法研究 摘要:随着社会的逐渐发展,人类的生活越来越趋于智能化。本文根据当今社会对于图像识别研究的发展现状,针对目前人们生活中人工读表的弊端,提出了通过采集仪表显示的图像并进行图像识别算法处理来达到智能自动读表的方法。 为了能快速获得采集数据,减少人们生活中繁复的人工作业。本文通过多样的图像处理来代替人眼识别图像。只需要得到采集到的图像,就可以利用计算机来进行计算和识别,得出最后的数字。本文采用了一系列的图像处理方法,包括图像的去噪,二值化分割,边缘检测和基于数学形态学的膨胀腐蚀操作等。同时通过多种尝试和比较各种方法的优缺点得到了一套简易而又完善,快速的图像识别算法。 在进行多次测试试验后,本文采用数码相机来进行图像的采集,同时经过图像预处理、图像分割、图像识别等一系列流程得出了较为完善的图像采集和识别系统,为未来信息传递智能化提供了基础,对于促进工业发展或是改善生活水平都有重要的意义。 关键词:图像预处理、二值化、边缘检测、形态学、去噪、图像分割、图像匹配 The research of image recognition displayed by the instrument Abstract: With the continuous development of society, people's lives become more and more intelligent. Based on the current development in today's society for the study of image recognition, according to the present disadvantages of manual meter reading in peop le’s lives, this page proposed the way by collecting the instruments display image and then deals it with image recognizing algorithms to achieve intelligent automatic meter. In order to quickly gather data, reducing manual work in people’s lives complicated. The page uses a series of image processing to replace human eye image recognition. Just need the collected images, we can use a computer to calculate and identify, then we will arrive at a final figure. We used a variety of image processing methods, including image denoising, thresholding segmentation, expansion of edge-detection based on mathematical morphology and corrosion and so on. And

图像模式识别的方法介绍

2.1图像模式识别的方法 图像模式识别的方法很多,从图像模式识别提取的特征对象来看,图像识别方法可分为以下几种:基于形状特征的识别技术、基于色彩特征的识别技术以及基于纹理特征的识别技术。其中,基于形状特征的识别方法,其关键是找到图像中对象形状及对此进行描述,形成可视特征矢量,以完成不同图像的分类,常用来表示形状的变量有形状的周长、面积、圆形度、离心率等。基于色彩特征的识别技术主要针对彩色图像,通过色彩直方图具有的简单且随图像的大小、旋转变换不敏感等特点进行分类识别。基于纹理特征的识别方法是通过对图像中非常具有结构规律的特征加以分析或者则是对图像中的色彩强度的分布信息进行统计来完成。 从模式特征选择及判别决策方法的不同可将图像模式识别方法大致归纳为两类:统计模式(决策理论)识别方法和句法(结构)模式识别方法。此外,近些年随着对模式识别技术研究的进一步深入,模糊模式识别方法和神经网络模式识别方法也开始得到广泛的应用。在此将这四种方法进行一下说明。 2.1.1句法模式识别 对于较复杂的模式,如采用统计模式识别的方法,所面临的一个困难就是特征提取的问题,它所要求的特征量十分巨大,要把某一个复杂模式准确分类很困难,从而很自然地就想到这样的一种设计,即努力地把一个复杂模式分化为若干

较简单子模式的组合,而子模式又分为若干基元,通过对基元的识别,进而识别子模式,最终识别该复杂模式。正如英文句子由一些短语,短语又由单词,单词又由字母构成一样。用一组模式基元和它们的组成来描述模式的结构的语言,称为模式描述语言。支配基元组成模式的规则称为文法。当每个基元被识别后,利用句法分析就可以作出整个的模式识别。即以这个句子是否符合某特定文法,以判别它是否属于某一类别。这就是句法模式识别的基本思想。 句法模式识别系统主要由预处理、基元提取、句法分析和文法推断等几部分组成。由预处理分割的模式,经基元提取形成描述模式的基元串(即字符串)。句法分析根据文法推理所推断的文法,判决有序字符串所描述的模式类别,得到判决结果。问题在于句法分析所依据的文法。不同的模式类对应着不同的文法,描述不同的目标。为了得到于模式类相适应的文法,类似于统计模式识别的训练过程,必须事先采集足够多的训练模式样本,经基元提取,把相应的文法推断出来。实际应用还有一定的困难。 2.1.2统计模式识别 统计模式识别是目前最成熟也是应用最广泛的方法,它主要利用贝叶斯决策规则解决最优分类器问题。统计决策理论的基本思想就是在不同的模式类中建立一个决策边界,利用决策函数把一个给定的模式归入相应的模式类中。统计模式识别的基本模型如图2,该模型主要包括两种操作模型:训练和分类,其中训练主要利用己有样本完成对决策边界的划分,并采取了一定的学习机制以保证基于样本的划分是最优的;而分类主要对输入的模式利用其特征和训练得来的决策函数而把模式划分到相应模式类中。 统计模式识别方法以数学上的决策理论为基础建立统计模式识别模型。其基本模型是:对被研究图像进行大量统计分析,找出规律性的认识,并选取出反映图像本质的特征进行分类识别。统计模式识别系统可分为两种运行模式:训练和分类。训练模式中,预处理模块负责将感兴趣的特征从背景中分割出来、去除噪声以及进行其它操作;特征选取模块主要负责找到合适的特征来表示输入模式;分类器负责训练分割特征空间。在分类模式中,被训练好的分类器将输入模式根据测量的特征分配到某个指定的类。统计模式识别组成如图2所示。

车辆牌照图像识别算法研究与实现本科毕设论文

Q260046902 专业做论文 西南科技大学 毕业设计(论文)题目名称:车辆牌照图像识别算法研究与实现

车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数字字符识别的问题,本文采用了基于BP神经网络的识别方法。在学习并掌握了数字图像处理和模式识别的一些基本原理后,使用VC++6.0软件利用以上原理针对车牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++

Research and Realization of License Plate Recognition Algorithm Abstract:In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC++ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC++

图像识别技术综述

图像处理与识别技术综述 摘要:本文简要介绍了图像处理与识别技术的相关知识,介绍了图像识别过程中的判别函数和判别规则,特征提取和选择的方法。设计一个基于16位处理器MC9S12XS128的图像识别系统在实际中的具体硬件实现。 关键词:图像识别特征提取MC9S12XS128 数字摄像头 An Overview of Image Recognition And Identifying Technology Abstract:This paper introduces some knowledge of image recognition and identifying technology,introduces the discriminant function discriminant rule in the image identifying progress, feature extraction and selection method. Designed an image identifying system based on 16-bit controller MC9S12XS128,and it has specific hardware implementation in fact. Key words: image identifying discriminaut rule MC9S12XS128 digital cameral

1 引言 图像是与视觉相关的最贴近生活的信息,它是客观世界的物体直接或间接作用于人眼而产生视知觉的实体。传统的图像处理技术就是对图像进行保存、处理、压缩、传输和重现。随着信息时代的到来,用于计算机处理的各种信息的需求越来越多,多媒体信息处理技术已经成为日常生活各个领域的迫切需要。人们更希望利用计算机技术处理人类视觉问题,如:人脸、指纹识别技术实现处理与个人有关的一切事物,利用视觉自动监视系统监视环境中发生的非常事件,利用字符识别技术实现文档图像的自动录入与处理。因此把传统的图像处理技术与模式识别处理技术相结合是图像处理的新趋势。 2 传统的图像处理技术 图像处理技术始于20世纪50年代,1964年美国喷射推进实验室(JPL )使用计算机对太空船送回的大批月球照片处理后得到了清晰逼真的图像,这是这门技术发展的里程碑,此后这门技术得到了广泛的发展。 传统图像处理技术包含图像的获取、变换、增强、编码、分割等方面的内容。 2.1 图像获取 图像可以根据其形式或产生方法来分类。 照片图画 光图像连续函数 离散函数 (数字图像)不可见的 物理图像 物体图像 可见的图像图片数学函数 图1 图像的分类 图像的获取[4]是指将其变为计算机可识别的信息。通常是数字化的过程,及扫描、采样、量化三个步骤。经过数字化过程后就得到了一幅图的数字表示,即数字图像。一般这个过程由摄像头等设备完成。反过来还可将数字图像进行显示。 2.2 图像变换 图像变换[6]广泛应用于图像滤波[2]、统计滤波[5]、图像数据压缩以及图像描述等。图像变换是将N ×N 维空间图像数据变换成另外一组基向量(通常是正交向量空间)的坐标参数,我们希望这些离散图像信号坐标参数更集中代表了图像中的有效信息,或者是更便于达到某种处理目的。 通常采用的方法有:傅里叶变换、相关分析、小波变换[7]、离散余弦变换(DCT )、正弦变

基于高分辨率遥感影像的建筑物提取

基于高分辨率遥感影像的建筑物提取 摘要:本文首先对遥感影像上建筑物提取的研究历史进行分析,总结高分辨率航空相片或卫星影像提取建筑物等人工地物信息的主要方法,从影像数据、分辨率与方法几个方面概括建筑物提取的发展历史。总结高空间分辨率遥感影像建筑物提取研究的现状以及发展趋势。 关键词:高空间分辨率遥感影像;建筑物提取 引言 随着遥感技术的不断进步,光学卫星影像的空间分辨率不断提高(目前军用卫星已经达到厘米级),与同类中低空间分辨率的遥感影像相比,高空间分辨率光学卫星影像上地物的光谱特征更明显,景观的结构、形状、纹理和细节等信息突出,使得研究城市内部建筑分布细节成为可能。从20世纪90年代以来高空间分辨率光学卫星影像逐渐进入商业和民用领域,在地图更新、土地管理、城市规划、资源调查、环境监测、灾害评估等方面得到广泛应用,逐步成为一种主要的地理空间数据获取和更新途径,针对高空间分辨率光学卫星影像的信息提取研究也随之兴起,但高空间分辨率影像信噪比低的特点限制了建筑提取的精度,人工解译仍然是最普遍的提取方式,其费时费力的弱点成为制约高分辨率卫星影像大范围应用的瓶颈。目前对绿地和水体的自动提取已经比较成熟,而道路和建筑物由于其自身的复杂性导致自动提取困难,国内外很多学者在高分辨影像道路和建筑提取方面做了很多相关研究,在提取理论和方法方面取得了一定的成果。本文就高空间分辨率遥感影像建筑物提取研究现状进行总结,在此基础上提出目前遥感影像建筑物提取研究的热点及其发展趋势。 一、建筑物提取的研究历史 迄今为止,利用高分辨率航空相片或卫星影像提取建筑物等人工地物信息的方法大体分为两类:其一,利用图像信息结合高程信息进行建筑物信息提,通过建筑物与周围环境之间的高差进行屋顶边界的提取,大多需要一定的辅助数据如DEM、DSM等。其二,利用高空间分辨率遥感影像数据结合计算机视觉、图像处理与分析、人工智能等学科领域的新方法实现对建筑物顶部信息的半自动甚至全自动识别与提取。此方法不需要多景影像数据,也不需要其它的外部信息源,具有更为广泛的应用前景和范围,但是其缺乏对识别建筑物表面高度信息,只是利用的是图像的光谱信息、灰度信息以及建筑物的形态信息和一部分先验知识,难度要更大,此方法仍处于探索研究阶段。在城市环境中由于受到建筑物结构复杂性的影响,建筑物常常被人造目标或者自然目标包围,给提取建筑物带来干扰,常见的典型情况有:房屋边缘与道路平行且相邻,边缘检测后的影像中道路和房屋边缘相互混淆;因为拍摄角度导致建筑物彼此的遮蔽,影像上丢失了被遮蔽建筑物的信息;建筑物阴影的灰度接近建筑物的灰度,很难区分二者的边界,对提取产生干扰。此外利用成像质量、光谱范围等多方面因素影响的遥感影像提取建筑物信息,出现信息的丢失以及失真,从而增加了建筑物提取的难度。图1分别从影像数据、分辨率与方法几个方面概括了建筑物提取的发展历史。快速准确地

森林防火系统中图像识别算法的研究

哈尔滨工业大学工学硕士学位论文 摘要 森林是陆地生态的主体,具有很高的生态效益和经济效益。鉴于目前我国森林防火的严峻形势,必须开发有效技术解决森林火灾的监测问题。传统火灾探测器多采用单一时刻的火灾参量作为判断标准,在外界干扰下易引起频繁误报或漏报。近年来提出的基于机器视觉的火灾报警系统,利用数字图像处理技术来实现火灾自动报警。 基于火焰和烟雾的图像特征,本文研究了一种识别自然环境下火灾的机器视觉方法。火灾发生过程中,主要的图像信息是燃烧时产生的烟雾和火焰,通过对烟雾和火焰的图像信息研究发现,烟雾和火焰本身具有一定的规律性,以此为依据设计有针对性的算法,从图像中识别出烟雾和火焰,判断火灾是否发生。 首先,论文阐述了森林防火技术及图像型火灾检测技术的发展和现状,并对图像分割和滤波方法中的关键技术进行了详细介绍,在此基础上,本文分别讨论了火焰和烟雾的分割与识别。 然后,对于火焰分割,针对不同情况下的火焰研究了三种不同的分割技术,实现了火焰区域的准确分割。对于火焰的特征检测,主要进行颜色和动态特征的分析,通过建立火焰颜色模型进行颜色识别,再进一步进行火焰的四个动态特征的识别。对于烟雾分割,由于烟雾颜色的复杂性,采取颜色提取法进行分割,并运用视觉一致性的聚类算法对其进行了改进。对于烟雾的特征检测,主要进行小波特征及动态特征的分析,通过对比烟雾图像与背景图像小波系数进行小波特征识别,再对识别结果进一步进行动态特征识别,包括烟雾的不规则性和扩散性,最终确定视频中是否存在烟雾。 最后,综合以上分析,给出了森林防火系统中火灾的识别的整体流程以及火焰和烟雾分别的识别流程。 实验证明,综合火焰和烟雾的静态特征及动态特征的火灾识别方法,识别率高。在火灾检测技术中,具有较好的发展前景。 关键词火焰识别;烟雾识别;图像分割;动态特征 - I -

人脸图像检测与识别方法综述

综述 《自动化技术与应用》 2004年第 23卷第 12期 Survey 人脸图像检测与识别方法综述 王科俊 ,姚向辉 (哈尔滨工程大学自动化学院 ,黑龙江哈尔滨 150001) 摘要 :本文对人脸识别技术中的检测和识别分成两部分进行了讨论。首先 ,系统的整理分析了人脸检测的各种方法。其次 ,作为 人脸识别技术的第二个环节 ,对人脸的各种识别方法进行了比较性的论述 ,重点讨论了当前热点的识别算法。最后对人脸 识别技术的发展方向进行了展望。 关键词 :人脸检测 ;人脸识别 ;特征提取 ;模式识别 中图分类号 : TP391141 文献标识码 :A 文章编号 : 100327241 (2004) 1220005205 Survey of Human Face Detection and Recognition WANG Ke -jun ,YAO Xiang -hui (College of Automatization , Harbin Engineering University , Harbin 150001 ,China) Abstract :This paper describes the problem of human face detection and recognition. Firstly it synthesizes and analyzes the methods of human face de2 tection systematically from the view of the classification of human face detection ,

图像处理即图像识别过程

图像处理即图像识别过程 图像处理(imageProcessing)利用计算机对图像进行分析,以达到所需的结果。 图像处理可分为模拟图像处理和数字图像图像处理,而图像处理一般指数字图像处理。 这种处理大多数是依赖于软件实现的。 其目的是去除干扰、噪声,将原始图像编程适于计算机进行特征提取的形式,主要包括图像采样、图像增强、图像复原、图像编码与压缩和图像分割。 l)图像采集 图像采集是数字图像数据提取的主要方式。数字图像主要借助于数字摄像机、扫描仪、数码相机等设备经过采样数字化得到的图像,也包括一些动态图像,并可以将其转为数字图像,和文字、图形、声音一起存储在计算机内,显示在计算机的屏幕上。图像的提取是将一个图像变换为适合计算机处理的形式的第一步。 2)图像增强 图像在成像、采集、传输、复制等过程中图像的质量或多或少会造成一定的退化,数字化后的图像视觉效果不是十分满意。为了突出图像中感兴趣的部分,使图像的主体结构更加明确,必须对图像进行改善,即图像增强。通过图像增强,以减少图像中的图像的噪声,改变原来图像的亮度、色彩分布、对比度等参数。图像增强提高了图像的清晰度、图像的质量,使图像中的物体的轮廓更加清晰,细节更加明显。图像增强不考虑图像降质的原因,增强后的图像更加赏欣悦目,为后期的图像分析和图像理解奠定基础。 3)图像复原 图像复原也称图像恢复,由于在获取图像时环境噪声的影响、运动造成的图像模糊、光线的强弱等原因使得图像模糊,为了提取比较清晰的图像需要对图像进行恢复,图像恢复主要采用滤波方法,从降质的图像恢复原始图。图像复原的另一种特殊技术是图像重建,该技术是从物体横剖面的一组投影数据建立图像。 4)图像编码与压缩 数字图像的显著特点是数据量庞大,需要占用相当大的存储空间。但基于计算机的网络带宽和的大容量存储器无法进行数据图像的处理、存储、传输。为了能快速方便地在网络环境下传输图像或视频,那么必须对图像进行编码和压缩。目前,图像压缩编码已形成国际标准,如比较著名的静态图像压缩标准JPEG,该标准主要针对图像的分辨率、彩色图像和灰度图像,适用于网络传输的数码相片、彩色照片等方面。由于视频可以被看作是一幅幅不同的但有紧密相关的静态图像的时间序列,因此动态视频的单帧图像压缩可以应用静态图像的压缩标准。图像编码压缩技术可以减少图像的冗余数据量和存储器容量、提高图像传输速度、缩短处理时间。 5)图像分割技术

图像识别中仍然存在的问题及解决思路

图像识别中仍然存在的问题及解决思路 一、摄像系统晃动问题,在对焦侧及中部炉盖进行拍摄时,小的晃动问题并不显示很严重,但对机焦炉盖及上升管拍摄时,由于距离比较远,小的晃动就会造成画面的不稳定,影响识别精度。 晃动的原因:有几种情况,一是由于滑行车在风的作用下东西方向的摆动;二是摄像系统安装于滑行车外部支架上,有一定高低方向的颤动;三是由于云台的旋转俯仰均是齿轮驱动,齿轮配合间隙的晃动会造成一定的晃动。 解决方案:虽然现在的识别程序中已经对晃动进行了配准,但有时仍会由于晃动造成误判,因此考虑从硬件及软件两方面着手进行改善,硬件上解决滑行车摆动最理想的方案是采用双轨,但考虑到成本会增加较多,在王工新的设计中将摄像系统由滑行车外部移到中部应该对上下的颤动会有改善。云台齿轮间隙的问题,如要解决只能选用新的更精密的云台,考虑到这部分晃动的幅度较小,而且由于这种间隙没有弹性的回力,故在一定风向下一般不会发生来回的晃动,可不考虑。 软件的方面,现在所用的晃动图像配准方法有两个问题,一是由于运算量较大,现在只对晃动严重的上下方向进行了配准,对横向的晃动未进行配准。二是配准的算法上应该还有一定的提高空间(主要是降低运算量及提高配准精度),新来的小张由于研究生专业就是图像识别,考虑让他在这方面做一些工作(除了配准这部分,从整个识别算法上也可以做一个重新的考虑)。 另一个张总曾提出的软件解决方案是,在拍摄瞬时风速超过一定范围后,识别结果均定为不泄漏。 二、逆光问题,在下午的拍摄中,逆光是影响识别效果最严重的一个因素(对焦侧炉盖的拍摄基本没影响,对中间炉盖有一定影响同,对机侧炉盖及上升管拍摄影响很大),在逆光时拍摄回的画面,即使人工来识别,也已经无法判断泄漏与不泄漏,这种情况下计算机识别已经无能为力。 逆光原因:由于焦炉是南北走向,我们的摄像系统安装于焦炉东侧的焦侧方向,在下午对机侧炉盖及上升管拍摄时,阳光正好照射在摄像机护罩玻璃上,导致摄回的图像均变成灰色。除不能识别外,有时还会由于中部光线强度的变化导致一些误判。

遥感影像中建筑物提取研究综述

基于遥感影像的建筑物提取研究方法综述 摘要:遥感影像上建筑物提取的基础理论研究始于20世纪80年代,随着遥感技术的不断进步,遥感影像的分辨率及精确度越来越高以及快速发展的城市在城市空间数据库方面的巨大要求。现在城市空间数据库需要对数据快速获取更新,又因为遥感影像本身具有的现时性,更新速度快的特点。在城市空间数据库的更新、城市动态监测、城市变化监测以及“智慧城市”建设等方面有着重要的使用价值。本文介绍基于不同遥感影像提取建筑物的基本方法和几个发展趋势。主要包括SAR图像,LIDAR点云数据,高光谱影像,航空影像等多种源数据不同的提取方法,以及不同数据来源的优缺点。同时对建筑物提取研究中需要解决的问题和研究趋势进行了总结。 1.引言 城市地区的遥感影像中,超过8成的目标是建筑物和道路,所以对建筑物和道路的识别和提取式遥感影像地物提取的主要研究方向,除道路和建筑物以外,剩下的大部分都是植被,在城市中绿地的面积占了一定的比例,在建筑物的提取中,建筑物在遥感影像中容易受到植被的干扰,如何高效率、高质量的剔除植被对建筑物的影响成了建筑物提取的关键。进行建筑物提取的主要应用有城区自动提取、 地图更新、城市变化监测、城市规划、三维建模、数字化城市建立等诸多方面,如何实现建筑物的快速、高精度、自动化提取成为目前的研究热点。目前对绿地和水体的自动提取已经比较成熟,而道路和建筑物由于其自身的复杂性导致自动提取困难,本文主要提出了目前遥感影像建筑物提取研究的热点及其发展趋势。 2.建筑物提取的历史发展 快速准确地获取不同类型城市建筑的空间位置、形状等信息具有极其重要的意义,在城市规划、城市动态监测、城市三维建模、地形图更新、地籍调查等方面有广泛的应用。目前,对自动建立城市三维模型和实现城市虚拟现实的需求越来越多,利用大比例尺航空影像获取城市建筑物的三维几何信息和表面纹理,是实现“三维城市”建模的有效途径之一。 到目前为止,利用高分辨率航空相片或卫星影像提取建筑物等人工地物信息的方法大体分为两类:其一,利用图像信息结合高程信息进行建筑物信息提取,因为城市里的建筑物有一定的高度信息,通过建筑物与周围环境(地面)之间的高差进行屋顶边界的提取,这种方法大多需要一定的辅助数据如DEM、DSM等一类具有地物高程数据的影像。其二,利用高空间分辨率遥感影像数据结合计算

基于matlab数字图像处理与识别系统含程序

目录 第一章绪论 (2) 1.1 研究背景 (2) 1.2 人脸图像识别的应用前景 (3) 1.3 本文研究的问题 (4) 1.4 识别系统构成 (4) 1.5 论文的内容及组织 (5) 第二章图像处理的Matlab实现 (6) 2.1 Matlab简介 (6) 2.2 数字图像处理及过程 (6) 2.2.1图像处理的基本操作 (6) 2.2.2图像类型的转换 (7) 2.2.3图像增强 (7) 2.2.4边缘检测 (8) 2.3图像处理功能的Matlab实现实例 (8) 2.4 本章小结 (11) 第三章人脸图像识别计算机系统 (11) 3.1 引言 (11) 3.2系统基本机构 (12) 3.3 人脸检测定位算法 (13) 3.4 人脸图像的预处理 (18) 3.4.1 仿真系统中实现的人脸图像预处理方法 (19) 第四章基于直方图的人脸识别实现 (21) 4.1识别理论 (21) 4.2 人脸识别的matlab实现 (21) 4.3 本章小结 (22) 第五章总结 (22) 致谢 (23) 参考文献 (24) 附录 (25)

第一章绪论 本章提出了本文的研究背景及应用前景。首先阐述了人脸图像识别意义;然后介绍了人脸图像识别研究中存在的问题;接着介绍了自动人脸识别系统的一般框架构成;最后简要地介绍了本文的主要工作和章节结构。 1.1 研究背景 自70年代以来.随着人工智能技术的兴起.以及人类视觉研究的进展.人们逐渐对人脸图像的机器识别投入很大的热情,并形成了一个人脸图像识别研究领域,.这一领域除了它的重大理论价值外,也极具实用价值。 在进行人工智能的研究中,人们一直想做的事情就是让机器具有像人类一样的思考能力,以及识别事物、处理事物的能力,因此从解剖学、心理学、行为感知学等各个角度来探求人类的思维机制、以及感知事物、处理事物的机制,并努力将这些机制用于实践,如各种智能机器人的研制。人脸图像的机器识别研究就是在这种背景下兴起的,因为人们发现许多对于人类而言可以轻易做到的事情,而让机器来实现却很难,如人脸图像的识别,语音识别,自然语言理解等。如果能够开发出具有像人类一样的机器识别机制,就能够逐步地了解人类是如何存储信息,并进行处理的,从而最终了解人类的思维机制。 同时,进行人脸图像识别研究也具有很大的使用价依。如同人的指纹一样,人脸也具有唯一性,也可用来鉴别一个人的身份。现在己有实用的计算机自动指纹识别系统面世,并在安检等部门得到应用,但还没有通用成熟的人脸自动识别系统出现。人脸图像的自动识别系统较之指纹识别系统、DNA鉴定等更具方便性,因为它取样方便,可以不接触目标就进行识别,从而开发研究的实际意义更大。并且与指纹图像不同的是,人脸图像受很多因素的干扰:人脸表情的多样性;以及外在的成像过程中的光照,图像尺寸,旋转,姿势变化等。使得同一个人,

高分辨率遥感影像中建筑物阴影检测与提取研究

本科毕业论文 题目:高分辨率遥感影像中建筑 物阴影检测与提取研究院(部):土木工程学院 专业:测绘工程 班级:测绘081 姓名:!@#$%^&* 学号:1234567890 指导教师:(!@#$%^&) 完成日期:2012年6月10日

目录 摘要......................................................................................................................................III ABSTRACT.................................................................................................................................IV 1前言.. (1) 1.1研究背景 (1) 1.2研究目地及意义 (1) 1.3国内外研究的现状及发展 (1) 1.4本文的研究内容及目标 (2) 2遥感影像阴影特征与面向对象的提取原理 (4) 2.1建筑物阴影的特点 (4) 2.2建筑物阴影的光学性质 (4) 2.3高分辨率遥感影像的特点 (5) 2.4面向对象的阴影检测与提取原理分析 (6) 3遥感影像的预处理 (7) 3.1齐鲁软件园遥感影像的几何校正 (7) 3.2软件园影像的分割 (8) 4ECOGNITION8.0对遥感影像进行面向对象的矢量化处理 (11) 4.1加载齐鲁软件园预处理后的遥感影像 (12) 4.2分别对每个子影像进行CHESSBOARD棋盘分割 (13) 4.3根据阴影的光学特性添加各种算法 (14) 4.4分别对子影像进行多尺度分割 (15) 4.5数据的导出 (18)

图像识别方法及系统与相关技术

本技术公开了一种图像识别方法及系统,包括获取目标图像;对输入的目标图像进行预处理;在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的提取能力,并将特征放大,将放大后的特征进行融合,获取特征融合后的特征表达;采用分类器对融合后的特征进行图像分类;对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。通过添加特征提取层,将图像特征放大并融合,有利于某些特征不明显的图像的提取,从而能够有效的提升图像识别率。 技术要求 1.一种图像识别方法,其特征在于,包括如下步骤: 步骤1,获取目标图像,所述目标图像为待识别的图像; 步骤2,对输入的目标图像进行预处理; 步骤3,在预设的卷积神经网络结构中加入特征提取层增强卷积神经网络对于图像特征的 提取能力,并将特征放大;

步骤4,将放大后的特征进行融合,获取特征融合后的特征表达; 步骤5,采用分类器对融合后的特征进行图像分类; 步骤6,对分类后的图像特征进行卷积操作学习辨认,得到卷积神经网络的输出。 2.根据权利要求1所述的图像识别方法,其特征在于,所述对目标图像进行预处理包括将目标图像转化为灰度图像,采取图像调整和直方图均衡化操作来增强图像对比度。 3.根据权利要求1所述的图像识别方法,其特征在于,所述步骤3的特征放大采用将特征点在RGB空间变换到HLS色彩空间,变换公式如下: Vmax=max(R,G,B) Vmin=min(R,G,B) L = V m a x + V min 2 S = V max - V min V max + V min L &lt; 0.5 V max - V min 2 - ( V max + V min ) L &GreaterEqual; 0.5

相关文档
最新文档