(完整版)图像识别匹配技术原理

(完整版)图像识别匹配技术原理
(完整版)图像识别匹配技术原理

第1章绪论

1.1研究背景及意义

数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。通常,像素在计算机中保存为二维整数数组的光栅图像,这些值经常用压缩格式进行传输和储存。数字图像可以由许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型,三维几何模型是计算机图形学的一个主要分支。数字图像处理领域就是研究它们的变换算法。

数字图像处理(Digital Image Processing)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。

图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。

图像配准的方法迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其所采用的算法称之为图像相关等等。

基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。

目前主要图像配准方法有基于互信息的配准方法,基于相关性的配准方法和基于梯度的配准方法。其中基于梯度的方法基本很少单独使用,而作为一个辅助

性的测度与其它方法相结合起来使用。基于灰度的配准算法是医学图像配准研究的发展方向,也是目前研究的热点之一。基于灰度的配准方法与基于特征的配准方法的区别在于前者没有提取图像特征的步骤,直接对图像中的灰度进行处理。基于灰度的配准方法计算复杂度高、对图像的灰度、旋转、形变以及遮挡都比较敏感。

灰度相关的配准方法是从待拼接图像的灰度值出发,图像拼接故而成为灰度相关的配准算法的一个基础。图像拼接(image mosaic)技术是将一组相互间重叠部分的图像序列进行空间匹配对准,经重采样合成后形成一幅包含各图像序列信息的宽视角场景的、完整的、高清晰的新图像的技术。图像拼接在摄影测量学、计算机视觉、遥感图像处理、医学图像分析、计算机图形学等领域有着广泛的应用价值。

灰度相关的图像配准算法在图像处理技术中起着十分关键的作用,它是图像处理技术得以发展的一个重要基础。它推动着图像处理技术在医学、生物、信息处理和其他很多高科技领域内的应用,它已渐渐发展成社会生活中不可分离的一种技术,对于图像处理技术发展及应用具有重要意义。

1.2图像配准方法概述

配准技术的流程如下:首先对两幅图像进行特征提取得到特征点;通过进行相似性度量找到匹配的特征点对;然后通过匹配的特征点对得到图像空间坐标变换参数:最后由坐标变换参数进行图像配准。而特征提取是配准技术中的关键,准确的特征提取为特征匹配的成功进行提供了保障。因此,寻求具有良好不变性和准确性的特征提取方法,对于匹配精度至关重要。

图像配准的方式可以概括为相对配准和绝对配准两种:相对配准是指选择多图像中的一张图像作为参考图像,将其它的相关图像与之配准,其坐标系统是任意的。绝对配准是指先定义一个控制网格,所有的图像相对于这个网格来进行配准,也就是分别完成各分量图像的几何校正来实现坐标系的统一。本文主要研究大幅面多图像的相对配准,因此如何确定多图像之间的配准函数映射关系是图像配准的关键。通常通过一个适当的多项式来拟合两图像之间的平移、旋转和仿射变换,由此将图像配准函数映射关系转化为如何确定多项式的系数,最终转化为如何确定配准控制RCP。

目前,根据如何确定RCP的方法和图像配准中利用的图像信息区别可将

图像配准方法分为三个主要类别:基于灰度信息法、变换域法和基于特征法,其中基于特征法又可以根据所用的特征属性的不同而细分为若干类别。以下将根据这一分类原则来讨论目前已经报道的各种图像配准方法和原理。

1.3研究现状

国外从20世纪60年代就开始在图像配准领域进行研究,但直到1980年代才开始引起学者们的关注。到上世纪末,单模图像配准问题已基本解决,但多模图像配准由于涉及模式和领域的复杂性,仍需密切关注。国际上对图像配准技术曾做过调查,其结论是1990年代初技术就明显增加。而国内从1990年代初才开始涉足此领域。与灰度相关的图像配准算法是图像配准算法中比较经典的一种,很多配准技术都以它为基础进行延伸和扩展。

针对多光谱遥感图像,提出了一种基于局部灰度极值的配准方法:通过在基准图像和待配准图像中同步寻找含有灰度极值的小区域,再用多项式对极值区域进行曲面拟合,最后,分别计算小区域的极值点作为特征点进行配准。并用真实和模拟多光谱图像进行了试验结果显示该课题提出具有算法简单和配准精度高的特点。这是与灰度相关图像配准算法有关的一个扩展应用。

1.4研究问题及内容

本文在分析了灰度相关的图像配准算法中的线匹配法、比值匹配法和块匹配法,利用这三种方法分别实现两幅图像在水平垂直位移上的配准,而本课题研究的内容是提出一种基于灰度相关的算法,不仅能实现两幅图在水平和垂直位移的配准,同时也能实现在绕光轴旋转情况下的图像配准。这里提出了一种方法,多尺度模块匹配法。在这三种匹配的环境下,它能实现水平垂直位移上的匹配、缩放以及旋转。同时通过在Matlab编程环境下编程实现相关算法,通过实际图像的配准试验,利用这些结论最终得到精确地配准结果。

第2章 图像配准基本理论

2.1 图像配准的基本介绍

2.1.1 图像配准的描述

图像配准是对取自不同时间,不同传感器或不同视角的同一场景的两幅图像或者多幅图像匹配的过程。图像配准广泛用于多模态图像分析,是医学图像处理的一个重要分支,也是遥感图像处理,目标识别,图像重建,机器人视觉等领域中的关键技术之一,也是图像融合中要预处理的问题,待融合图像之间往往存在偏移、旋转、比例等空间变换关系,图像配准就是将这些图像变换到同一坐标系下,以供融合使用。

2.1.2 图像配准的定义

对于二维图像配准可定义为两幅图像在空间和灰度上的映射[4],如果给定尺寸的二维矩阵1F 和2F 代表两幅图像,1(,)F X Y 和2(,)F X Y 分别表示相应位置

(,)X Y 上的灰度值,

则图像间的映射可表示为:2(,)(1((,)))F X Y G F H X Y =,式中H 表示一个二维空间坐标变换,即(',')(,)X Y H X Y =,且G 是一维灰度变换。

2.1.3 图像配准的步骤

图像配准的基本过程可以分为三个步骤:第一步是为每一个图像信息模式各定义一个坐标系(,)F X Y ,然后再定义这些参考特征之间的失调或相似函数;第二步是分割出图像的参考特征,再定义这些参数特征之间的失调或相似函数;第三步是应用优化算法,使第二步中失调(相似)函数达到全局最小(最大)值,达到两幅图像的配准。其中参考特征和对应优化算法的选择是配准的核心,也是不同配准算法的差异所在。

2.2 图像配准的相关概念

2.2.1 配准基准

通常,图像配准中根据配准基准的特性,可分为基于外部基准的配准和基于内部基准的配准[5],外部基准是指强加于待配准对象的各种人造标记,这些标记必须在各种配准模式中都清晰可见且可准确检测到。内部基准是指由图像本身得到的位置相对固定且图像特征明晰的各种配准标识。

2.2.2 映射变换与配准区域

设1f 和2f 表示两幅待匹配的图像,1()1(,)I x I x y =和2(')2(',')I x I x y =分别表示两幅图像的密度函数,其中(,)x x y =和'(',')x x y =分别表示在图像1D 和2D 中的像素坐标。图像匹配就是要找到一个把图像1f 映射到图像2f 的变换()((,),(,))M x U x y V x y =,使得变换后的图像3(())I M x 和2(')I x 具有几何对应性。这种映射变换有刚体变换、仿射变换、投影变换以及曲线变换等。配准时的变换区域根据实际需要又分为局部配准和全局配准。局部变换一般很少直接使用,因为它会破坏图像的局部连续性,且变换的双映射性会影响图像的再采样。从近期关于图像配准方面的文章看,一般刚性和仿射多用于全局变换,而曲线变换多用于局部变换。

2.2.3 配准的交互性与优化

根据人的参与程序配准又可分为全自动式,交互式和半自动式三种。全自动式中使用者仅需给相应算法提供图像数据以及图像获取的一些可能信息;交互式中使用者必须亲自进行配准,软件仅给目前变换提供一个可视的或数字的感官印象以及初始变换的一个可能参数;半自动式中,交互式有两种方式:一种是使用者须初始化算法,如分割数据,另一种是指导算法,如拒绝或接受配准假设。

配准变换的参数可以是直接计算出的,也可以是搜索计算出的。直接计算的最优化方法一般已完全由实例决定,所能研究的工作也仅限于如何使用非常少的信息把此计算方法应用于实际。搜索计算的最优化方法大多都可以用待优化的变换参数的一个标准数学函数来表达配准实例,此函数力图使图像在某一变换时两幅图像可达到最大相似。这些函数通常在单模配准中能简单一些,因为此时图像的相似性更能容易直接定义。我们可以通过使用一个标准的、合适的最优化方法使相似函数达到最优。

目前应用比较广泛的方法有Powell 的方法、Downhill Simplex 方法、Brent 的方法以及一系列一维搜索算法、Levenberg-Marquardt 最优化算法、Newton-Raph son 迭代算法、stochastic 搜索算法、梯度下降法(gradient descent methods )、遗传算法(genetic methods )、模拟退火法(simulated annealing ),粒子群算法(partice sworm ),蚁群算法(ant ),几何散列法(geometric hashing )。多分辨率(如金字塔)和多尺度方法可以加速最优化的收敛速度。许多实际应用中使用了不止一种最优化方法,一般是先使用一种粗糙但快速的算法,然后再接着使用一种准确但运算速度慢的算法。

2.2.4 图像成像模式与配准方法的分类

有单模式和多模式等,单模(monomodality)图像配准是指待配准的两幅图像是同一种成像设备获取的。多模(multimodality)图像配准[6]是指待配准的两幅图像来源于不同的成像设备。基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、最大互信息法和基于小波变换的图像配准法。

(1) 互相关法

对于同一物体由于各种图像获取条件的差异或物体自身发生的空间位置的改变而产生的单模图像配准问题常常应用互相关法。在互相关法中互相关值的大小反映了配准的效果。互相关法的思路是找出使各图像之间相关性最大的空间变换参数来实现图像的配准。该方法通过优化两幅图像间的相似性测度来估计空间变换参数(刚体的平移和旋转参数),采用的相似性测度可以是多种多样的,例如相关系数,差值的平方和及相关函数等。其中最经典的相似性测度是归一化的相关系数(correlation coefficient , CC ),

即:

, (2.1)

式中,F 为模板图像,{}1

1N n n F f -==,n f 为图像F 的灰度;G 为与F 有相同大

小的目标图像{}11N n n G g -==,n g 为图像G 的灰度;f 和g 分别为图像F 和G 灰度的均方值。由于要对每种变换参数可能的取值都要计算一次相似性测度,互相关法的计算量比较庞大,因此近年来发展了快速搜索算法,例如,用相位相关傅立叶法估算平移和旋转参数;用遗传算法和模拟退火技术减少搜索时间和克服局部极值问题。

尤其注意的是互相关法受到不同模态成像特点的影响,例如同一物体在不同的模态图像中表现出纹理和密度的非线性差异,使相关性计算无意义,故互相关性法主要局限于单模图像配准[7]。对于条件不好或曲线不完全闭合的图像配准,Kaneko 等提出了一种选择性相关系数法(selective correlation coefficient ,即SCC ),SCC 实际上是CC 的扩展,SCC 在每次为其计算时间仅仅依靠两幅图像灰度的比较过程,故其代价非常小甚至可以忽略不计。

(2) 最大互信息法(Maximization of Mutual Information)

互信息是信息论的一个基本概念,是两个随机变量统计相关性的测度。最大互信息法几乎可以用在任何不同模式图像的配准,特别是当其中一个图像的数据部分缺损时也能得到很好的配准效果。当含有相同内容的两幅图像通过几何变换在空间对齐时,它们所包含的灰度值的互信息量最大。因此最大化的互信息量可以作为图像配准准则。

基于最大互信息[8]的配准过程实质上是搜索最佳的几何变换参数,使两幅图像的互信息达到最大。该方法采用整幅图像的所有像素共同组成特征空间,再根据特征空间确定一种空间变换,使一幅图像经过该变换后和另一幅图像的互信息最大,最终实现配准。

互信息(Mutual Information ,MI )是信息论中的一个测度,用于描述两个变量间的统计相关性,或一个变量中包含的另一个变量中的信息的多少,表示两个随机变量之间的依赖程度,一般用熵来表示。熵表达的是一个系数的复杂性和不确定性。变量A 的熵定义为: ()()log ()A A a

H A P a P a -=∑, (2.2)

,(,)(,).log (,)AB AB a b

H A B P a b P a b =∑, (2.3)

将待配准的两幅医学图像定义为浮动图像A 和参考图像B ,它们是关于图像灰度的两个随机变量集。设它们的边缘概率分布分别为()PA a 、()PB b ,联合概率分布(,)PAB a b ,则它们的互信息(,)MI A B 为:

,(2.4)当两幅图像的空间位置达到一致时,其中一幅图像表达另一幅图像的信息,即其互信息应为最大。继互信息测度提出后,学者们对基于Shannon熵的方法做了进一步的研究,相继提出了比互信息更为稳定的,其它一些形式的熵测度,称为归一化的互信息,例如Studholme提出了归一化互信息测度(nrimalized mutual information,NMI):

, (2.5)(3)基于小波的图像配准方法

近年来图像配准的重要发展之一是采用小波变换进行图像局部特征提取,该方法的关键技术是二维离散小波分解。设在,x y平面内的二维图像

,基于二维离散小波变换的图像分解是将该原始图像在某一尺度上分别在,x y方向上进行小波分解,每次分解后的低频

部分用L表示,高频部分用H表示。

在某一尺度上,图像可以经过x方向和y方向的离散小波变换后分解为4个子图像,在x方向和y方向都是高频子图像(,)

fHH xi yi,在x方向是低频,在y方向是高频子图像(,)

fLH xi yi和在x方向是高频y方向是低频的子图像fHL xi yi。低频子图像给出了原图像的概貌,高频子图像给出了原图像的细貌。

(,)

对于二维正交小波变换有其快速算法-Mallat算法,它把小波变换的计算问题转化为小波变换后系数的计算问题:在实际操作中,给出1

M+尺度层上的离散采样值{1(,)}

+数据,要计算M尺度层上的小波变换系数,即分解算法fM m n

的问题。基于小波变换的图像配准方法有多分辨率分析的优势,能够提高配准的速度。

2.3灰度相关的配准方法

基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。

互相关法是最基本的基于灰度统计的图像配准[9]方法,通常被用于进行模板匹配和模式识别。它是一种匹配度量,通过计算模板图像和搜索窗口之间的互相关值,来确定匹配的程度,互相关值最大时的搜索窗口位置决定了模板图像在待配准图像中的位置。

序贯相似度检测匹配法(Sequential Similarity Detection Algorithms,SSDA)是由Barnea等人提出来的。SSDA方法的最主要的特点是处理速度快。该方法先选择一个简单的固定门限T,若在某点上计算两幅图像残差和的过程中,残差和大于该固定门限T,就认为当前点不是匹配点,从而终止当前的残差和的计算,转向别的点去计算残差和,最后认为残差和增长最慢的点就是匹配点。这种方法的基本思想是基于对误差的积累进行分析。所以对于大部分非匹配点来说,只需计算模板中的前几个像素点,而只有匹配点附近的点才需要计算整个模板。这样平均起来每一点的运算次数将远远小于实测图像的点数,从而达到减少整个匹配过程计算量的目的。

交互信息法最初是Viola等人于1995年把交互信息引入到图像配准的领域的,它是基于信息理论的交互信息相似性准则。初衷是为了解决多模态医学图像的配准问题。

交互信息用来比较两幅图像的统计依赖性。首先将图像的灰度视作具有独立样本的空间均匀随机过程,相关的随机场可以采用高斯—马尔科夫随机场模型建立,用统计特征[10]概率密度函数来描述图像的统计性质。交互信息是两个随机变量A和B之间统计相关性的量度,或是一个变量包含另一个变量的信息量的量度。交互信息图像配准方法一经提出,有不少基于此类的研究,尤其在医学图像的配准问题上。比如将交互信息和梯度结合起来改善其极值性能的算法、多分辨率图像金字塔法等等。但交互信息是建立在概率密度估计的基础上的,有时需要建立参数化的概率密度模型,它要求的计算量很大,并且要求图像之间有很大的重叠区域,由此函数可能出现病态,且有大量的局部极值。

本文接下来将要陈述灰度相关的几种配准方法,大致可分为:线匹配法、比值匹配法和块匹配法。比值匹配法是指将待配准图像的一定间隔的行或列的像素的比值作为模板;块匹配法是指将待配准图像的正方形区域的像素的集合作为模板。比值匹配法是从一幅图像的重叠区域中部分相邻的两列上取出部分像素,然后以它们的比值作为模板,在另一幅图像中搜索最佳匹配,这种算法计算量较小,但精度低;块匹配法是以一幅图像重叠区域中的一块作为模板,在另一幅图像中搜索与此模板最相似的匹配块,这种算法精度较高,但计算量过大。而设计一种基于灰度相关的算法,既能实现水平、垂直位移上的配准,同时也能实现绕光轴旋转这种情况是本文的核心。

第3章 线匹配法

3.1 线匹配法基本介绍及原理

针对图像的平移、旋转、尺度变换等整体匹配,提出了一种图像线性变换的匹配算法[11]。首先定义待匹配图像匹配点间的线性变换模型,以对应像素灰度差平方和作为图像匹配误差函数,然后借助最小化误差函数确定参数迭代增量,由迭代法求得最佳线性变换参数。为减少计算量与提高收敛速度提出了三种改进策略:增加权函数、图像网格点采样和增加加速运动量。实验显示对于小范围平移、旋转及尺度变换的图像能进行准确快速的整体匹配,而改进策略能有效提高匹配速度。

3.2 线性变换图像匹配模型

令待匹配的两幅二维图像为F 和G ,两幅图像中任意一对匹配点的坐标满足线性变换关系。令图像G 中某一坐标为[,]T X x y =,它与图像F 中的坐标Y 对应21(,)X Y R ?∈。上式中上标T 表示转置运算。坐标X 与Y 之间存在一个偏移量T ,定义如下:

~12345

6,a a x a y T X a a a x a y ++??=??++??@ (3.1) ~

1,,,0,0,0,0,0,0,1,,x y X x y ??=???? (3.2) []123456,,,,,T

a a a a a a a = (3.3)

因此坐标变换可以表示为Y X T =+,即像素()G X 与()F X T +对应。 3.3 线匹配法具体的算法实现

如果给定条件,两幅图像内容整体间存在某种线性变换,则通过求解变换系数能实现配准。这对很多问题是一种合理假设。基于这一思想,为解决图像整体匹配问题,本文针对图像的平移、旋转、尺度变换等整体匹配,提出一种带6个参数的坐标线性变换图像匹配新模型,该模型将匹配误差定义为图像整体误

差,通过最小化误差函数确定参数迭代增量,由迭代法求得最佳线性变换参数。并且针对收敛速度提出了增加权函数、图像网格点采样和增加加速动量项三种策略及具体实现方法。

(1)误差函数及参数求解算法

图像匹配的误差函数定义为:

2[()()]x R

E F X T G X ∈=+-∑, (3.4)

该公式中领域R 与图像G 的分辨率一致。这种领域设置与光流模型的领域设置存在显著不同,它对噪声更不敏感。通过最小化误差函数可以求出变换参数a ,它决定各像素的偏移量0T 为建立迭代求解模型,引入增量a ?,代入式(3.1)得到T ?,新的模型如下:

6121,,a R T R ???∈?∈ (3.5)

2[()()]x R

E F X T T G X ∈=++?-∑ (3.6)

为求解增量a ?,上述函数需要对a ?求偏导。一种可行方法是将F 函数一阶泰勒展开:

'()()()F X T T F X T F X T T ++?≈+++?? (3.7)

上式中点号表示积。将(3.7)代入(3.6),对a ?求偏导,并令偏导为零,则得到下式:

~~~'[(')(')](()())T T T T

X R X R X F X F a G X F X T X F ∈∈?=-+∑∑ (3.8)

上式中'F 表示'

()F X T +,它用图像F 中坐标X+T 处得灰度梯度近似。~'T

X F 表示六维列向量。求a ?只需对方程(3.8)乘以~~[(')(')]T T T X R X F X F ∈∑的逆矩阵即可。

(2)迭代方法求解变换参数

求解图像G 与图像F 间的匹配,可以用增量迭代法计算变换参数a 向量,算法如下:

①初始化a 向量为零向量;

②按式(3.8)计算参数增量a ?;

③更新参数:a a a a =+?;

④如果a ?的二范数小于某一阈值,则表示迭代收敛,程序退出;若大于该阈值则转到步骤②继续迭代;如果迭代次数超过最多限定次数则程序退出,提示不

收敛。判断收敛的条件也可设置为最近n次迭代a

?的二范数之和小于某一阈值,n的典型取值为3。

3.4实验结果和分析

首先利用配准图像库中的图像,生成具有不同相对位移的子图像;平移配准参数可以在程序中进行调整,图3.1及图3.2为配准参数为112,112

==时生

rx cy

成一对尺寸为400×400的两幅图像。

图3.1 Lena参考图像图3.2 Lena 待配准图像图3.3及图3.4为配准参数为224;224

rx cy

==时生成尺寸为288×288的两幅图像。

图3.3 Lena参考图像图3.4 Lena 待配准图像图3.5及图3.6为配准参数为56;56

==生成尺寸为456×456的两幅图

rx cy

像。

图3.5 Lena参考图像图3.6 Lena 待配准图像图3.7为采用线模板匹配方法的实验结果。黑色线段表示选取的线模板,连线表示线段两端点为匹配点对。

图3.7 Lena线匹配效果图

由实验可知,线模板匹配是在参考图像中选定一行上取出部分像素的灰度值,在搜索图中搜索最佳匹配。线匹配法的优点是精确直观,缺点是操作复杂,重复步骤较多,实用性不强。它只能处理简单的平移变换下的图像配准,容易受光照的影响,不能实现图像旋转和缩放情况下的配准,故而存在一定的局限性,适用性不强。

第4章 比值匹配法

4.1 比值匹配法基本介绍及原理

比值匹配法[12]算法思路是利用图像中两列上的部分像素的比值作为模板,即在参考图像()a 的重叠区域中分别在两列上取出部分像素,用它们的比值作为模板,然后在搜索图()b 中搜索最佳的匹配。匹配的过程是在搜索图()b 中,由左至右依次从间距相同的两列上取出部分像素,并逐一计算其对应像素值比值;然后将这些比值依次与模板进行比较,其最小差值对应的列就是最佳匹配。这样在比较中只利用了一组数据,而这组数据利用了两列像素及其所包含的信息。

图4.1为图像模板选取示意图,其中,图1 ()a 为1()W H ?像素的图像,图1 ()b 为2()W H ?像素的图像,1W 和2W 可相等,也可不等。图1()a 和图1()b 为左右重叠关系,图1()a 在图1()b 的左边。

j j+span j j+span

()a 1()W H ?像素的图像 ()b 2()W H ?像素的图像

图4.1 图像模板选取示意图

在图4.1()a 的重叠区域选取间隔为span 的2列像素(第j 列和第j span +列),计算其对应像素比值,即a 为模板。

11()(,)/(,())a i P i j P i j span =+ (4.1)

式中,(1,)i H ∈,j 为选定的列。

在图4.1()b 中从第1列开始依次取间隔为span 的2列,计算其对应像素的比值,即为b 模板。

2122(,)(,)/(,)b i j P i j P i j = (4.2)

计算a 模板与b 模板差值,即为c 模板,函数表达式为:

2(,)((,)/(,))c i j a i j b i j = (4.3)

式中,(1,)i H ∈,2(1,)j W span ∈-。c 为二维数组,对c 对应的列向量求得到sum 。

1()(,)H

i sum j c i j ==∑ (4.4)

()sum j 的大小就反映图1所示图像选定像素对应列的差异,()sum j 的最小值min sum 对应的列坐标min Collable 即为最佳匹配。

4.2 比值匹配法具体的算法实现

该算法的具体实现步骤如下:

(1) 在参考图像()a 中间隔为c 个像素的距离上的两列像素中,各取m 个像素,计算这m 个像素的比值,将m 个比值存入数组中,将其作为比较的模板。

(2) 从搜索图()b 中在同样相隔c 个像素的距离上的两列,各取出m n +个像素,计算其比值,将m n +个比值存入数组。假定垂直错开距离不超过n 个像素,多取的n 个像素则可以解决图像垂直方向上的交错问题。

(3) 利用参考图像()a 中的比值模板在搜索图()b 中寻找相应的匹配。首先进行垂直方向上的比较,即记录下搜索图()b 中每个比值数组内的最佳匹配。再将每个数组的组内最佳匹配进行比较,即进行水平方向的比较,得到的最小值就认为是全局最佳匹配。此时全局最佳匹配即为图像间在水平方向上的偏移距离,该全局最佳匹配队应的组内最佳匹配即为图像间垂直方向上的偏移距离。

本算法的思路是在第1幅图像的重叠区域中分别在2列取出部分像素,用它们的比值作为模板;在第2幅图像中由左至右依次从间距相同2列取出部分像素,并逐一计算其对应像素值比值;然后将这些比值依次与模板进行比较,其最小差值所对应的列就是最佳匹配。

4.3 实验结果和分析

以下是光照效果由弱到强的比值匹配仿真实验结果图。比值匹配和线匹配相比不同之处是通过不同亮度的调节可检测到配准参数,由此可以看出它们的区别。比值匹配是利用两条线段的比值进行匹配。灰度比值匹配法较线匹配法多了一项光照对平移参数的影响,下面我们以平移参数为主,着重研究输入图像存在

亮度差异时,仿真图像配准的实验效果。

图4.2为待配准图像与参考图像之间存在亮度差异为-20%时的配准效果图。

图4.2 Lena灰度比值匹配图(亮度差异-20%)

图4.3为待配准图像与参考图像之间存在亮度差异为+5%时的配准效果图。

图4.3 Lena灰度比值匹配图(亮度差异+5%)

图4.4为待配准图像与参考图像之间存在亮度差异为+20%时的配准效果图。

图4.4 Lena灰度比值匹配图(亮度差异+20%)

由图4.2-图4.4可以看出灰度比值匹配的优缺点如下:

(1)比值匹配法的优点:

a.算法思路清晰简单,容易理解,实现起来比较方便。

b.匹配计算的时候,计算量小,速度快。

(2) 比值匹配法的缺点:

a.利用图像的特征信息太少。只利用了两条竖直的平行特征线段的像素的信息,没有能够充分利用了图像重叠区域的大部分特征信息。虽然算法提到,在搜索图()b中由左至右依次从间距相同的两列上取出部分像素,计算其对应像素的比值,然后将这些比值依次与模版进行比较,好像是利用了搜索图()b中的重叠区域的大部分图像信息,但在参考图像()a中,只是任意选择了两条特征线,没有充分利用到参考图像()a的重叠区域的特征信息。

b.对图片的采集提出了较高的要求。此算法对照片先进行垂直方向上的比较,然后再进行水平方向上的比较,这样可以解决上下较小的错开问题。在采集的时候只能使照相机在水平方向上移动。然而,有时候不可避免的照相机镜头会有小角度的旋转,使得拍摄出来的照片有一定的旋转,在这个算法中是无法解决的。而且对重叠区域无明显特征的图像,比较背景是海洋或者天空,这样在选取特征模版的时候存在很大的问题。由于照片中存在大块纹理相同的部分,所以与模版的差别就不大,这样有很多匹配点,很容易造成误匹配。

c.不易对两条特征线以及特征线之间的距离进行确定。算法中在参考图像()a的重叠区域中取出两列像素上的部分像素,并没有给出选择的限制。然而在利用拼接算法实现自动拼接的时候,如果选取的特征线不是很恰当,那么这样的特征线算出来的模版就失去了作为模版的意义。同时,在确定特征线间距时,选的过大,则不能充分利用重叠区域的图像信息。选择的过小,则计算量太大。

赵宇凡开题报告-基于图像特征提取与匹配的目标识别系统设计

北京联合大学毕业设计(论文)开题报告 题目:基于图像特征提取与匹配的目标识别系统设计 专业:通信工程指导教师:韩玺 学院:信息学院学号:30 班级:2008080304430姓名:赵宇凡 一、课题任务与目的 1、课题的主要任务:以DSP平台为系统硬件平台,并基于DM6437为处理器核心,设计硬件原理图,编写特征点提取算法,使系统通过特征点匹配对静态目标进行识别。 2、课题的主要目的:设计并实现一个功能完整,操作简单的目标识别系统,使其能够对静态图像目标进行特征提取与匹配,从而进行目标识别。 二、调研资料情况 1、课题的学术状态: (1)DM6437关键特性 时钟频率达600MHz,1个TVP5146M2视频解码器4个视频DACV输出,128MDDR2DRAM,提供16M non-volatile flash memory, 64M NAND flash, 2M SRAM 提供UART, CAN,I/O接口,AIC33立体音频编码器,10/100 MBS以太网接口,可配置的boot load选项,嵌入式的JTAG仿真器接口,4个用户LEDs及4个用户切换点,提供子板扩展插槽,VLYNQ接口,提供S/PDIF接口。 (2)SIFT算法 从理论上说,SIFT是一种相似不变量,即对图像尺度变化和旋转是不变量。然而,由于构造SIFT特征时,在很多细节上进行了特殊处理,使得SIFT对图像的复杂变形和光照变化具有了较强的适应性,同时运算速度比较快,定位精度比较高。如:在多尺度空间采用DOG算子检测关键点,运算速度大大加快;关键点的精确定位不仅提高了精度,而且大大提高了关键点的稳定性;在构造描述子时,以子区域的统计特性,而不是以单个像素作为研究对象,提高了对图像局部变形的适应能力;对于16*16的关键点邻域和4*4的子区域,在处理梯度幅度时都进行了类似于高斯函数的加权处理,强化了中心区域,淡化了边缘区域的影响,从而提高了算法对几何变形的适应性;该方法不仅对通用的线

基于matlab的图像识别与匹配

基于matlab的图像识别与匹配 摘要 图像的识别与匹配是立体视觉的一个重要分支,该项技术被广泛应用在航空测绘,星球探测机器人导航以及三维重建等领域。 本文意在熟练运用图像的识别与匹配的方法,为此本文使用一个包装袋并对上面的数字进行识别与匹配。首先在包装袋上提取出来要用的数字,然后提取出该数字与包装袋上的特征点,用SIFT方法对两幅图进行识别与匹配,最终得到对应匹配数字的匹配点。仿真结果表明,该方法能够把给定数字与包装袋上的相同数字进行识别与匹配,得到了良好的实验结果,基本完成了识别与匹配的任务。

1 研究内容 图像识别中的模式识别是一种从大量信息和数据出发,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别、评价的过程。 图形辨别是图像识别技术的一个重要分支,图形辨别指通过对图形的图像采用特定算法,从而辨别图形或者数字,通过特征点检测,精确定位特征点,通过将模板与图形或数字匹配,根据匹配结果进行辨别。 2 研究意义 数字图像处理在各个领域都有着非常重要的应用,随着数字时代的到来,视频领域的数字化也必将到来,视频图像处理技术也将会发生日新月异的变化。在多媒体技术的各个领域中,视频处理技术占有非常重要的地位,被广泛的使用于农业,智能交通,汽车电子,网络多媒体通信,实时监控系统等诸多方面。因此,现今对技术领域的研究已日趋活跃和繁荣。而图像识别也同样有着更重要的作用。 3 设计原理 3.1 算法选择 Harris 角点检测器对于图像尺度变化非常敏感,这在很大程度上限制了它的应用范围。对于仅存在平移、旋转以及很小尺度变换的图像,基于Harris 特征点的方法都可以得到准确的配准结果,但是对于存在大尺度变换的图像,这一类方法将无法保证正确的配准和拼接。后来,研究人员相继提出了具有尺度不变性的特征点检测方法,具有仿射不变性的特征点检测方法,局部不变性的特征检测方法等大量的基于不变量技术的特征检测方法。 David.Lowe 于2004年在上述算法的基础上,总结了现有的基于不变量技术的特征检测方法,正式提出了一种基于尺度空间的,对图像平移、旋转、缩放、甚至仿射变换保持不变性的图像局部特征,以及基于该特征的描述符。并将这种方法命名为尺度不变特征变换(Scale Invariant Feature Transform),以下简称SIFT 算法。SIFT 算法首先在尺度空间进行特征检测,并确定特征点的位置和特征点所处的尺度,然后使用特征点邻域梯度的主方向作为该特征点的方向特征,以实现算子对尺度和方向的无关性。利用SIFT 算法从图像中提取出的特征可用于同一个物体或场景的可靠匹配,对图像尺度和旋转具有不变性,对光照变化、

非常全非常详细的MATLAB数字图像处理技术

MATLAB数字图像处理 1 概述 BW=dither(I)灰度转成二值图; X=dither(RGB,map)RGB转成灰度图,用户需要提供一个Colormap; [X,map]=gray2ind(I,n)灰度到索引; [X,map]=gray2ind(BW,n)二值图到索引,map可由gray(n)产生。灰度图n默认64,二值图默认2; X=graylice(I,n)灰度图到索引图,门限1/n,2/n,…,(n-1)/n,X=graylice(I,v)给定门限向量v; BW=im2bw(I,level)灰度图I到二值图; BW=im2bw(X,map,level)索引图X到二值图;level是阈值门限,超过像素为1,其余置0,level在[0,1]之间。 BW=im2bw(RGB,level)RGB到二值图; I=ind2gray(X,map)索引图到灰度图; RGB=ind2rgb(X,map)索引图到RGB; I=rgb2gray(RGB)RGB到灰度图。 2 图像运算 2.1 图像的读写 MATLAB支持的图像格式有bmp,gif,ico,jpg,png,cur,pcx,xwd和tif。 读取(imread): [1] A=imread(filename,fmt) [2] [X,map]=imread(filename,fmt) [3] […]=imread(filename) [4] […]=imread(URL,…) 说明:filename是图像文件名,如果不在搜索路径下应是图像的全路径,fmt是图像文件扩展名字符串。前者可读入二值图、灰度图、彩图(主要是RGB);第二个读入索引图,map 为索引图对应的Colormap,即其相关联的颜色映射表,若不是索引图则map为空。URL表示引自Internet URL中的图像。 写入(imwrite): [1] R=imwrite(A,filename,fmt); [2] R=imwrite(X,map,filename,fmt); [3] R=imwrite(…,filename); [4] R=imwrite(…,Param1,V al1,Param2,Val2) 说明:针对第四个,该语句用于指定HDF,JPEG,PBM,PGM,PNG,PPM,TIFF等类型输出文件的不同参数。例如HDF的Quality,Compression,WriteMode;JPEG的BitDepth,Comment:Empty or not,Mode:lossy or lossless,Quality等。 2.2 图像的显示 方法1:使用Image Viewer(图像浏览器),即运用imview函数。 同时显示多帧图像的所有帧,可用到montage函数。

(完整版)图像特征特点及常用的特征提取与匹配方法

图像特征特点及常用的特征提取与匹配方法 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1) 颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2) 颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡 的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3) 颜色矩

图像分割算法研究与实现

中北大学 课程设计说明书 学生姓名:梁一才学号:10050644X30 学院:信息商务学院 专业:电子信息工程 题目:信息处理综合实践: 图像分割算法研究与实现 指导教师:陈平职称: 副教授 2013 年 12 月 15 日

中北大学 课程设计任务书 13/14 学年第一学期 学院:信息商务学院 专业:电子信息工程 学生姓名:焦晶晶学号:10050644X07 学生姓名:郑晓峰学号:10050644X22 学生姓名:梁一才学号:10050644X30 课程设计题目:信息处理综合实践: 图像分割算法研究与实现 起迄日期:2013年12月16日~2013年12月27日课程设计地点:电子信息科学与技术专业实验室指导教师:陈平 系主任:王浩全 下达任务书日期: 2013 年12月15 日

课程设计任务书 1.设计目的: 1、通过本课程设计的学习,学生将复习所学的专业知识,使课堂学习的理论知识应用于实践,通过本课程设计的实践使学生具有一定的实践操作能力; 2、掌握Matlab使用方法,能熟练运用该软件设计并完成相应的信息处理; 3、通过图像处理实践的课程设计,掌握设计图像处理软件系统的思维方法和基本开发过程。 2.设计内容和要求(包括原始数据、技术参数、条件、设计要求等): (1)编程实现分水岭算法的图像分割; (2)编程实现区域分裂合并法; (3)对比分析两种分割算法的分割效果; (4)要求每位学生进行查阅相关资料,并写出自己的报告。注意每个学生的报告要有所侧重,写出自己所做的内容。 3.设计工作任务及工作量的要求〔包括课程设计计算说明书(论文)、图纸、实物样品等〕: 每个同学独立完成自己的任务,每人写一份设计报告,在课程设计论文中写明自己设计的部分,给出设计结果。

仪表显示的图像识别算法研究

仪表显示的图像识别算法研究 摘要:随着社会的逐渐发展,人类的生活越来越趋于智能化。本文根据当今社会对于图像识别研究的发展现状,针对目前人们生活中人工读表的弊端,提出了通过采集仪表显示的图像并进行图像识别算法处理来达到智能自动读表的方法。 为了能快速获得采集数据,减少人们生活中繁复的人工作业。本文通过多样的图像处理来代替人眼识别图像。只需要得到采集到的图像,就可以利用计算机来进行计算和识别,得出最后的数字。本文采用了一系列的图像处理方法,包括图像的去噪,二值化分割,边缘检测和基于数学形态学的膨胀腐蚀操作等。同时通过多种尝试和比较各种方法的优缺点得到了一套简易而又完善,快速的图像识别算法。 在进行多次测试试验后,本文采用数码相机来进行图像的采集,同时经过图像预处理、图像分割、图像识别等一系列流程得出了较为完善的图像采集和识别系统,为未来信息传递智能化提供了基础,对于促进工业发展或是改善生活水平都有重要的意义。 关键词:图像预处理、二值化、边缘检测、形态学、去噪、图像分割、图像匹配 The research of image recognition displayed by the instrument Abstract: With the continuous development of society, people's lives become more and more intelligent. Based on the current development in today's society for the study of image recognition, according to the present disadvantages of manual meter reading in peop le’s lives, this page proposed the way by collecting the instruments display image and then deals it with image recognizing algorithms to achieve intelligent automatic meter. In order to quickly gather data, reducing manual work in people’s lives complicated. The page uses a series of image processing to replace human eye image recognition. Just need the collected images, we can use a computer to calculate and identify, then we will arrive at a final figure. We used a variety of image processing methods, including image denoising, thresholding segmentation, expansion of edge-detection based on mathematical morphology and corrosion and so on. And

视觉检测原理介绍

技术细节 本项目应用了嵌入式中央控制及工业级图像高速传输控制技术,基于CCD/CMOS与DSP/FPGA的图像识别与处理技术,成功建立了光电检测系统。应用模糊控制的精选参数自整定技术,使系统具有对精确检测的自适应调整,实现产品的自动分选功能。 图1 控制系统流程图 光电检测系统主要通过检测被检物的一些特征参数(灰度分布,RGB分值等),从而将缺陷信息从物体中准确地识别出来,通过后续的系统进行下一步操作,主要分为以下几部分 CCD/CMOS图像采集部分 系统图像数据采集处理板中光信号检测元件CCD/CMOS采用进口的适合于高精度检测的动态分析单路输出型、保证实际数据输出速率为320MB/s的面阵CCD/CMOS。像素分别为4000*3000和1600*1200,帧率达到10FPS。使用CCD/CMOS 作为输入图像传感器,从而实现了图像信息从空间域到时间域的变换。为了保证所需的检测精度,需要确定合理的分辨率。根据被检测产品的大小,初步确定系统设计分辨率为像素为0.2mm。将CCD/CMOS接收的光强信号转换成电压幅值,再经过A/D转换后由DSP/ FPGA芯片进行信号采集,即视频信号的量化处理过程,图像采集处理过程如图所示:

图2 图像采集处理过程 数据处理部分 在自动检测中,是利用基于分割的图像匹配算法来进行图像的配对为基础的。图像分割的任务是将图像分解成互不相交的一些区域,每一个区域都满足特定区域的一致性,且是连通的,不同的区域有某种显著的差异性。分割后根据每个区域的特征来进行图像匹配,基于特征的匹配方法一般分为四个步骤:特征检测、建立特征描述、特征匹配、利用匹配的“特征对”求取图像配准模型参数。 算法基本步骤如下: 1)利用图像的色彩、灰度、边缘、纹理等信息对异源图像分别进行分割,提取区域特征; 2)进行搜索匹配,在每一匹配位置将实时图与基准图的分割结果进行融合,得到综合分割结果; 3)利用分割相似度描述或最小新增边缘准则找出正确匹配位置。 设实时图像分割为m个区域,用符号{A1,A2,… Am}表示,其异源基准图像分割为n个区域,用符号{B1,B2,…Bn}表示。分割结果融合方法如下: 在每一个匹配位置,即假设的图像点对应关系成立时,图像点既位于实时图中,又位于其异源基准图像中,则融合后区域点的标识记为:(A1B1,A1B2,…,A2B1,A2B2,…)。标识AiBj表示该点在实时图中位于区域i,在基准图中位于区域j。算法匹配过程如下图所示:

图像特征特点及其常用的特征提取与匹配方法

图像特征特点及其常用的特征提取与匹配方法 [ 2006-9-22 15:53:00 | By: 天若有情 ] 常用的图像特征有颜色特征、纹理特征、形状特征、空间关系特征。 一颜色特征 (一)特点:颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质。一般颜色特征是基于像素点的特征,此时所有属于图像或图像区域的像素都有各自的贡献。由于颜色对图像或图像区域的方向、大小等变化不敏感,所以颜色特征不能很好地捕捉图像中对象的局部特征。另外,仅使用颜色特征查询时,如果数据库很大,常会将许多不需要的图像也检索出来。颜色直方图是最常用的表达颜色特征的方法,其优点是不受图像旋转和平移变化的影响,进一步借助归一化还可不受图像尺度变化的影响,基缺点是没有表达出颜色空间分布的信息。 (二)常用的特征提取与匹配方法 (1)颜色直方图 其优点在于:它能简单描述一幅图像中颜色的全局分布,即不同色彩在整幅图像中所占的比例,特别适用于描述那些难以自动分割的图像和不需要考虑物体空间位置的图像。其缺点在于:它无法描述图像中颜色的局部分布及每种色彩所处的空间位置,即无法描述图像中的某一具体的对象或物体。 最常用的颜色空间:RGB颜色空间、HSV颜色空间。 颜色直方图特征匹配方法:直方图相交法、距离法、中心距法、参考颜色表法、累加颜色直方图法。 (2)颜色集 颜色直方图法是一种全局颜色特征提取与匹配方法,无法区分局部颜色信息。颜色集是对颜色直方图的一种近似首先将图像从RGB颜色空间转化成视觉均衡的颜色空间(如HSV 空间),并将颜色空间量化成若干个柄。然后,用色彩自动分割技术将图像分为若干区域,每个区域用量化颜色空间的某个颜色分量来索引,从而将图像表达为一个二进制的颜色索引集。在图像匹配中,比较不同图像颜色集之间的距离和色彩区域的空间关系 (3)颜色矩 这种方法的数学基础在于:图像中任何的颜色分布均可以用它的矩来表示。此外,由于颜色分布信息主要集中在低阶矩中,因此,仅采用颜色的一阶矩(m ean)、二阶矩(variance)和三阶矩(skewness)就足以表达图像的颜色分布。(4)颜色聚合向量 其核心思想是:将属于直方图每一个柄的像素分成两部分,如果该柄内的某些像素所占据的连续区域的面积大于给定的阈值,则该区域内的像素作为聚合像素,否则作为非聚合像素。 (5)颜色相关图 二纹理特征 (一)特点:纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质。但由于纹理只是一种物体表面的特性,并不能完全反映出物体的本质属性,所以仅仅利用纹理特征是无法获得高层次图像内容的。与颜色特征不同,纹理特征不是基于像素点的特征,它需要在包含多个像素点的区域中进行统计计算。在模式匹配中,这种区域性的特征具有较大的优越性,不会由于局

车辆牌照图像识别算法研究与实现本科毕设论文

Q260046902 专业做论文 西南科技大学 毕业设计(论文)题目名称:车辆牌照图像识别算法研究与实现

车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数字字符识别的问题,本文采用了基于BP神经网络的识别方法。在学习并掌握了数字图像处理和模式识别的一些基本原理后,使用VC++6.0软件利用以上原理针对车牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++

Research and Realization of License Plate Recognition Algorithm Abstract:In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC++ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC++

数字图像处理中的边缘检测技术

课程设计报告 设计题目:数字图像处理中的边缘检测技术学院: 专业: 班级:学号: 学生姓名: 电子邮件: 时间:年月 成绩: 指导教师:

数字图像处理中的边缘检测技术课程设计报告I 目录 1 前言:查阅相关文献资料,了解和掌握基本原理、方法和研究现状,以及实际应用的背景意义 (1) 1.1理论背景 (1) 1.2图像边缘检测技术研究的目的和意义 (1) 1.3国内外研究现状分析 (2) 1.4常用边缘检测方法的基本原理 (3) 2 小波变换和小波包的边缘检测、基于数学形态学的边缘检测法算法原理 (7) 2.1 小波边缘检测的原理 (7) 2.2 数学形态学的边缘检测方法的原理 (7) 3 算法实现部分:程序设计的流程图及其描述 (9) 3.1 小波变换的多尺度边缘检测程序设计算法流程图 (9) 3.2 数学形态学的边缘检测方法程序设计算法描述 (10) 4实验部分:对所给的原始图像进行对比实验,给出相应的实验数据和处理结果 (11) 5分析及结论:对实验结果进行分析比较,最后得出相应的结论 (15) 参考文献 (17) 附录:代码 (18)

1前言 查阅相关文献资料,了解和掌握基本原理、方法和研究现状,以及实际应用的背景意义 1.1 理论背景 图像处理就是对图像信息加工以满足人的视觉心理或应用需求的方法。图像处理方法有光学方法和电子学方法。从20世纪60年代起随着电子计算机和计算技术的不断提高和普及,数字图像处理进入了高速发展时期,而数字图像处理就是利用数字计算机或其它的硬件设备对图像信息转换而得到的电信号进行某些数学处理以提高图像的实用性。 图像处理在遥感技术,医学领域,安全领域,工业生产中有着广泛的应用,其中在医学应用中的超声、核磁共振和CT等技术,安全领域的模式识别技术,工业中的无损检测技术尤其引人注目。 计算机进行图像处理一般有两个目的:(1)产生更适合人观察和识别的图像。 (2)希望能由计算机自动识别和理解图像。数字图像的边缘检测是图像分割、目标区域的识别、区域形状提取等图像分析领域的重要基础,图像处理和分析的第一步往往就是边缘检测。 物体的边缘是以图像的局部特征不连续的形式出现的,也就是指图像局部亮度变化最显著的部分,例如灰度值的突变、颜色的突变、纹理结构的突变等,同时物体的边缘也是不同区域的分界处。图像边缘有方向和幅度两个特性,通常沿边缘的走向灰度变化平缓,垂直于边缘走向的像素灰度变化剧烈。根据灰度变化的特点,图像边缘可分为阶跃型、房顶型和凸缘型。 1.2 图像边缘检测技术研究的目的和意义 数字图像处理是伴随着计算机发展起来的一门新兴学科,随着计算机硬件、软件的高度发展,数字图像处理也在生活中的各个领域得到了广泛的应用。边缘检测技术是图像处理和计算机视觉等领域最基本的技术,如何快速、精确的提取图像边缘信息一直是国内外研究的热点,然而边缘检测也是图像处理中的一个难题。 首先要研究图像边缘检测,就要先研究图像去噪和图像锐化。前者是为了得到飞更真实的图像,排除外界的干扰,后者则是为我们的边缘检测提供图像特征更加明显的图片,即加大图像特征。两者虽然在图像处理中都有重要地位,但本次研究主要是针对图像边缘检测的研究,我们最终所要达到的目的是为了处理速

基于特征的图像匹配算法-毕业论文含源代码

诚信声明 本人声明: 我所呈交的本科毕业设计论文是本人在导师指导下进行的研究工作及取得的研究成果。尽我所知,除了文中特别加以标注和致中所罗列的容以外,论文中不包含其他人已经发表或撰写过的研究成果。与我一同工作的同志对本研究所做的任何贡献均已在论文中作了明确的说明并表示了意。本人完全意识到本声明的法律结果由本人承担。 申请学位论文与资料若有不实之处,本人承担一切相关责任。 本人签名:日期:2010 年05 月20日

毕业设计(论文)任务书 设计(论文)题目: 学院:专业:班级: 学生指导教师(含职称):专业负责人: 1.设计(论文)的主要任务及目标 (1) 了解图象匹配技术的发展和应用情况,尤其是基于特征的图象匹配技术的发展和应用。 (2) 学习并掌握图像匹配方法,按要求完成算法 2.设计(论文)的基本要求和容 (1)查阅相关中、英文文献,完成5000汉字的与设计容有关的英文资料的翻译。(2)查阅15篇以上参考文献,其中至少5篇为外文文献,对目前国外图象匹配技术的发展和应用进行全面综述。 (3)学习图象匹配算法,尤其是基于特征的图象匹配算法。 (4)实现并分析至少两种基于特征的图象匹配算法,并分析算法性能。 3.主要参考文献 [1]谭磊, 桦, 薛彦斌.一种基于特征点的图像匹配算法[J].天津理工大学报,2006, 22(6),66-69. [2]甘进,王晓丹,权文.基于特征点的快速匹配算法[J].电光与控制,2009,16(2), 65-66. [3]王军,明柱.图像匹配算法的研究进展[J].大气与环境光学学报,2007,2(1), 12-15.

4

图像识别匹配技术原理

第1章绪论 1?1研究背景及意义 数字图像,又称数码图像或数位图像,是二维图像用有限数字数值像素的表示。通常,像素在计算机中保存为二维整数数组的光栅图像,这些值经常用压缩格式进行传输和储存。数字图像可以由许多不同的输入设备和技术生成,例如数码相机、扫描仪、坐标测量机等,也可以从任意的非图像数据合成得到,例如数学函数或者三维几何模型,三维几何模型是计算机图形学的一个主要分支。数字图像处理领域就是研究它们的变换算法。 数字图像处理(Digital Image Process in g)是通过计算机对图像进行去除噪声、增强、复原、分割、提取特征等处理的方法和技术。数字图像处理的产生和迅速发展主要受三个因素的影响:一是计算机的发展;二是数学的发展(特别是离散数学理论的创立和完善);三是广泛的农牧业、林业、环境、军事、工业和医学等方面的应用需求的增长。 图像配准(Image registration)就是将不同时间、不同传感器(成像设备)或不同条件下(天候、照度、摄像位置和角度等)获取的两幅或多幅图像进行匹配、叠加的过程,它已经被广泛地应用于遥感数据分析、计算机视觉、图像处理等领域。 图像配准的方法迄今为止,在国内外的图像处理研究领域,已经报道了相当多的图像配准研究工作,产生了不少图像配准方法。总的来说,各种方法都是面向一定范围的应用领域,也具有各自的特点。比如计算机视觉中的景物匹配和飞行器定位系统中的地图匹配,依据其完成的主要功能而被称为目标检测与定位,根据其所采用的算法称之为图像相关等等。 基于灰度信息的图像配准方法一般不需要对图像进行复杂的预先处理,而是利用图像本身具有灰度的一些统计信息来度量图像的相似程度。主要特点是实现简单,但应用范围较窄,不能直接用于校正图像的非线性形变,在最优变换的搜索过程中往往需要巨大的运算量。经过几十年的发展,人们提出了许多基于灰度信息的图像配准方法,大致可以分为三类:互相关法(也称模板匹配法)、序贯相似度检测匹配法、交互信息法。 目前主要图像配准方法有基于互信息的配准方法,基于相关性的配准方法和基

数字图像处理参考教材

数字图像处理参考教材 (Digital Image Processing ,Computer Image Processing)I.通用教材 I.1 容观澳,清华讲义,计算机图像处理, 2000年版, Pages 351 这是清华一本较早的教材,针对基本概念和方法,系统知识。 特点:1)着重本领域的基本概念、基本方法和系统知识。 2)理论结合实验,避开过多数学推导, 3) 重点介绍算法,免编程。这也是我们本科采取的策略。 内容:1)基本内容(有关图像数学、视觉、光学以及二维变换的基本理论2)图像改善:重点介绍图像增强,图像复原,还有图像重建 3)图像的上网、传输、压缩 4)图像的理解、分割、描述 5)图像的硬件系统设计 I.2 李介谷等,上海交大版,88年版,数字图像处理Pages 278 较早。全面介绍了图像处理的一些模型和算法,主要内容;数字图像的特征、品质及视觉;图像的增强处理;图像修复;图像重建;图像分析和理解;图像信息的编码和压缩。 对基本理论和基本技术介绍全面。 I.3 阮秋琦,电子工业版,01年版,数字图像处理学 Pages 562 主要内容:图像处理中的正交变换、图像增强、图像编码、图像复原、图像重建、图像分析、模式识别等。偏重于基本理论和方法。这本书强调了编码的内容。 全书强调基本理论和基本技术,有较多习题,附一套实验演示软件。 北方交大教材。 I.4 黄贤武等,电子科技大学版,2000年,数字图像处理与压缩编码技术, Pages538 主要加重了图像数据压缩技术的份量-这是多媒体处理技术的关键技术之一。对图形模式识别技术、无损压缩编码技术、预测编码、图像的变换编码、神

人脸识别主要算法原理

人脸识别主要算法原理 主流的技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是:设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的基础。 3. 特征脸方法(Eigenface或PCA)

人脸识别主要算法原理

人脸识别主要算法原理 主流的人脸识别技术基本上可以归结为三类,即:基于几何特征的方法、基于模板的方法和基于模型的方法。 1. 基于几何特征的方法是最早、最传统的方法,通常需要和其他算法结合才能有比较好的效果; 2. 基于模板的方法可以分为基于相关匹配的方法、特征脸方法、线性判别分析方法、奇异值分解方法、神经网络方法、动态连接匹配方法等。 3. 基于模型的方法则有基于隐马尔柯夫模型,主动形状模型和主动外观模型的方法等。 1. 基于几何特征的方法 人脸由眼睛、鼻子、嘴巴、下巴等部件构成,正因为这些部件的形状、大小和结构上的各种差异才使得世界上每个人脸千差万别,因此对这些部件的形状和结构关系的几何描述,可以做为人脸识别的重要特征。几何特征最早是用于人脸侧面轮廓的描述与识别,首先根据侧面轮廓曲线确定若干显著点,并由这些显著点导出一组用于识别的特征度量如距离、角度等。Jia 等由正面灰度图中线附近的积分投影模拟侧 面轮廓图是一种很有新意的方法。 采用几何特征进行正面人脸识别一般是通过提取人眼、口、鼻等重要特征点的位置和眼睛等重要器官的几何形状作为分类特征,但Roder对几何特征提取的精确性进行了实验性的研究,结果不容乐观。

可变形模板法可以视为几何特征方法的一种改进,其基本思想是: 设计一个参数可调的器官模型(即可变形模板),定义一个能量函数,通过调整模型参数使能量函数最小化,此时的模型参数即做为该器官的几何特征。 这种方法思想很好,但是存在两个问题,一是能量函数中各种代价的加权系数只能由经验确定,难以推广,二是能量函数优化过程十分耗时,难以实际应用。基于参数的人脸表示可以实现对人脸显著特征的一个高效描述,但它需要大量的前处理和精细的参数选择。同时,采用一般几何特征只描述了部件的基本形状与结构关系,忽略了局部细微特征,造成部分信息的丢失,更适合于做粗分类,而且目前已有的特征点检测技术在精确率上还远不能满足要求,计算量也较大。 2. 局部特征分析方法(Local Face Analysis) 主元子空间的表示是紧凑的,特征维数大大降低,但它是非局部化的,其核函数的支集扩展在整个坐标空间中,同时它是非拓扑的,某个轴投影后临近的点与原图像空间中点的临近性没有任何关系,而局部性和拓扑性对模式分析和分割是理想的特性,似乎这更符合神经信息处理的机制,因此寻找具有这种特性的表达十分重要。基于这种考虑,Atick提出基于局部特征的人脸特征提取与识别方法。这种方法在实际应用取得了很好的效果,它构成了FaceIt人脸识别软件的 基础。 3. 特征脸方法(Eigenface或PCA)

基于Matlab的图像边缘检测算法的实现及应用汇总

目录 摘要 (1) 引言 (2) 第一章绪论 (3) 1.1 课程设计选题的背景及意义 (3) 1.2 图像边缘检测的发展现状 (4) 第二章边缘检测的基本原理 (5) 2.1 基于一阶导数的边缘检测 (8) 2.2 基于二阶导的边缘检测 (9) 第三章边缘检测算子 (10) 3.1 Canny算子 (10) 3.2 Roberts梯度算子 (11) 3.3 Prewitt算子 (12) 3.4 Sobel算子 (13) 3.5 Log算子 (14) 第四章MATLAB简介 (15) 4.1 基本功能 (15) 4.2 应用领域 (16) 第五章编程和调试 (17) 5.1 edge函数 (17) 5.2 边缘检测的编程实现 (17) 第六章总结与体会 (20) 参考文献 (21)

摘要 边缘是图像最基本的特征,包含图像中用于识别的有用信息,边缘检测是数字图像处理中基础而又重要的内容。该课程设计具体考察了5种经典常用的边缘检测算子,并运用Matlab进行图像处理结果比较。梯度算子简单有效,LOG 算法和Canny 边缘检测器能产生较细的边缘。 边缘检测的目的是标识数字图像中灰度变化明显的点,而导函数正好能反映图像灰度变化的显著程度,因而许多方法利用导数来检测边缘。在分析其算法思想和流程的基础上,利用MATLAB对这5种算法进行了仿真实验,分析了各自的性能和算法特点,比较边缘检测效果并给出了各自的适用范围。 关键词:边缘检测;图像处理;MATLAB仿真

引言 边缘检测在图像处理系统中占有重要的作用,其效果直接影响着后续图像处理效果的好坏。许多数字图像处理直接或间接地依靠边缘检测算法的性能,并且在模式识别、机器人视觉、图像分割、特征提取、图像压缩等方面都把边缘检测作为最基本的工具。但实际图像中的边缘往往是各种类型的边缘以及它们模糊化后结果的组合,并且在实际图像中存在着不同程度的噪声,各种类型的图像边缘检测算法不断涌现。早在1965 年就有人提出边缘检测算子,边缘检测的传统方法包括Kirsch,Prewitt,Sobel,Roberts,Robins,Mar-Hildreth 边缘检测方法以及Laplacian-Gaussian(LOG)算子方法和Canny 最优算子方法等。 本设计主要讨论其中5种边缘检测算法。在图像处理的过程需要大量的计算工作,我们利用MATLAB各种丰富的工具箱以及其强大的计算功能可以更加方便有效的完成图像边缘的检测。并对这些方法进行比较

数字图像处理教学大纲(2014新版)要点

数字图像处理 课程编码:3073009223 课程名称:数字图像处理 总学分: 2 总学时:32 (讲课28,实验4) 课程英文名称:Digital Image Processing 先修课程:概率论与数理统计、线性代数、C++程序设计 适用专业:自动化专业等 一、课程性质、地位和任务 数字图像处理课程是自动化专业的专业选修课。本课程着重于培养学生解决智能化检测与控制中应用问题的初步能力,为在计算机视觉、模式识别等领域从事研究与开发打下坚实的理论基础。主要任务是学习数字图像处理的基本概念、基本原理、实现方法和实用技术,并能应用这些基本方法开发数字图像处理系统,为学习图像处理新方法奠定理论基础。 二、教学目标及要求 1.了解图像处理的概念及图像处理系统组成。 2.掌握数字图像处理中的灰度变换和空间滤波的各种方法。 3.了解图像变换,主要是离散和快速傅里叶变换等的原理及性质。 4.理解图像复原与重建技术中空间域和频域滤波的各种方法。 5. 理解解彩色图像的基础概念、模型和处理方法。 6. 了解形态学图像处理技术。 7. 了解图像分割的基本概念和方法。 三、教学内容及安排 第一章:绪论(2学时) 教学目标:了解数字图像处理的基本概念,发展历史,应用领域和研究内容。通过大量的实例讲解数字图像处理的应用领域;了解数字图像处理的基本步骤;了解图像处理系统的组成。 重点难点:数字图像处理基本步骤和图像处理系统的各组成部分构成。 1.1 什么是数字图像处理 1.2 数字图像处理的起源

1.3.1 伽马射线成像 1.3.2 X射线成像 1.3.3 紫外波段成像 1.3.4 可见光及红外波段成像 1.3.5 微波波段成像 1.3.6 无线电波成像 1.3.7 使用其他成像方式的例子 1.4 数字图像处理的基本步骤 1.5 图像处理系统的组成 第二章:数字图像基础(4学时) 教学目标:了解视觉感知要素;了解几种常用的图像获取方法;掌握图像的数字化过程及其图像分辨率之间的关系;掌握像素间的联系的概念;了解数字图像处理中的常用数学工具。 重点难点:要求重点掌握图像数字化过程及图像中像素的联系。 2.1 视觉感知要素(1学时) 2.1.1 人眼的构造 2.1.2 眼镜中图像的形成 2.1.3 亮度适应和辨别 2.2 光和电磁波谱 2.3 图像感知和获取(1学时) 2.3.1 用单个传感器获取图像 2.3.2 用条带传感器获取图像 2.3.3 用传感器阵列获取图像 2.3.4 简单的图像形成模型 2.4 图像取样和量化(1学时) 2.4.1 取样和量化的基本概念 2.4.2 数字图像表示 2.4.3 空间和灰度级分辨率 2.4.4 图像内插 2.5 像素间的一些基本关系(1学时) 2.5.1 相邻像素 2.5.2 临接性、连通性、区域和边界 2.5.3 距离度量 2.6 数字图像处理中所用数学工具的介绍 2.6.1 阵列与矩阵操作

相关文档
最新文档