图像识别技术发展状况及前景

医学图像配准技术

罗述谦综述

首都医科大学生物医学工程系(100054)

吕维雪审

浙江大学生物医学工程研究所(310027)

摘要医学图像配准是医学图像分析的基本课题,具有重要理论研究和临床应用价

值。本文较全面地介绍了医学图像配准的概念、分类、配准原理、主要的配准技术及评

估方法。

关键词医学图像配准多模

1 医学图像配准的概念

在做医学图像分析时,经常要将同一患者的几幅图像放在一起分析,从而得到该患者的多方面的综合信息,提高医学诊断和治疗的水平。对几幅不同的图像作定量分析,首先要解决这几幅图像的严格对齐问题,这就是我们所说的图像的配准。

医学图像配准是指对于一幅医学图像寻求一种(或一系列)空间变换,使它与另一幅医学图像上的对应点达到空间上的一致。这种一致是指人体上的同一解剖点在两张匹配图像上有相的空间位置。配准的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的点及手术感兴趣的点都达到匹配。

医学图像配准技术是90年代才发展起来的医学图像处理的一个重要分支。涉及“配准”的技术名词除registration外,mapping、matching、co-registration、integration、align-ment和fusion 等说法也经常使用。从多数文章的内容看,mapping偏重于空间映射;fu-sion指图像融合,即不仅包括配准,而且包括数据集成后的图像显示。虽然在成像过程之前也可以采取一些措施减小由身体移动等因素引起的空间位置误差,提高配准精度(称作数据获取前的配准preacquisition),但医学图像配准技术主要讨论的是数据获取后的(post-acquisition)配准,也称作回顾式配准(retrospective registration)。当前,国际上关于医学图像配准的研究集中在断层扫描图像( tomographic images,例如CT、MRI、SPECT、PET等)及时序图像(time seriesimages,例如fMRI及4D心动图像)的配准问题。

2 医学图像基本变换

对于在不同时间或/和不同条件下获取的两幅图像I1(x1,y1,z1)和I2(x2,y2,z2)配准,就是寻找一个映射关系P:(x1,y1,z1) (x2,y2,z2),使I1的每一个点在I2上都有唯一的点与之相对应。并且这两点应对应同一解剖位置。映射关系P表现为一组连续的空间变换。常用的空间几何变换有刚体变换(Rigid body transformation)、仿射变换(Affine transformation)、投影变换(Projec-tive transformation)和非线性变换(Nonlin-ear transformation)。

(1)刚体变换:

所谓刚体,是指物体内部任意两点间的距离保持不变。例如,可将人脑看作是一个刚体。

处理人脑图像,对不同方向成像的图像配准常使用刚体变换。刚体变换可以分解为旋转和平移:P(x)=Ax+b(1)

x=(x,y,z)是像素的空间位置;A是3×3的旋转矩阵,b是3×1的平移向量。

矩阵A满足约束条件:

ATA=I det1=1 (2)

AT是矩阵A的转值,I是单位矩阵。

(2)仿射变换

:当(2)式的约束条件不满足时,方程式(1)描述的是仿射变换。它将直线映射为直线,并保持平行性。具体表现可以是各个方向尺度变换系数一致的均匀尺度变换或变换系数不一致的非均匀尺度变换及剪切变换等。均匀尺度变换多用于使用透镜系统的照相图像,在这种情况下,物体的图像和该物体与成像的光学仪器间的距离有直接的关系,一般的仿射变换可用于校正由CT台架倾斜引起的剪切或MR梯度线圈不完善产生的畸变。

(3)投影变换:

与仿射变换相似,投影变换将直线映射为直线,但不再保持平行性质。投影变换主要用于二维投影图像与三维体积图像的配准。

(4)非线性变换:

非线性变换也称做弯曲变换(curved transformation),它把直线变换为曲线。使用较多的是多项式函数,如二次、三次函数及薄板样条函数。有时也使用指数函数。非线性变换多用于使解剖图谱变形来拟合图像数据或对有全局性形变的胸、腹部脏器图像的配准。

3 医学图像配准的类型

根据成像模式的不同,以及配准对象间的关系等,医学图像配准可有多种不同的分类方法。

3.1 按成像的模式分类由于成像的原理和设备不同,存在有多种成像模式(imaging modalities)。从大的方面来说,可以分为描述生理形态的解剖成像模式(anatomical imaging modality)和描

述人体功能或代谢的功能成像模式(functionalimaging modality)。

表1给出几种主要的成像模式。

(1)单模(monomodality)医学图像配准:

是指待配准的两幅图像是用同一种成像设备获取的。单模医学图像配准的典型应用

如下。

①不同MR加权像间的配准:由于使用的射频脉冲序列以及成像参数的设置不同,磁共振图像会有很大的不同。对自旋回波(Spin Echo)脉冲序列主要有三种不同类型的磁共振图像,即T1

加权像、T2加权像及质子密度(PD)加权像。人体不同的组织在这些图像上表现为不同的强度。例如,很多肿瘤、炎症及病灶都会增加组织中的自由水成分,在T1加权像中表现为低强度;而骨、纤维及钙化组织不含自由水,在T2加权像中呈低强度;亚急性出血在T1和T2像中同时表现为高强度等。不同加权MR图像的信息可以互补,临床上,它们的结合可提供更全面的诊断

信息。配准后的图像还可用于脑内组织的分类(如白质、灰质及CSF等)。由于该分类方法的原理与利用卫星遥感图像处理地面资源的方法相似,这种分类方法又称做多谱医学图像分析。

②电镜图像序列的配准:在不同时间采集的多幅物体图像,构成沿时间轴的2D/3D图像的集合,称为时间序列图像。生物医学方面,在显微镜下观察组织结构,可分析微生物、细胞和亚细胞粒子的移动及其引起的形态变化,研究它们的生长和变态现象。对系列微循环图像分析还可

得到微血流变化的情况。

③fMRI图像序列的配准:fMRI(功能磁共振成像,functional MRI)也是时间序列图像。大脑活动

过程中,会产生氧摄取量与脑血流间的不平衡,这种不平衡必然会引起脑血管周围MRI信号的改变。在对磁场不均匀性很敏感的MRI图像序列中就可以测得这些信号的改变。由于该方

法无须对比增强剂,也无辐射剂量,又能反映脑功能,因此在神经科学的认知研究中得到普遍

的重视。功能测试要求受试者做出某种反映,很大程度上会引起头部的移动,产生伪像。因此,在fMRI序列图像研究中图像配准更是严重的问题[11]。

④脑、腹部脏器的图像配准:如果被分析的图像本身就是3D图像,这样的图像序列就成为4D 图像,例如4D心动图像分析。要进行定量的分析,往往要求确定各幅图像中的公共参考点位置,即要解决图像定位问题。还要解决目标物体处于运动过程可能存在的局部变形和严重的

噪声问题,例如在心动周期中的不同时刻,心脏的形状、大小、位置都会发生变化,介于3D图

像间的时间插值图像是常用的方法。

(2)多模(multimodality)医学图像配准:

是指待配准的两幅图像来源于不同的成像设备。例如,CT和MR图像都有较高的空间分辨率,前者对密度差异较大的组织效果好,后者则可识别软组织;SPECT、PET能反映人体的功能和代谢信息,但空间分辨较差。因此在临床应用中,常需要将CT(或MR)与SPECT(或PET)配准。二

者的结合能够同时提供功能的与解剖的信息,具有临床应用价值。由于扫描设备的原理不同,扫描参数条件各异,所以两种断层图像间并不存在着简单的一一对应关系。

多模医学图像配准是医学图像配准的重点研究课题。在PET与MR图像的配准问题中,目前

国际上用的较多的是AIR法(Automatic Image Registration)、准标法(Fiducial Marks)和双模板变换法。最近,最大互信息法又倍受推崇和关注。

3.2 按受试对象分类待配准的图像可以是同一个人的,属于患者自身图像配准(intra-subject)。对同一病人在不同时间获取同一器官或解剖部位的图像,可以用于对比,从而监视疾病的发展及治疗过程。如果没有局部的组织切除,这种配准一般用刚体变换就可以了。除此之外,有时要将被试者的图像与典型正常人相同部位的图像对比,以确定被试者是否正常;如果异常,也

许还要与一些疾病的典型图像对比,确定患者是否属于同类。这些都属于不同人间的图像配准(inter-subject)[8]。由于个体解剖的差异,后者的配准显然要难于前者。

3.3 图像与图谱配准(Atlas Method)或与物理空间配准由于不同人在生理上存在差异,同一解剖结构的形状、大小、位置都会很不相同,这就使不同人的图像配准问题成为当今医学图像分析中的最大难题。在对比和分析不同的医学图像时,很难精确找出对应的解剖信息。这要求有一个详细标记人体各个解剖位置的计算机化的标准图谱。常见的方法大致有两类:一是借助一个共同的标准来比较,例如要对两个病人的PET或MR图像进行比较,首先要把二者的图像都映射到一个共同的参考空间去,然后在此空间中对二者进行比较,目前使用较多的是Talairach标准空间,可以对不同的人脑图像进行比较;二是非线性形变法,模仿弹性力学方法,

将一个人的3D图像逐步变换,使它最终能较好地与另一个人的3D图像最佳匹配。在立体定向装置或图像引导的手术导航系统中[18],则是将图像像素与物理空间中探针或手术器械或

实况摄像的位置配准。

4 医学图像配准方法

4.1 配准原理

医学图像的配准过程本质上是一个多参数最优化问题。用的较多的是使两个图像对应像素特征值差值平方和最小化。一般可用Gauss-Newton最优化算法实现。

设di(p)是两个图像上体素I间的差值,p是参数向量,t是参数向量的增量,使用Taylor公式可得:

关于参数p的迭代公式:

其中

更广义的情况是对两组参数优化,除空间变换(ps)外,还对强度变换(pt)优化。

其中f是物体图像,xi是第i个采样值的坐标,s是描述参数为ps的空间变换的向量函数,t是描述参数为pt的强度变换的标量函数。较简单的情况是空间变换包括12个参数,若模板图像g,强度变换只是简单的换算关系,则t(xi,pt)等于p13g(xi)。

比如说我们的目标是使图像f与另一图像g配准,后者称作模板图像(template im-age)。仿射变换有12个参数(p1到p12),二者的强度换算系数是p13。于是,从图像f的像素x变换到图像g的点y:

用矩阵符号可表示为y=Mx。

最小化函数为:

但是,一个图像的强度并不总是按线性规律随另一图像变化的,有时须使用多项式

函数,使用二次函数的最小化函数为:∑i(f(xi,ps)-(p13g(xi)+p14g(xi)2))2

若强度还随空间位置变化,例如MRI扫描设备的空间不均匀性,则待最小化的函数

为: ∑i(f(xi,ps)-(p13x1ig(xi)+p14x2ig(xi)+ p15x3ig(xi)))2

根据不同的配准问题,需要选用不同的相似性测度,并极大化测度。这仍然是多参数优化问题。

4.2 主要配准方法

(1)点法(Point Method):又分内部点(Intrinsic points)及外部点(Extrinsic poin-ts)。内部点是从与病人相关的图像性质中得到的,如解剖标志点(anatomical landmarkpoints)。解剖标志点必须是在三维空间定义的,并在两种扫描模式的图像中可见。典型的解剖标志点可以是一个点状的解剖结构,例如:耳蜗尖端拐点处;两个线形结构的交点;血管的分叉或相交处;某一表面上特定拓扑属性;一个沟回的可识别部分等。外部点则是在受试者颅骨嵌入的螺钉、在皮肤上做的记号或其他在两幅图像都可检测到的附加标记物,例如充有硫酸铜的管子、玻璃珠、铬合金珠、明胶球等。原则上外部点法可用于配准任何模式的图像,而且外部点在医学图像中要比内部点好识别得多,通过比较图像中记号的位置对配准结果也易于视觉检测;缺点是在使用这些记号时,受试者都要在扫描装置内严格保持不动,有些还是介入性的。相比起来,内部点法则对受试者比较友好,而且是全回顾式配准;缺点是内部点的寻找相当困难、费事,要求有一定的经验,方法带有一些主观性。无论内部点还是外部点,一经确定,两图像的配准问题就归结为求解对应点集的刚体变换了。对准了这些标志点,两幅图像也就配准了。

(2)曲线法(Curve Method):

Batler[3]对二维投影放射照片首先用人工的方法在两幅图像中寻找对应的开曲线(Open curve),再在两条曲线局部曲率最佳拟合的线段用相同的采样率找出一组对应点来,以后继续用点法匹配两幅图像。Gueziec和Ayache[2]配准CT体积图像系列时,用图像强度的导数自动提取脊线(ridge or crest)。然后,用连续的样条近似这些离散的曲线并计算曲率和扭矩。曲线的对应关系是用几何散列表(geo-metric hashing)检索和表决技术确定的。对应曲线及图像间的配准是通过刚体变换实现的。

(3)表面法(Surface Method):基于表面的配准技术典型的例子是Pelizzari和Chen[17]研究的“头帽法”。从一幅图像轮廓提取的点集称作帽子(‘hat’),从另一幅图像轮廓提取的表面模型叫作头(‘head’)。一般用体积较大的病人图像,或在图像体积大小差不多时用分辨较高的图像来产生头表面模型。Powell探索算法被用来寻求所需的几何变换,即使帽点和头表面间的距离平均平方值最小。许多学者对该算法作了重要改进,例如用多分辨金字塔技术克服局部极值问题;用距离变换拟合两幅图像的边缘点(edgepoints),斜面匹配技术(chamfering method) 可有效地计算距离变换。

（4）矩和主轴法(Moment and PrincipalAxes Method):借用经典力学中物体质量分布的概念,计算两幅图像像素点的质心和主轴,再通过平移和旋转使两幅图像的质心和主轴对齐,从而达到配准的目的[1]。该方法对数据的缺失较敏感,即要求整个物体必须完整的出现在两幅图像中,此外,该方法还对神经医生感兴趣的某些病案效果不佳。例如,PET图像中大的周边低代谢肿瘤可能引起较大的MR—PET配准误差。学者们更多地是使用主轴变换法作粗配准,使两幅图像初步对齐,可以减少后续主要配准方法的搜索步骤。

(5)相关法(Correlatiom Method):对于同一物体由于图像获取条件的差异或物体自身发生的

小的改变而产生的图像序列,采用使图像间相似性最大化的原理实现图像间的配准[22],即通过优化两幅图像间相似性准则来估计变换参数,主要是刚体的平移和旋转。对照相序列,考虑到棱镜系统的使用,还要作必要的尺度变换。还须对曝光时间不同引起的强度差异作修正。对核医学图像也要作强度换算来修正因获取时间、注入活性及背景等因素产生的影响。所使用的相似性测度可以是多种多样的,例如相关函数、相关系数、差值的平方和或差的绝对值和等。由于要对每种变换参数可能的取值都要计算一次相似性测度,相关法的计算量十分庞大,一些学者在这方面做出了努力。例如,用相位相关傅立叶法估算平移和旋转参数;用遗传算法和模拟退火技术减少搜索时间和克服局部极值问题,及用傅立叶不变性和对数变换分解变量的互相关技术。相关法主要限于单模图像配准,特别是对一系列图像进行比较,从中发现由疾病引起的微小改变。

(6)最大互信息配准法(Maximization ofMutual Information):互信息是信息论的一个基本概念,是两个随机变量统计相关性的测度。Woods[24]使用给出参考像后测试图像的条件熵作为配准的测度。他研究的AIR是一种广泛应用于PET到MR图像配准的算法,但缺点是依赖对MR 图像的予处理,这通常涉及很费功夫的剔除非脑组织的手工编辑工作。Collignon[7]、Viola和Wells[23]、Studholme[19]等人用互信息作为多模医学图像的配准的测度。如果两幅图像几何上对齐的话,它们对应体素对的强度值的互信息最大。由于该方法不需要对两种成像模式中图像强度间关系的性质作任何假设,也不需要对图像作分割或任何予处理,所以被广泛地

用于CT/MR、PET/MR等多种配准工作。最大互信息法几乎可以用在任何不同模式图

像的配准,特别是当其中一个图像的数据部分缺损时也能得到很好的配准效果。

(7)图谱法(Atlas Method)与非线性变换技术:不同人脑图像的配准远比同一个人的不同模式图像的配准困难得多,这是因为每个人脑的形状、尺寸都有很大的差异。如果我们将脑图像作

一定的尺度变换,并对深度内部结构适当取向后,就会发现不同人脑的解剖结构的大小和形状方面还是具有一定的共性的。这就使我们有可能构造一个解剖图谱,其前提是受试者间脑的

拓扑结构具有不变性。由于在脑图谱构建过程中有神经解剖学专家直接参与,利用脑图谱进

行配准,就可以利用图谱所包含的先验知识来对病人或其他人的图像自动识别和正确地分割。一个最著名的方案是建立一个标准的脑坐标系统。Talairach[20]3D正交栅格系统为大家广泛接受,从图谱到脑图像的配准归结为逐段仿射变换问题。但仿射变换不能解决人脑形态的复

杂非线性问题,故一些学者研究了用非线性变换的配准技术。Evans[10]构建了一个三维的计

算机化脑图谱。他们用手工方法从一个高分辨的MR体积图像的所有层片的每半球中都提取60个解剖结构的轮廓线,然后用贴片算法(tiling algorithm)将这些结构转化为闭合的多面体,使用时,通过全局仿射变换或薄板样条函数,交互地使图谱变形去拟合图像数据。Greitz[13]构建的图谱则是从冷冻尸体脑切片的数字化照片中人工提取250个结构,配准方法是先用仿射变

换粗定位,再用非线性变换精细对齐,整个配准过程是交互式的。Bajcsy[4]等人首先用弹性形

变方法使三维的计算机化脑图谱变形,用于配准CT和MR体积图像。他们还应用从粗到细的多分辨匹配策略减少计算的复杂性和提高配准精度。Bookstein[5]的薄板样条法和非线性形

变理论、Moshfeghi[16]等人的弹性匹配方法、Davatzikos[9]的活动轮廓模型都是独有特色的

非线性形变配准方法。Christensen[6]用粘滞流体模型(Viscous Flu-id Model)控制形变,模板图

像被建模为厚的流体,流体在内力作用下流动去拟合待配准的体积图像,经过一段时间后,流

体停止活动。该法可以实现任何复杂形状的形变,被认为是当前最高级的图像配准算法,缺点是算法所须计算量太大,使用DECmpp 128x64Mas Par计算机作3D配准需要2~6小时,在MIPS R4400处理机上执行时间约为7天。只有使用超级计算机做并行计算,这种算法才能得以实现。

5 医学图像配准的评估

医学图像配准,特别是多模医学图像配准结果的评估一直是件很困难的事情。由于待配准的

多幅图像基本上都是在不同时间/和条件下获取的,所以没有绝对的配准问题,即不存在什么

金标准(gold standard),只有相对的最优(某种准则下的)配准。在此意义上,最优配准与配准的

目的有关。常用的评估方法有以下几种:

(1)体模(Phantom):体模又有硬件体模和软件体模之分,后者是计算机图像合成结果。体模法

用已知的图像信息验证新配准算法的精度。由于体模都比较简单,与实际临床图像差异较大,因此只能对配准方法作初步的评估。

(2)准标(fiducial marks):立体定向框架系统(Stereotactic Frame Systems)包括立体定向参考框架、立体定向图像获取、探针或手术器械导向几部分。优点是定位准确,不易产生图像畸变。使

用立体定向框架系统的体积图像数据可以用来评估其它配准方法的精度。使用人工记号作准标的方法很多。一种准标是使用9根棍棒组成的3个方向的N字型结构。在CT测试时,棒内充以硫酸铜溶液;作PET测试则填充氟18。这样,在两组图像中都可见此N字型准标,从而可

对图像准确空间定位。Fitzpatrick[12]用在人脑表面嵌螺丝作标记(每人8个)的方法对多个病人做CT、MR(T1、T2及PD)和PET实测,得到多组数据。这些数据专门用于多模医学图

像配准算法评估使用。

(3)图谱:Thompson[20]用随机向量场变换构造一个可变形的概率脑图谱。包括从多个受试者

到单一解剖模板的功能、血管、组织诸方面映射,三维图谱到新受试者的扫描图像的映射。Visible Human CD的CT骨窗图像、MR图像及彩绘的冷冻切片照片像由于具有清晰的解剖结构和高度的分辨率(1mm/每层片),近来也被用来作新配准方法精度的评估。

(4)目测检验(visual inspection):对多模医学图像配准的结果请领域专家用目测方法检验,听起来有些主观,但的确是一种相当可信的方法。

图像识别技术的研究现状论文

图像识别技术研究现状综述简介：图像识别是指图形刺激作用于感觉器官，人们辨认出它是经验过的某一图形的过程,也叫图像再认。在图像识别中,既要有当时进入感官的信息,也要有记忆中存储的信息。只有通过存储的信息与当前的信息进行比较的加工过程，才能实现对图像的再认。图像识别技术是以图像的主要特征为基础的，在图像识别过程中，知觉机制必须排除输入的多余信息,抽出关键的信息。在人类图像识别系统中，对复杂图像的识别往往要通过不同层次的信息加工才能实现。对于熟悉的图形,由于掌握了它的主要特征，就会把它当作一个单元来识别，而不再注意它的细节了。这种由孤立的单元材料组成的整体单位叫做组块，每一个组块是同时被感知的。图像在人类的感知中扮演着非常重要的角色，人类随时随处都要接触图像。随着数字图像技术的发展和实际应用的需要，出现了另一类问题，就是不要求其结果输出是一幅完整的图像，而是将经过图像处理后的图像，再经过分割和描述提取有效的特征，进而加以判决分类，这就是近20年来发展起来的一门新兴技术科学一图像识别。它以研究某些对象或过程的分类与描述为主要内容，以研制能够自动处理某些信息的机器视觉系统，代替传统的人工完成分类和辨识的任务为目的。图像识别的发展大致经历了三个阶段：文字识别、图像处理和识别及物体识别：文字识别的研究是从1950年开始的，一般是识别字母、数字和符号，并从印刷文字识别到手写文字识别，应用非常广泛，并且已经研制了许多专用设备。图像处理和识别的研究，是从1965年开始的。过去人们主要是对照相技术、光学技术的研究，而现在则是利用计算技术、通过计算机来完成。计算机图像处理不但可以消除图像的失真、噪声，同时还可以进行图像的增强与复原，然后进行图像的判读、解析与识别，如航空照片的解析、遥感图像的处理与识别等，其用途之广，不胜枚举。物体识别也就是对三维世界的认识，它是和机器人研究有着密切关系的一个领域，在图像处理上没有特殊的难点，但必须知道距离信息，并且必须将环境模型化。在自动化技术已从体力劳动向部分智力劳动自动化发展的今天，尽管机器人的研究非常盛行，还只限于视觉能够观察到的场景。进入80年代，随着计算机和信息科学的发展，计算机视觉、人工智能的研究已成为新的动向图像识别与图像处理的关系：在研究图像时，首先要对获得的图像信息进行预处理（前处理）以滤去干扰、噪声，作几何、彩色校正等，以提供一个满足要求的图像。图像处理包括图像编码，图像增强、图像压缩、图像复原、图像分割等。对于图像处理来说，输入是图像，输出（即经过处理后的结果）也是图像。图像处理主要用来解决两个问题：一是判断图像中有无需要的信息；二是确定这些信息是什么。图像识别是指对上述处理后的图像进行分类，确定类别名称，它可以在分割的基础上选择需要提取的特征，并对某些参数进行测量，再提取这些特征，然后根据测量结果做出分类。为了更好地识别图像，还要对整个图像做结构上的分析，对图像进行描述，以便对图像的主要信息做一个好的解释，并通过许多对象相互间的结构关系对图像加深理解，以便更好帮助和识别。故图像识别是在上述分割后的每个部分中，找出它的形状及纹理特征，以便对图像进行分类，并对整个图像做结构上的分析。因而对图像识别环节来说，输入是图像（经过上述处理后的图像），输出是类别和图像的结构分析，而结构分析的结果则

基于视频图像序列的抛洒物检测毕业设计资料

基于视频图像序列的抛洒物检测第1章概述1.1 论文研究背景如今，中国高速公路里程已达7.4万公里，居世界第二位[1]。随着高速公路、城市公路通行量的不断增加，交通事故所带来的安全隐患也所之增加，在众多危害安全的事故中交通事故是当前最为严重的，而中国交通局对近10年交通事故官方统计显示，世界上因交通事故死亡人数最多的国家中，中国位列前三之中。至今中国每年交通事故约50万起，每年的事故死亡人数均已达到10万人以上，已经连续十年居世界第一。而今，随着我国经济的不断发展，交通需求的不断增长，高速公路和隧道已成为经济社会发展的重要助推器。然而，高速公路在给人们带来巨大的经济效益和社会效益的同时，各类交通事故也明显增加，尤其是各类恶性重大事故频发，据不完全统计，2005年底每万公里死亡1823人，死亡人数以每年近20%的比率递增。由于高速公路和隧道具有车流量大、行车速度高等特点，一旦发生交通事故将会非常严重，不仅一次事故殃及的车辆多、伤亡率高，还会造成严重的交通阻塞和行车延误，而且还可能会引起二次事故的发生，严重影响高速公路和隧道的整体通行能力和运营效率。而高速公路里程长，交通事件自身又有很强的随机性，如何快速检测交通事件，最大限度地减少交通事件的发生和影响，一直是国际交通领域所关注的问题。城市中大货车货运过程中抛洒物事件已经严重危害交通安全，成为造成交通事故的主要原因之一，其带来的安全隐患是我们急需重视及解决的问题。因过往车辆上的抛洒物、坠落物引发的交通事故不仅给通行车辆和司乘人员造成了生命财产损失，影响了道路的通畅，而且给高速公路运营管理单位带来了经济损失和诉讼纠纷，损害了高速公路的社会形象。每天通过车辆数以千万计，路面上抛洒物、坠落物随时随地可能出现[2]。尽管高速公路管理单位已安排保洁工路面巡查，养排中心专职巡查，交警路政也在巡查，但仍不可能做到在时间上、空间上的无缝覆盖。而这些抛洒物、坠落物很有可能随时引发交通事故，给过往司机旅客造成财产甚至生命的损失，给高速公路经营管理带来经济上、法律上的纠纷和后果。如何及时准确的检测到抛洒物事件的发生，高效率的检测路面上产生的抛洒物，并且及时清理避免造成交通事故已经成为国内外交通部门关注的热点问题。

关于人脸识别技术的发展研究

人脸识别技术优势 863计划、国家科技支撑计划、自然科学基金都拨出专款资助人脸识别的相关研究。国家“十一五”科技发展规划中也将人脸识别技术的研究与发展列入其中[4]，明确指出：“要在生物特征识别技术领域缩小与世界先进水平的差距，开展生物特征识别应用技术研究，人脸识别具有高安全性、低误报率的出入口控制新产品。”在这种环境下，国内一些科研院所和院校在人脸识别技术方面取得了很大进展。如中科院自动化所，清华大学，中科院计算所自主开发的人脸识别技术已经达到了国际先进的水平。人脸识别作为一种新兴的生物特征识别技术(Biometrics)，与虹膜识别、指纹扫描、掌形扫描等技术相比，人脸识别技术在应用方面具有独到的优势： 1.人脸识别使用方便，用户接受度高。人脸识别技术使用通用的摄像机作为识别信息获取装置，以非接触的方式在识别对象未察觉的情况下完成识别过程。 2.直观性突出。人脸识别技术所使用的依据是人的面部图像，而人脸无疑是肉眼能够判别的最直观的信息源，方便人工确认、审计，“以貌取人”符合人的认知规律。 3.识别精确度高，速度快。与其它生物识别技术相比，人脸识别技术的识别精度处于较高的水平，误识率、拒认率较低。 4.不易仿冒。在安全性要求高的应用场合，人脸识别技术要求识别对象必须亲临识别现场，他人难以仿冒。人脸识别技术所独具的活性判别能力保证了他人无法以非活性的照片、木偶、蜡像来欺骗识别系统。这是指纹等生物特征识别技术所很难做到的。举例来说，用合法用户的断指即可仿冒合法用户的身份而使识别系统无从觉察。 5.使用通用性设备。人脸识别技术所使用的设备为一般的PC、摄像机等常规设备，由于目前计算机、闭路电视监控系统等已经得到了广泛的应用，因此对于多数用户而言使用人脸识别技术无需添置大量专用设备，从而既保护了用户的原有投资又扩展了用户已有设备的功能，满足了用户安全防范的需求。 6.基础资料易于获得。人脸识别技术所采用的依据是人脸照片或实时摄取的人脸图像，因而无疑是最容易获得的。 7.成本较低，易于推广使用。由于人脸识别技术所使用的是常规通用设备，价格均在一般用户可接受的范围之内，与其它生物识别技术相比，人脸识别产品具有很高的性能价格比。概括地说，人脸识别技术是一种高精度、易于使用、稳定性高、难仿冒、性价比高的生物特征识别技术，具有极其广阔的市场应用前景。我将人脸识别的一些应用列举出来，希望抛转引玉，大家不断完善，开拓更多的应用领域。 1）监控布控

基于matlab的图像预处理技术研究文献综述

毕业设计文献综述题目：基于matlab的图像预处理技术研究专业：电子信息工程 1前言部分众所周知，MATLAB在数值计算、数据处理、自动控制、图像、信号处理、神经网络、优化计算、模糊逻辑、小波分析等众多领域有着广泛的用途，特别是MATLAB的图像处理和分析工具箱支持索引图像、RGB 图像、灰度图像、二进制图像，并能操作*.bmp、*.jpg、*.tif等多种图像格式文件如。果能灵活地运用MATLAB提供的图像处理分析函数及工具箱，会大大简化具体的编程工作，充分体现在图像处理和分析中的优越性。图像就是用各种观测系统观测客观世界获得的且可以直接或间接作用与人眼而产生视觉的实体。视觉是人类从大自然中获取信息的最主要的手段。拒统计，在人类获取的信息中，视觉信息约占60%，听觉信息约占20%，其他方式加起来才约占20%。由此可见，视觉信息对人类非常重要。同时，图像又是人类获取视觉信息的主要途径，是人类能体验的最重要、最丰富、信息量最大的信息源。通常，客观事物在空间上都是三维的(3D)的，但是从客观景物获得的图像却是属于二维(2D)平面的。图像存在方式多种多样，可以是可视的或者非可视的，抽象的或者实际的，适于计算机处理的和不适于计算机处理的。图像处理它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。图像处理最早出现于20世纪50年代，当时的电子计算机已经发展到一定水平，人们开始利用计算机来处理图形和图像信息。图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量，它以人为对象，以改善人的视觉效果为目的。图像处理中，输入的是质量低的图像，输出的是改善质量后的图像，常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室（JPL）。他们对航天探测器徘徊者7号在 1964 年发回的几千张月球照片使用了图像处理技术，如几何校正、灰度变换、去除噪声等方法进行处理，并考虑了太阳位置和月球环境的影响，由计算机成功地绘制出月球表面地图，获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理，以致获得了月球的地形图、彩色图及全景镶嵌图，获得了非凡的成果，为人类登月创举奠定了坚实的基础，也推动

人脸识别毕业设计

摘要人脸识别技术(FRT)是当今模式识别和人工智能领域的一个重要研究方向。虽然人脸识别的研究已有很长的历史，各种人脸识别的技术也很多，但由于人脸属于复杂模式而且容易受表情、肤色和衣着的影响，目前还没有一种人脸识别技术是公认快速有效的．本文主要讨论了人脸识别技术的一些常用方法，对现有的人脸检测与定位、人脸特征提取、人脸识别的方法进行分析和讨论，最后对人脸识别未来的发展和应用做了展望。关键字：人脸识别，特征定位，特征提取

ABSTRACT Nowadays the face recognition technology (FRT) is a hot issue in the field of pattern recognition and artificial intelligence．Although this research already has a long history and many different recognition methods are proposed，there is still no effective method with low cost an d high precision．Human face is a complex pattern an d is easily affected by the expression，complexion and clothes．In this paper，some general research are discussed，including methods of face detection and location，features abstraction，and face recognition．Then we analyze and forecast the face recognition’s application and its prospects． Keywords: Face Recognition Technology, Face location，Features abstraction

浅析人工智能中的图像识别技术

浅析人工智能中的图像识别技术本文从网络收集而来，上传到平台为了帮到更多的人，如果您需要使用本文档，请点击下载按钮下载本文档（有偿下载），另外祝您生活愉快，工作顺利，万事如意！图像识别技术是信息时代的一门重要的技术，其产生目的是为了让计算机代替人类去处理大量的物理信息。随着计算机技术的发展，人类对图像识别技术的认识越来越深刻。图像识别技术的过程分为信息的获取、预处理、特征抽取和选择、分类器设计和分类决策。文章简单分析了图像识别技术的引入、其技术原理以及模式识别等，之后介绍了神经网络的图像识别技术和非线性降维的图像识别技术及图像识别技术的应用。从中可以总结出图像处理技术的应用广泛，人类的生活将无法离开图像识别技术，研究图像识别技术具有重大意义。 1 图像识别技术的引入图像识别是人工智能科技的一个重要领域。图像识别的发展经历了三个阶段：文字识别、数字图像处理与识别、物体识别。图像识别，顾名思义，就是对图像做出各种处理、分析，最终识别我们所要研究的

目标。今天所指的图像识别并不仅仅是用人类的肉眼，而是借助计算机技术进行识别。虽然人类的识别能力很强大，但是对于高速发展的社会，人类自身识别能力已经满足不了我们的需求，于是就产生了基于计算机的图像识别技术。这就像人类研究生物细胞，完全靠肉眼观察细胞是不现实的，这样自然就产生了显微镜等用于精确观测的仪器。通常一个领域有固有技术无法解决的需求时，就会产生相应的新技术。图像识别技术也是如此，此技术的产生就是为了让计算机代替人类去处理大量的物理信息，解决人类无法识别或者识别率特别低的信息。图像识别技术原理其实，图像识别技术背后的原理并不是很难，只是其要处理的信息比较繁琐。计算机的任何处理技术都不是凭空产生的，它都是学者们从生活实践中得到启发而利用程序将其模拟实现的。计算机的图像识别技术和人类的图像识别在原理上并没有本质的区别，只是机器缺少人类在感觉与视觉差上的影响罢了。人类的图像识别也不单单是凭借整个图像存储在脑海中的记忆来识别的，我们识别图像都是依靠图像所具有

图像处理技术的研究现状和发展趋势

图像处理技术的研究现状和发展趋势庄振帅数字图像处理又称为计算机图像处理，它是指将图像信号转换成数字信号并利用计算机对其进行处理的过程。数字图像处理最早出现于20世纪50年代，当时的电子计算机已经发展到一定水平，人们开始利用计算机来处理图形和图像信息。数字图像处理作为一门学科大约形成于20世纪60年代初期。早期的图像处理的目的是改善图像的质量，它以人为对象，以改善人的视觉效果为目的。图像处理中，输入的是质量低的图像，输出的是改善质量后的图像，常用的图像处理方法有图像增强、复原、编码、压缩等。首次获得实际成功应用的是美国喷气推进实验室（JPL）。他们对航天探测器徘徊者7号在1964年发回的几千张月球照片使用了图像处理技术，如几何校正、灰度变换、去除噪声等方法进行处理，并考虑了太阳位置和月球环境的影响，由计算机成功地绘制出月球表面地图，获得了巨大的成功。随后又对探测飞船发回的近十万张照片进行更为复杂的图像处理，以致获得了月球的地形图、彩色图及全景镶嵌图，获得了非凡的成果，为人类登月创举奠定了坚实的基础，也推动了数字图像处理这门学科的诞生。在以后的宇航空间技术，如对火星、土星等星球的探测研究中，数字图像处理都发挥了巨大的作用。数字图像处理取得的另一个巨大成就是在医学上获得的成果。1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置，也就是我们通常所说的CT（Computer Tomograph）。CT的基本方法是根据人的头部截面的投影，经计算机处理来重建截面图像，称为图像重建。1975年EMI公司又成功研制出全身用的CT 装置，获得了人体各个部位鲜明清晰的断层图像。1979年，这项无损伤诊断技术获得了诺贝尔奖，说明它对人类作出了划时代的贡献。与此同时，图像处理技术在许多应用领域受到广泛重视并取得了重大的开拓性成就，属于这些领域的有航空航天、生物医学过程、工业检测、机器人视觉、公安司法、军事制导、文化艺术等，使图像处理成为一门引人注目、前景远大的新型学科。随着图像处理技术的深入发展，从70年代中期开始，随着计算机技术和人工智能、思维科学研究的迅速发展，数字图像处理向

人脸识别算法设计毕业设计

人脸识别算法 The Design and Implementation of Algorithms for Human Face Recognition 1-i

人脸识别算法摘要人脸自动识别是模式识别领域的一项热门研究课题，有着十分广泛的应用前景。本文对人脸位置矫正，人脸的特征提取和识别这些方面进行了研究，并提出了相应的实现算法。人脸位置矫正作为人脸检测定位的一个环节，在计算机人脸识别中具有重要的意义。本文第二章提出了一种基于单人脸灰度图像中眼睛定位的人脸位置矫正方法，它是针对人眼灰度变化特点、人眼几何形状特征及双眼的轴对称性而设计的。实验结果表明，该方法对于双眼可见单人脸灰度图像能实现快速有效矫正，并能在矫正结果中精确给出双眼瞳孔位置。本文第三章提出了一种基于神经网络的主元分析人脸图像识别方法。该方法利用非线性主元分析神经网络对人脸图像提取人脸特征（矢量），并在BP神经网络上实现了对人脸图像的识别。实验结果证明了该方法的有效性和稳定性。关键词 1-ii

人脸位置矫正，人脸特征提取，人脸识别，神经网络，灰度图像，图像块纵向复杂度，主元分析法， 1-iii

The Design and Implementation of Algorithms for Human Face Recognition Student: Yangbo Gu Advisor: Dr. Wenming Cao Department of Computer Science and Technology College of Information Engineering Zhejiang University of Technology Abstract The automatic recognition of human faces is a hot spot in the field of pattern recognition , which has a wide range of potential applications . As the results of our in-depth research ,two algorithms are proposed : one for face pose adjustment , the other for facial feature extraction and face identification . Face pose adjustment , as a loop of human face location, is very important in computer face recognition. Chapter 2 of this thesis presents a new approach to automatic face pose adjustment on gray-scale static images with a single face . In a first stage , the right positions of eyes are precisely detected according to several designed parameters which well characterize the complex changes of the gray parameter in and around eyes and the geometrical shape of eyes . During the second stage , based on the location and the symmetry feature of eyes , the inclination angle is calculated and the face position is redressed . The experimentation shows that the algorithm performs very well both in terms of rate and of efficiency . What’s more , due to the precise location of eyes , the apples of the eyes are detected . 1-iv

图像识别技术发展状况及前景

医学图像配准技术罗述谦综述首都医科大学生物医学工程系(100054) 吕维雪审浙江大学生物医学工程研究所(310027) 摘要医学图像配准是医学图像分析的基本课题,具有重要理论研究和临床应用价值。本文较全面地介绍了医学图像配准的概念、分类、配准原理、主要的配准技术及评估方法。关键词医学图像配准多模 1 医学图像配准的概念在做医学图像分析时,经常要将同一患者的几幅图像放在一起分析,从而得到该患者的多方面的综合信息,提高医学诊断和治疗的水平。对几幅不同的图像作定量分析,首先要解决这几幅图像的严格对齐问题,这就是我们所说的图像的配准。医学图像配准是指对于一幅医学图像寻求一种(或一系列)空间变换,使它与另一幅医学图像上的对应点达到空间上的一致。这种一致是指人体上的同一解剖点在两张匹配图像上有相的空间位置。配准的结果应使两幅图像上所有的解剖点,或至少是所有具有诊断意义的点及手术感兴趣的点都达到匹配。医学图像配准技术是90年代才发展起来的医学图像处理的一个重要分支。涉及“配准”的技术名词除registration外,mapping、matching、co-registration、integration、align-ment和fusion 等说法也经常使用。从多数文章的内容看,mapping偏重于空间映射;fu-sion指图像融合,即不仅包括配准,而且包括数据集成后的图像显示。虽然在成像过程之前也可以采取一些措施减小由身体移动等因素引起的空间位置误差,提高配准精度(称作数据获取前的配准preacquisition),但医学图像配准技术主要讨论的是数据获取后的(post-acquisition)配准,也称作回顾式配准(retrospective registration)。当前,国际上关于医学图像配准的研究集中在断层扫描图像( tomographic images,例如CT、MRI、SPECT、PET等)及时序图像(time seriesimages,例如fMRI及4D心动图像)的配准问题。 2 医学图像基本变换对于在不同时间或/和不同条件下获取的两幅图像I1(x1,y1,z1)和I2(x2,y2,z2)配准,就是寻找一个映射关系P:(x1,y1,z1) (x2,y2,z2),使I1的每一个点在I2上都有唯一的点与之相对应。并且这两点应对应同一解剖位置。映射关系P表现为一组连续的空间变换。常用的空间几何变换有刚体变换(Rigid body transformation)、仿射变换(Affine transformation)、投影变换(Projec-tive transformation)和非线性变换(Nonlin-ear transformation)。 (1)刚体变换: 所谓刚体,是指物体内部任意两点间的距离保持不变。例如,可将人脑看作是一个刚体。处理人脑图像,对不同方向成像的图像配准常使用刚体变换。刚体变换可以分解为旋转和平移:P(x)=Ax+b(1) x=(x,y,z)是像素的空间位置;A是3×3的旋转矩阵,b是3×1的平移向量。

(完整版)基于matlab的人脸识别系统设计毕业设计

毕业设计 [论文] 题目：基于MATLAB的人脸识别系统设计学院：电气与信息工程学院专业：自动化姓名：张迎

指导老师：曹延生完成时间：2013.05.28

摘要人脸识别是模式识别和图像处理等学科的一个研究热点，它广泛应用在身份验证、刑侦破案、视频监视、机器人智能化和医学等领域，具有广阔的应用价值和商用价值。人脸特征作为一种生物特征，与其他生物特征相比，具有有好、直接、方便等特点，因此使用人脸特征进行身份识别更易于被用户所接受。人脸识别技术在过去的几十年得到了很大的发展，但由于人脸的非刚性、表情多变等因素，使得人脸识别技术在实际应用中面临着巨大的困难。本文针对近年来国内外相关学术论文及研究报告进行学习和分析的基础上，利用图像处理的matlab实现人脸识别方法，这种实现简单且识别准确率高，但其缺点是计算量大，当要识别较多人员时，该方法难以胜任。利用MATLAB实现了一个集多种预处理方法于一体的通用的人脸图像预处理仿真系统，将该系统作为图像预处理模块可嵌入在人脸识别系统中，并利用灰度图像的直方图比对来实现人脸图像的识别判定。关键词：图像处理, Matlab, 人脸识别, 模式识别

ABSTRACT Human face recognition focuses on pattern recognition ,image processi ng andother subjects.It is widely used in authentication,investigation,video surveillance,intelligent robots,medicine and other areas.Facerecognition ha s wide application and business value.Facial feature asabiological character istic,compared with others is direct,friendly andconvenient.Facial featuree mployed in authentication are user-friendly. The technology of face recognition in the past few years obtained the v ery big development, but due to the face of nonrigid, expression and chang eablefactors, the face recognition technology in practical application are fa cing great difficulties. This paper aimed at home and abroad in recent year s the relevant papers and researchreports on study and on the basis of the a nalysis, some units within the data sensitivity places need to enter personne l to carry out limitation design and develop a set of identity verification ide ntification system, the system uses PCA face recognition method, therealiza tion is simple and the accuracy rate of recognition is high,but itsdrawback i s that a large amount of calculation, when to identify more staff,this metho d is difficult to do. The realization of a set of various pretreatment methods in one of the generic face image preprocessing simulation system based on MATLAB, the system is used as the image preprocessing module can be embedded in a face recognition system, and using the histogram matching gray image to realize the recognition of human face images to determine.

图像识别与人工智能研究所发展规划报告

图像所学科建设与发展规划根据学校建设世界知名高水平大学的发展目标，特制定图像所相应的学科建设与发展规划，以推动本学科的跨越式发展。一、学科建设总体目标（一）学科基础图像识别与人工智能研究所（简称图像所）将继续以跻身于我国的国防科技的发展为切入点，从事发展巡航导弹中制导、末制导关键技术，承担相关预先研究和攻关科研任务为学科建设的主攻方向。（1）目前本学科点共有五个研究方向： “计算机视觉与应用”、 “成像自动目标识别与精确制导技术”、 “多谱成像与遥感图像处理”、 “人工智能与思维科学” “面向模式识别的专用处理机与IC芯片设计”。（2）本学科点现有科研人员26人，其中教授（含博士生导师）7人，副教授7人。科研教学梯队层次高，年龄、专业结构合理。现有教学科研用房4000 平方米。实验设备固定资产5000余万元，已初步形成先进、配套的教学、科研、开发环境和雄厚的技术储备。（3）学科特点模式识别与智能系统是信息科学技术领域中发展最迅速的前沿领域之一。

来自不同成像传感器的不同谱段的图像信号能全面揭示客观世界的各种特性，智能控制是人工智能与自动控制相结合的现代控制理论和技术，图像模式处理、识别与智能控制的结合构成了智能信息系统和智能自动化系统发展的基础，不仅科学意义深远而且有十分广阔的应用前景。本学科点的主要特色是紧密结合航天、航空和信息技术领域的国家目标，进行应用基础和应用技术的研究和开发，重点研究多谱段图像模式信息的获取、表示、处理、分析与智能系统领域的基础理论与关键技术，同时培养和造就本领域高层次、高质量的科技人才。本学科点具有特色和优势的研究方向是： ·计算机视觉与应用在基于信息融合的信号处理、基于视觉、力觉和超声波接近觉的多传感器机器人系统和飞行器三维航迹规划技术方面具有特色，承担了国家重大型号XY-20末制导航迹规划攻关项目并进入型号研制。 ·成像自动目标识别与精确制导技术开展面向复杂背景和随机环境下成像自动目标检测、识别、跟踪的新理论、新方法、新算法和新系统的研究，其特色是瞄准有关国家安全的国家目标,紧密结合航天航空高技术发展,在基于图象和图象序列的自动目标识别,景象匹配定位等精确制导领域开展应用基础和高技术的研究,并将一系列高水平成果应用于国防高技术武器系统中。 ·多谱成像与遥感图像处理研究微波辐射特性及成像技术、激光雷达成像信号处理和遥感图像处理与

数字图像处理技术的现状及其发展方向(笔记)

数字图像处理技术的现状及其发展方向一、数字图像处理历史发展数字图像处理(Digital Image Processing)将图像信号转换成数字信号并利用计算机对其进行处理。 1.起源于20世纪20年代。 2.数字图像处理作为一门学科形成于20世纪60年代初期，美国喷气推进实验室(JPL)推动了数字图像处理这门学科的诞生。 3.1972年英国EMI公司工程师Housfield发明了用于头颅诊断的X射线计算机断层摄影装置即CT(Computer Tomograph)，1975年EMI公司又成功研制出全身用的CT装置,获得了人体各个部位鲜明清晰的断层图像。 4.从70年代中期开始,随着计算机技术和人工智能、思维科学研究的迅速发展,数字图像处理向更高、更深层次发展，人们已开始研究如何用计算机系统解释图像,实现类似人类视觉系统理解外部世界，其中代表性的成果是70年代末MIT的Marr提出的视觉计算理论。二、数字图像处理的主要特点 1．目前数字图像处理的信息大多是二维信息,处理信息量很大,对计算机的计算速度、存储容量等要求较高。 2.数字图像处理占用的频带较宽,在成像、传输、存储、处理、显示等各个环节的实现上,技术难度较大,成本也高,这就对频带压缩技术提出了更高的要求。 3.数字图像中各个像素是不独立的,其相关性大。因此,图像处理中信息压缩的潜力很大。 4.由于图像是三维景物的二维投影,一幅图像本身不具备复现三维景物的全部几何信息的能力,要分析和理解三维景物必须作合适的假定或附加新的测量。在理解三维景物时需要知识导引,这也是人工智能中正在致力解决的知识工程问题。 5．一方面，数字图像处理后的图像一般是给人观察和评价的,因此受人的因素影响较大，作为图像质量的评价还有待进一步深入的研究；另一方面，计算机视觉是模仿人的视觉,人的感知机理必然影响着计算机视觉的研究,这些都是心理学和神经心理学正在着力研究的课题。三、数字图像处理的优点 1.再现性好；图像的存储、传输或复制等一系列变换操作不会导致图像质量的退化。 2.处理精度高；可将一幅模拟图像数字化为任意大小的二维数组,现代扫描仪可以把每个像素的灰度等级量化为16位甚至更高。 3.适用面宽；图像可以来自多种信息源，图像只要被变换为数字编码形式后,均是用二维数组表示的灰度图像组合而成,因而均可用计算机来处理。 4.灵活性高；数字图像处理不仅能完成线性运算,而且能实现非线性处理,即凡是可以用数学公式或逻辑关系来表达的一切运算均可用数字图像处理实现。四、数字图像处理过程及其主要进展常见的数字图像处理有:图像的采集、数字化、编码、增强、恢复、变换、

图像识别技术

伴随着通信技术与信息处理技术的迅猛发展,越来越多的纸质文档通过数字采集设备转换成文本图像,从而使文本图像数据能够快捷的在网络、卫星、传真通信信道中传输,因此,文本图像已逐渐成一个重要的信息来源。但是,现有的文本图像处理系统自动化程度低,且通用性不高,无法满足文本图像处理广泛性与实时性的要求。因此,研究如何对文本图像进行分析与处理,以便高效、快捷的获取文本图像的信息,是一项十分有意义的研究课题。本文在总结已有研究成果的基础上对文本图像的识别检索、预处理、版面分析和表格图像识别展开研究。所做的主要工作如下:1.依据图像的灰度分布和结构特征差异,对基于图像信息度量的文本图像识别检索算法进行改进,构造一种基于信息度量与Radon变换的文本图像识别检索算法。该算法综合利用文本图像与连续色调】图像的灰度分布与结构特征差异进行文本图像的识别检索。实验结果表明,所构造算法可有效降低文本图像识别检索的误识率。2.对基于Hough变换的文本图像倾斜检图像识别，是利用计算机对图像进行处理、分析和理解，以识别各种不同模式的目标和对像的技术。图像识别可能是以图像的主要特征为基础的。每个图像都有它的特征,如字母A有个尖，P有个圈、而Y的中心有个锐角等。对图像识别时眼动的研究表明，视线总是集中在图像的主要特征上，也就是集中在图像轮廓曲度最大或轮廓方向突然改变的地方，这些地方的信息量最大。由此可见，在图像识别过程中，知觉机制必须排除输入的多余信息,抽出关键的信息。图像识别的目的在于用计算机自动处理图像信息,以代替人去完成图像分类及辨识的任务。数字图像处理与识别技术是模式识别领域一个重要的研究方向, 近几十年来,图像识别技术取得了深入和迅速的发展,并广泛应用于图像遥感、机器人视觉、生物医学、地质勘探等多个领域。随着图像识别技术在多领域的发展,由其在计算机视觉和图像处理研究中,已经取得了一定的研究成果。Mallat在小波变换中滤波器的设计、Belhumeur在Fisher变换中的识别模型和Largrange优化方式建立支持向量机。本文在总结上述研究成果的基础上,首先对摄像头采集的数据进行了处理,完成JPEG的编码,详细讨论了JPEG图像解码的过程并实现了其算法。

数字图像处理课程设计人脸检测与识别

数字图像处理课程设计

人脸检测与识别课程设计一、简介人脸检测与识别是当前模式识别领域的一个前沿课题，人脸识别技术就是利用计算机技术，根据数据库的人脸图像，分析提取出有效的识别信息，用来 “辨认”身份的技术。人脸识别是模式识别研究的一个热点, 它在身份鉴别、信用卡识别, 护照的核对及监控系统等方面有着广泛的应用。人脸图像由于受光照、表情以及姿态等因素的影响, 使得同一个人的脸像矩阵差异也比较大。因此, 进行人脸识别时, 所选取的特征必须对上述因素具备一定的稳定性和不变性. 主元分析(PCA)方法是一种有效的特征提取方法,将人脸图像表示成一个列向量, 经过PCA 变换后, 不仅可以有效地降低其维数, 同时又能保留所需要的识别信息, 这些信息对光照、表情以及姿态具有一定的不敏感性. 在获得有效的特征向量后, 关键问题是设计具有良好分类能力和鲁棒性的分类器. 支持向量机(SVM ) 模式识别方法,兼顾训练误差和泛化能力, 在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势。本此课程设计基于MATLAB，将检测与识别分开进行。其中检测部分使用实验指导书上的肤色模型算法进行，不进行赘述。识别部分采用PCA算法对检测出的人脸图像进行特征提取, 再利用最

邻近距离分类法对特征向量进行分类识别，将在后文具体表述。仿真结果验证了本算法是有效的。二、人脸检测源码 1.img=imread('D:\std_test_images\face3.jpg'); figure; imshow(img); R=img(:,:,1); G=img(:,:,2); B=img(:,:,3); faceRgn1=(R>95)&(G>40)&(B>20)&max(img,[],3)-min(img,[],3)>15& abs(R-G)>15&R>B; figure; imshow(faceRgn1); r=double(R)./double(sum(img,3)); g=double(G)./double(sum(img,3)); Y=0.3*R+0.59*G+0.11*B; faceRgn2=(r>0.333)&(r<0.664)&(g>0.246)&(g<0.398)&(r>g)& g>=0.5-0.5*r; figure; imshow(faceRgn2); Q=faceRgn1.*faceRgn2;

数字图像处理技术的研究现状与发展方向

数字图像处理技术的研究现状与发展方向孔大力崔洋（山东水利职业学院，山东日照276826）摘要：随着计算机技术的不断发展，数字图像处理技术的应用领域越来越广泛。本文主要对数字图像处理技术的方法、优点、数字图像处理的传统领域及热门领域及其未来的发展等进行相关的讨论。关键词：数字图像处理；特征提取；分割；检索引言图像是指物体的描述信息，数字图像是一个物体的数字表示，图像处理则是对图像信息进行加工以满足人的视觉心理和应用需求的行为。数字图像处理是指利用计算机或其他数字设备对图像信息进行各种加工和处理，它是一门新兴的应用学科，其发展速度异常迅速，应用领域极为广泛。数字图像处理的早期应用是对宇宙飞船发回的图像所进行的各种处理。到了70年代，图像处理技术的应用迅速从宇航领域扩展到生物医学、信息科学、资源环境科学、天文学、物理学、工业、农业、国防、教育、艺术等各个领域与行业，对经济、军事、文化及人们的日常生活产生重大的影响。数字图像处理技术发展速度快、应用范围广的主要原因有两个。最初由于数字图像处理的数据量非常庞大，而计算机运行处理速度相对较慢，这就限制了数字图像处理的发展。现在计算机的计算能力迅速提高，运行速度大大提高，价格迅速下降，图像处理设备从中、小型计算机迅速过渡到个人计算机，为图像处理在各个领域的应用准备了条件。第二个原因是由于视觉是人类感知外部世界最重要的手段。据统计，在人类获取的信息中，视觉信息占60％，而图像正是人类获取信息的主要途径，因此，和视觉紧密相关的数字图像处理技术的潜在应用范围自然十分广阔。 1数字图像处理的目的一般而言，对图像进行加工和分析主要有以下三方面的目的[1]： (1)提高图像的视感质量，以达到赏心悦目的目的。如去除图像中的噪声，改变图像中的亮度和颜色，增强图像中的某些成分与抑制某些成分，对图像进行几何变换等，从而改善图像的质量，以达到或真实的、或清晰的、或色彩丰富的、或意想不到的艺术效果。 (2)提取图像中所包含的某些特征或特殊信息，以便于计算机进行分析，例如，常用做模式识别和计算机视觉的预处理等。这些特征包含很多方面，如频域特性、灰度/颜色特性、边界/区域特性、纹理特性、形状/拓扑特性以及关系结构等。 (3)对图像数据进行变换、编码和压缩，以便于图像的存储和传输。 2数字图像处理的方法数字图像处理按处理方法分，主要有以下三类，即图像到图像的处理、图像到数据的处理和数据到图像的处理[2]。（1）图像到图像。图像到图像的处理，其输入和输出均为图像。这种处理技术主要有图像增强、图像复原和图像编码。首先，各类图像系统中图像的传送和转换中，总要造成图像的某些降质。第一类解决方法不考虑图像降质的原因，只将图像中感兴趣的特征有选择地突出，衰减次要信息，提高图像的可读性，增强图像中某些特征，使处理后的图像更适合人眼观察和机器分析。这类方法就是图像增强。例如，对图像的灰度值进行修正，可以增强图像的对比度；对图像进行平滑，可以抑制混入图像的噪声；利用锐化技

关于人工智能中的图像识别技术的研究

１９１关于人工智能中的图像识别技术的研究翁和王（武夷学院数学与计算机学院，福建武夷山354300）摘要：图像识别技术作为在信息时代发展起来的一项信息技术，其主要是利用计算机对人工进行替代，实现对众多的物理信息进行处理。计算机技术快速发展也推动了图像识别技术得以迅猛的发展。文章就图像识别的技术原理、模式识别进行图像识别技术概述，并对其识别过程进行一定的分析，重点对神经网络以及非线性降维两个形式的图像识别技术加以分析。以期对图像识别有关的研究人员与应用人士有所参考。关键词：人工智能；原理与过程；图像识别技术；非线性；神经网络中图分类号：TP18文献标识码：A 文章编号：1673-1131（2016）10-0191-02 0引言图像识别技术作为人工智能内的重要领域之一，在计算机技术和信息技术快速发展的背景下，其也得到了愈发广泛的使用，其在医疗诊断、指纹识别、面部识别以及卫星云图识别等方面具有着很好的应用。图像识别技术通常是指利用计算机对系统前端捕获的图片根据既定的目标对其进行处理。图像识别在人们日常的生活中也得到普遍的应用，诸如条码识别、车牌捕捉以及手写识别等。随着其不断的发展与完善，其今后的应用领域也会更加的广泛。 1图像识别技术的概述1.1图像识别的技术原理事实上，图像识别具有的原理并非很深奥，主要是图像识别所需处理的信息非常的复杂。计算机中的所有处理技术均不能随意出现，是众多学者通过实践获得的启示，通过程序使其得到模拟与实现。计算机实现图像识别所需的原理与人类进行图像识别所需的原理基本上是一致的，仅仅是计算机不存在人类视觉和感觉方面的影响。人类在进行图像识别过程中并非仅是利用这一图像存在于脑海内的记忆加以识别，而是通过图像自身拥有的特征对其进行相应的分类，之后利用各个类别拥有的特征使图片被识别出来。当我们看到图片时，大脑便会快速感知出以前见过这张或与之相类似的图片与否。事实上在看到和感知间已经实现了快速的识别，这一识别与搜索存在一定的相似性[1]。在识别过程中，大脑将会按照存储记忆内被分好类的图片展开识别，检查其是否和这一图像存在相同或者是类似特征记忆存储，便识别出以往时候看见过这一图片。计算机进行图像识别的原理也是这样，利用分类和提取出图像的重要特征，并对多余的无用特征加以有效地排除，以此实现对图像的识别。计算机所能提取出来的上述特征有时会较为明显，而有时也会非常的普通，这在极大程度上对计算机识别效率造成一定的影响。总而言之，利用计算机进行视觉识别时，图像中的内容一般是通过图像特征对其加以描述的[2]。 1.2模式识别模式识别作为信息科学与人工智能中的重要组成，其通常是对现象和事物处于不同形式中信息实现处理与分析，以便能够达到对现象与事物进行分类、描述以及辨认等目标。而计算机能够实现图像识别便是对人类进行图像识别时的一种模拟，在实现图像识别时，能够展开模式识别是不可或缺的。以往的模式识别仅仅是人类所掌握基本智能之一，伴随人工智能以及计算机技术得到兴起与发展，人类自身具有的识别模式便无法再满足人类的生活需求，对此人们便需要利用计算机来对人类脑力劳动进行一定程度的替代与扩展。这也就产生了计算机形式的模式识别。简而言之，模式识别便是对数据实现分类，其是一门和数学有着密切联系的科学，其所运用的大量思想便是数学中的统计和概率[3] 。可以将模式识别分成统计模糊模式、识别模式识别以及句法模式识别三类。 2图像识别技术的识别过程由于计算机进行图像识别和人类进行图像识别所采用的是一样的原理，因此上述两种识别过程也会存在一定的相似性。可以将图像识别技术划分为如下几步：第一步，信息的获取，其是指利用传感器将声音和光等信息装换为电信号，简而言之便是获取识别对象具有的基本信息，同时将其装换成为计算机可以识别的信息。第二步，预处理，其是指对图像进行去噪、变换以及平滑等处理操作，以此来提升图像所具有的重要特点。第三步，特征抽取与选择，其是在模式识别过程中，要对图像进行特征的抽取与选择，简而言之便是识别的图像是多种多样的，若想通过一定的方式将其分离开，便要对图像中拥有的自身特征进行识别，在特征的获取时便称为特征抽取[4]。在进行特征抽取过程中，获取的特征并非一定对本次识别有所价值，此时便要对所获取的特征进行一定的提取，这便是特征选择。对于图像识别整个过程而言，特征抽取与选择时期中最为关键的步骤之一，因此，这一步使进行图像识别理解时的重点内容。第四步，分类器设计与分类决策，其中分类器设计即利用训练来制定出一个识别规则，借此识别规则便能够获得一个特征种类，从而让图像识别可以达到更高的辨识率。而分类决策则是对特征空间内的被识别对象实现分类的最佳识别方法。 3图像识别技术的研究分析 3.1神经网络形式的图像识别技术神经网络形式的图像识别是目前较为新型的技术，其是基于以往的图像识别方式，并将神经网络算法进行有效的融合。这里所说的神经网络指的是人工神经网络，换句话说便是该神经网络并非是动物体所拥有的神经网络，而是人类根据动物神经网络进行人工模拟的一种神经网络。对于神经网络形式的图像识别技术而言，遗传算法和BP 神经网络进行有效的结合是目前基于神经网络形式的图像识别技术内最为经典的模型，其在诸多的领域之中均有所应用。对图像识别系统运用神经网络系统，通常先对图像特征进行提取，之后将图像特征向神经网络中加以映射，以此实现对图像的识别与分类。例如，对于智能汽车监控中拍照识别技术而言， 2016 （Sum.No 166）信息通信 INFORMATION &COMMUNICATIONS 2016年第10期（总第166期）