视频图像中字符识别算法的研究及其DSP实现

万方数据

万方数据

万方数据

万方数据

基于模板匹配算法的数字识别讲解

中南民族大学 毕业论文(设计) 学院: 计算机科学学院 专业: 软件工程年级:2009 题目: 基于模板匹配算法的数字识别学生姓名: 李成学号:09065093指导教师姓名: 李波职称: 讲师 2013年5月

中南民族大学本科毕业论文(设计)原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。 作者签名:2013年月日

摘要 (1) Abstract (1) 1 绪论 (2) 1.1 研究目的和意义 (2) 1.2 国内外研究现状 (2) 2 本文基本理论介绍 (3) 2.1 位图格式介绍 (3) 2.2 二值化 (3) 2.3 去噪 (3) 2.4 细化 (4) 2.5 提取骨架 (4) 3 图像的预处理 (5) 3.1 位图读取 (5) 3.2 二值化及去噪声 (5) 3.3 提取骨架 (6) 4 基于模板匹配的字符识别 (8) 4.1 样本训练 (8) 4.2 特征提取 (8) 4.3 模板匹配 (9) 4.4 加权特征模板匹配 (10) 4.5 实验流程与结果 (10) 5 结论 (16) 5.1 小结 (16) 5.2 不足 (16) 6 参考文献 (17)

基于模板匹配算法的数字识别 摘要 数字识别已经广泛的应用到日常生活中,典型的数字自动识别系统由图像采集、预处理、二值化、字符定位、字符分割和字符识别等几部分组成, 这些过程存在着紧密的联系。传统的模板匹配算法因为图像在预处理之后可能仍然存在较大的干扰,数字笔画粗细不均匀,有较大的噪声,识别效率不高。本文采的主要思想就是对字符进行分类,之后对字符进行细化,提取细化后字符的特征矢量,与模板的特征矢量进行加权匹配,误差最小的作为识别结果。本文在模板匹配法的基础上, 采用了特征值加权模板匹配法, 并且改进了匹配系数的求法。应用该法取得了满意的效果, 提高了识别率。 关键词:模板匹配;数字识别;特征值加权;字符识别; Template matching algorithm-based digital identification Abstract Digital identification has been widely applied to daily life, the typical digital automatic identification system by the image acquisition, pre-processing, binarization, character positioning, character segmentation and character recognition several parts, there is a close link these processes. Traditional template matching algorithm because the image may still exist after pre-greater interference, digital strokes uneven thickness, the noise, the identification efficiency is not high. Adopted herein main idea is to classify the character after character refinement, the characters feature vector extraction refinement, and the template feature vector is weighted matching, the minimum error as a recognition result. Template matching method based on feature weighted template matching method, and improve the matching coefficient method. The application of the method to obtain satisfactory results, to improve the recognition rate. Key words:Template matching; digital identification; characteristic value weighted; character recognition;

现代数字信号处理及其应用——LMS算法结果及分析

LMS 算法MATLAB 实现结果及其分析 一、LMS :为课本155页例题 图1.1:LMS 算法学习曲线(初始权向量[]T 00w ?=) 图1.2滤波器权系数迭代更新过程曲线(步长075.0=μ) 图1.3滤波器权系数迭代更新过程曲线(步长025.0=μ)图1.4滤波器权系数迭代更新过程曲线(步长015.0=μ) 分析解释: 在图1.1中,收敛速度最慢的是步长为015.0=μ的曲线,收敛速度最快的是步长075.0=μ的曲线,所以可以看出LMS 算法的收敛速度随着步长参数的减小而相应变慢。图1.2、1.3、1.4分别给出了步长为075.0=μ、025.0=μ、025.0=μ的滤波器权系数迭代更新过程曲线,可以发现其不是平滑的过程,跟最抖下降法不一样,体现了其权向量是一个随机过程向量。

LMS2:为课本155页例题,156页图显示结果 图2.1:LMS 算法学习曲线(初始权向量[]T 00w ?=) 图2.2滤波器权系数迭代更新过程曲线(步长025.0=μ) 图2.3滤波器权系数迭代更新过程曲线(步长025.0=μ)图2.4最陡下降法权值变化曲线(步长025.0=μ) 分析解释: 图2.1给出了步长为025.0=μ的学习曲线,图2.2给出了滤波器权向量的单次迭代结果。图2.3给出了一 次典型实验中所得到的权向量估计()n w ?=,以及500次独立实验得到的平均权向量()}n w ?E{=的估计,即()∑==T t n w T 1 t )(?1n w ?,其中)(?n w t 是第t 次独立实验中第n 次迭代得到的权向量,T 是独立实验次数。可以发现,多次独立实验得到的平均权向量()}n w ?E{=的估计平滑了随机梯度引入的梯度噪声,使得其结果与使用最陡下降法(图2.4)得到的权向量趋于一致,十分接近理论最优权向量[]T 7853.08361.0w 0-=。 LMS3:为课本172页习题答案

视频会议视频调试技术与技巧

视频会议视频调试技术与技巧 视频会议是图像、声音的有机结合,为了获得理想的效果,必须按照操作规程做好前期的准备和调试工作。在实际应用中还有许多不尽人意的地方,主要表现在参数设置和实际操作等方面。如何做到心中有数、得心应手?本文就相关技术问题进行探讨,提出不同的解决方法和应用技巧。在视频调试过程中,常见的问题是图像无彩色和图像偏色。对于图像无彩色现象,可通过会议终端控制软件中的参数设置来加以解决;对于图像偏色现象,要通过白 视频会议是图像、声音的有机结合,为了获得理想的效果,必须按照操作规程做好前期的准备和调试工作。在实际应用中还有许多不尽人意的地方,主要表现在参数设置和实际操作等方面。如何做到心中有数、得心应手?本文就相关技术问题进行探讨,提出不同的解决方法和应用技巧。 在视频调试过程中,常见的问题是图像无彩色和图像偏色。对于图像无彩色现象,可通过会议终端控制软件中的参数设置来加以解决;对于图像偏色现象,要通过白平衡调整来校正因光源的色温变化而引起的图像偏色。会场中应避免使用混合光(室内照明光源、室外阳光的直射和散射)作为照明光源,不同色温的光源混合使用,将得不到理想的色彩还原,因此要尽量避免在会场中存在两种以上不同色温的光源。若使用视频会议摄像机,可通过重启的方法加以排除;若使用专业摄像机,可通过白平衡调整来加以解决,具体方法是:根据会场照明光源的色温选择合适的色温滤色片,采用自动白平衡调整,以保证准确的色彩还原。 在召开会议期间,要显示各地分会场的画面,若分会场采用“推”、“拉”、“摇”技巧来拍摄,存在问题的具体表现为运动画面不连贯、运动速度不均匀、落幅画面不到位。“推”是把视线逐渐接近被摄对象,由整体引向局部,突出整体中的某一部分;“拉”是由局部引向整体,说明某一局部所处的环境;“摇”分为左摇和右摇。“推”和“拉”是在同一镜头内包含有特写、近景、中景、全景画面,强调落幅,因此落幅的画面构图尤其重要,这是衡量画面是否到位的标准。不论采用哪种拍摄技巧,都要确保画面的稳定性和连续性,都要以稳定的画面作为起幅,并以稳定的画面作为落幅,并要有足够长的时间来保证画面的相对静止,这是人们心理要求和镜头组接所需要的。无目的地急推、急拉、突然变速、中途停止等,都会使观众造成视觉感受异常和动荡不安的感觉,其主要原因是操作失误和画面延滞效应所造成的。 对于采用会议终端控制软件进行控制的,要采用手动方式进行。比如,若要进行“推”(或拉)的动作,先构好落幅的画面,然后“拉”(或推)到全景,当总控室切换到本端的画面后,再按下鼠标,在落幅处松开鼠标;若要进行“摇”的动作,先构好落幅的画面,当总控室切换到本端的画面后,再按下鼠标进行左摇或右摇,在落幅处松开鼠标。但在实际操作中,由于摄像机的机位所限制,“摇”动作的落幅画面不太理想。对于采用专业摄像机控制的,要采用电动变焦方式进行,按下T(推)或W(拉)即可完成所需要的拍摄技巧。由于按压变焦钮

车辆牌照图像识别算法研究与实现本科毕设论文

Q260046902 专业做论文 西南科技大学 毕业设计(论文)题目名称:车辆牌照图像识别算法研究与实现

车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数字字符识别的问题,本文采用了基于BP神经网络的识别方法。在学习并掌握了数字图像处理和模式识别的一些基本原理后,使用VC++6.0软件利用以上原理针对车牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++

Research and Realization of License Plate Recognition Algorithm Abstract:In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC++ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC++

数字信号处理期末论文

题目:基于DSP的FFT程序设计的研究 作者届别 系别专业 指导老师职称 完成时间2013.06

内容摘要 快速傅里叶变(Fas Fourier Tranformation,FFT)是将一个大点数N的DFT分解为若干小点的D F T的组合。将用运算工作量明显降低,从而大大提高离散傅里叶变换(D F T) 的计算速度。因各个科学技术领域广泛的使用了FFT 技术它大大推动了信号处理技术的进步,现已成为数字信号处理强有力的工具,本论文将比较全面的叙述各种快速傅里叶变换算法原理、特点,并完成了基于MATLAB的实现。 关键词:频谱分析;数字信号处理;MATLAB;DSP281x

引言: 1965年,库利(J.W.Cooley)和图基(J.W.Tukey)在《计算数学》杂志上发表了“机器计算傅立叶级数的一种算法”的文章,这是一篇关于计算DFT的一种快速有效的计算方法的文章。它的思路建立在对DFT运算内在规律的认识之上。这篇文章的发表使DFT的计算量大大减少,并导致了许多计算方法的发现。这些算法统称为快速傅立叶变换(Fast Fourier Transform),简称FFT,1984年,法国的杜哈梅尔(P.Dohamel)和霍尔曼(H.Hollmann)提出的分裂基快速算法,使运算效率进一步提高。FFT即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步。 随着科学的进步,FFT算法的重要意义已经远远超过傅里叶分析本身的应用。FFT算法之所以快速,其根本原因在于原始变化矩阵的多余行,此特性也适用于傅里叶变换外的其他一些正交变换,例如,快速沃尔什变换、数论变换等等。在FFT的影响下,人们对于广义的快速正交变换进行了深入研究,使各种快速变换在数字信号处理中占据了重要地位。因此说FFT对数字信号处理技术的发展起了重大推动作用。 信号处理中和频谱分析最为密切的理论基础是傅立叶变换(Fouriertransform,FT)。快速傅立叶变换(FFT)和数字滤波是数字信号处理的基本内容。信号时域采样理论实现了信号时域的离散化,而离散傅里叶变换理论实现了频域离散化,因而开辟了数字技术在频域处理信号的新途径,推进了信号的频谱分析技术向更广的领域发展。 1.信号的频谱分析 如果信号频域是离散的,则信号在时域就表现为周期性的时间函数;相反信号在时域上是离散的,则该信号在频域必然表现为周期的频率函数。不难设想,一个离散周期序列,它一定具有既是周期又是离散的频谱。有限长序列的离散傅里叶变换和周期序列的离散傅里叶级数本质是一样的。因而有限长序列的离散傅里叶变换的定义为:x(n)和X(k)是一个有限长序列的离散傅里叶变换对。

基于神经网络方法的字符识别方法

论文写作与规范 题目:基于神经网络方法的字符识别方法 学号: 210802102 专业:计算机系统结构 姓名:靳飞飞 2009 年 1 月 9日

基于神经网络方法的字符识别方法 靳飞飞 (中国海洋大学信息科学与工程学院, 山东青岛266071) 摘要:字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,而是模式识别领域中大多数课题都会遇到的基本问题,并且在不同的课题中,由于具体的条件不同,解决的方法也不尽相同,因而字符识别的研究仍具有理论和实践意义。这里讨论的是用神经网络方法实现基于照相的数字图像的字符识别的问题。并且通过模板匹配的方法作为参照,以体现神经网络在处理模式识别问题上的优势。由于人工神经网络的非线性以及并行性和鲁棒性等特点,在上述领域,其取得了以往传统算法无法获得的成功。 关键词:神经网络;字符识别;图像处理 Character recognition based on neural network Jin Feifei (College of Information Science and Engineering,Ocean University of China,Qingdao 266071,China) Abstract:Character recognition is a traditional problem in the field of pattern recognition, for it is rather an isolated task than a fundamental problem in most work of pattern recognition area, with which we have various methods to deal in terms of specific conditions. That means the pursuit of character recognition is of great significance both in theory and in practice .The goal of this paper is using neural network to recognize characters on digital image based on camera. It also can be seen, in the paper, the advantage of neural network compared with the template matching method. Because its nonlinearity, parallel and strong, in these fields mentioned above, artificial neural network has achieved the success which other traditional algorithms can not reach. Key word: neural network, character recognition, image processing 1引言 字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,

数字验证码识别算法的研究与设计

数字验证码识别算法的研究和设计 王虎, 冯林, 孙宇哲 Wang Hu, Feng Lin, Sun Yuzhe 大连理工大学大学生创新院,大连116023 Institute of University Students’ Innovation, Dalian University of Technology, Dalian 116023, China E-mail: wlys111@https://www.360docs.net/doc/c08220658.html, Research and Design of Digital character-based CAPTCHA Recognition Abstract:CAPTCHA Recognition can be used in multi-send technology. Digital character-based CAPTCHA Recognition, which is foundation of pattern recognition research, is a kind of OCR. In this paper, we proposed a CAPTCHA Recognition System based on simple distortion and its architecture is template matching. Hilditch thinning algorithm, circle structure searching algorithm and dynamic template analyzing algorithm is chose and the weigh of template is also used to improve the recognition accuracy. The advantage of the system is that the recognition precision is perfect. Key words:Template matching, Weighted Template, dynamic template, grid feature, crossing points feature 摘要:验证码识别技术可以用于网站的群发软件,数字验证码识别是光学字符识别(OCR)的一种,是进行模式识别研究的基础。论文提出了以简单变形的数字字符为理论研究素材,将模板匹配作为基本框架的验证码识别系统。系统采用图像的Hilditch细化算法、环结构的搜索算法、活动模板分析算法,加入模板分量的权值。其优点在于能够对特定数字验证码精确识别,实验中识别准确率基本达到100%。 关键字:模板匹配,加权模板,活动模板,网格特征,交叉点特征 文章编号:文献标识码:A 中图分类号:TP391.43 引言 目前,网络上出现了很多以图片形式出现的基于文本的验证码。所谓验证码,就是将一串随机产生的字符,生成一幅图片,图片里随机的加入一些像素干扰、颜色干扰和形变干扰等等,以达到防止恶意注册等目的。有的验证码是无像素干扰的、大小固定的、质心位置居中,含有形变干扰的数字字符,我们称之为简单变形体。反之,我们称加入了更多干扰的字符为复杂变形体。 验证码千变万化,而当前的识别系统都具有很强针对性,只能够识别一种类型的验证码,而且验证码的技术不断发展,出现了更加复杂的基于图像的验证码系统[5],并且目前人工智能(机器智能)还远未赶上人类智能,但是对于给定的验证码系统,在获知其特点之后,基本能够以一定的准确率进行识别[6、7]。 基金项目: 国家自然科学基金( the National Foundation of China under Grant No.10471051 )。 作者简介: 王虎(1984-),学士,研究方向:计算机图形处理,模式识别与智能控制; 冯林(1969-),博士,教授,研究方向:图像压缩、配准及融合和演化算法; 孙宇哲(-),硕士,研究方向:.

数字信号处理技术及发展趋势

数字信号处理技术及发展趋势 贵州师范大学物电学院电子信息科学与技术 罗滨志 120802010051 摘要 数字信号处理的英文缩写是DSP,而数字信号处理又是电子设计领域的术语,其实现的功能即是用离散(在时间和幅度两个方面)所采样出来的数据集合来表示和处理信号和系统,其中包括滤波、变换、压缩、扩展、增强、复原、估计、识别、分析、综合等的加工处理,从而达到可以方便获得有用的信息,方便应用的目的【1】。而DPS实现的功能即是对信号进行数字处理,数字信号又是离散的,所以DSP大多应用在离散信号处理当中。 从DSP的功能上来看,其发展趋势日益改变着我们的科技的进步,也给世界带来了巨大的变化。从移动通信到消费电子领域,从汽车电子到医疗仪器,从自动控制到军用电子系统中都可以发现它的身影【2】。拥有无限精彩的数字信号处理技术让我们这个世界充满变化,充满挑战。 In this paper Is the abbreviation of digital signal processing DSP, the digital signal processing (DSP) is the term in the field of electronic design, the function of its implementation is to use discrete (both in time and amplitude) sampling represented data collection and processing of signals and systems, including filtering, transformation, compression, extension, enhancement, restoration, estimation, identification, analysis, and comprehensive processing, thus can get useful information, convenient for the purpose of convenient application [1]. And DPS the functions is to digital signal processing, digital signal is discrete, so most of DSP applications in discrete signal processing. From the perspective of the function of DSP, and its development trend is increasingly changing our of the progress of science and technology, great changes have also brought the world. From mobile communication in the field of consumer electronics, from automotive electronics to medical equipment, from automatic control to the military electronic systems can be found in the figure of it [2]. Infinite wonderful digital signal processing technology to let our world full of changes, full of challenges

数字视频中文字分割算法的研究

万罡周洞汝崔永毅傅华胜 (武汉大学计算机信息学院,武汉<#""=!) 摘要文章对三种文字分割算法,包括基于阈值的二值化算法、基于分裂/ 合并的算法和基于纹理的算法,进行了分析、实验与评价,最后提出一种边缘检测— —投影— —局部区域二值化的文字分割算法,并给出与前面一些算法的比较。关键词文字分割阈值分裂/ 合并边缘检测 文章编号0""!6>##06(!""#)"!6"0"#6"#文献标识码? 中图分类号@A#B0 !"#$%&’"()*+,&-."(/&0 1)2"!),/)’"3".&’.’4.,."3+5.$)& 63’73’,8(&’,-#9#. :&’,%.;#<#3=()’, (C)D’:,&)+,.E F.&D G,):*H-)+H),I G8’+J+-K):;-,L,I G8’+<#""=!) *>="-3?":%+,8-;,8);-;,,8:))M-EE):)+,’5(.:-,8&.E,)N,;)(&)+,’,-.+,-+H5G M-+(,8:);8.5M6O’;)M’5(.:-,8&,;D5-,,-+(/ &):(-+(O’;)M’5(.:-,8&’+M,)N,G:)O’;)M’5(.:-,8&,’:)’+’5L P)M’+M)K’5G)M,,8)+,,8)’G,8.:;O:-+(’+)EE-H-)+,,)N, ;)(&)+,’,-.+’5(.:-,8&’;E.55.Q,E-:;,,’+)M()M),)H,-.+ R D:.S)H,-.+O’;)M&),8.M-;G;)M,.(),,)N,:)(-.+;,;)H.+M,,)N,:)(-.+;’:);)(&)+,)M OL ,8:);8.5M6O’;)M&),8.M$ @)%A&-$=:@)N,;)(&)+,’,-.+,@8:);8.5M,*D5-,,-+(/ &):(-+(,T M()M),)H,-.+ 文字分割的本质是图像分割(%&’()*)(&)+,’,-.+)。图像分割是计算机视觉领域中极为重要的内容之一,是实现自动图像分析时首先需要完成的操作。它是根据图像的某些特征或特征集合的相似性准则,对图像像素进行分组聚类,把图像平面划分为一系列“有意义”的区域,使其后的图像分析、识别等高级处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。尽管对图像分割算法的研究已有几十年的历史,依据各种理论,至今已提出了上千种类型的分割算法,但是它们大都是针对具体问题的,目前还没有通用的分割理论和算法。下面将对三种文字分割算法,包括基于阈值的二值化算法、基于分裂/ 合并的算法和基于纹理的算法,进行分析、实验与评价,并提出一种边缘检测— —投影— —局部区域二值化的文字分割算法。有关,则所得的阈值是与坐标相关的(即动态阈值,前两种阈值对应可称为固定阈值)。 以上对阈值分割方法的分类思想是通用的。近年来,许多取阈值分割方法借用了神经网络、模糊数学、遗传算法、信息论等工具,但这些方法仍可归纳到以上三种方法类型中。 0$0阈值的灰度图像二值化 在利用单阈值方法来分割灰度图像时一般都对图像有一定的假设。最常用的模型可描述如下:假设图像由具有单峰灰度分布的目标和背景组成,且目标和背景象素在灰度值上有很大的差别。对于这类图像,它们的灰度直方图基本上可看作是由分别对应目标和背景的两个单峰直方图混合而成,可以把双峰之间的谷点作为阈值!,对图象作以下二值化处理: ’(#,$)3!0 若%(#,$)!!(! " 若%(#,$)"! 0 基于阈值的二值化算法 在基于阈值的灰度图像分割算法中,确定阈值是关键。阈值一般可写成如下形式: 对于某些新闻视频中的标题新闻、影视片名或演员表等它们的背景一般比较简单,可以采用单阈值分割方法。但是,大多数视频中的文字都有较复杂的背景,反映在其灰度直方图上 !"!1#,$,%(#,$),&(#,$)2(0)将出现多个峰谷,此时若采用单阈值的分割方法则无法将文字 其中%(#,$)是在象素点(#,$)对处的灰度值,&(#,$)是该点邻域的某种局部性质。换句话说,!在一般情况下可以是(#,$),%(#,$)和&(#,$)的函数。借助式(0),可以将阈值分割方法分成如下三类: (0)如果仅根据%(#,$)来选取阈值,所得的阈值仅与各个图像象素的本身性质相关(即全局阈值); (!)如果阈值是根据%(#,$)和&(#,$)来选取的,所得的阈值就是与(局部)区域性质相关的(即局部阈值)。 (#)如果阈值除根据%(#,$)和&(#,$)来选取外,还与(#,$)从背景中分离出来。为此,作者尝试采用多阈值方法将所有的峰都分离出来,如果灰度图像中的文字所占的象素的灰度值相近且与图像中其他目标的灰度值不同,则必然有一个被分离出来的峰对应于图像中的文字目标。 基于局部阈值的二值化算法 0$! 基于局部阈值的方法通过定义考察点的领域,并由邻域计算模板来实现考察点灰度与邻域点的比较,较全局阈值方法有更广泛的应用。其中典型的局部比较方法有4’&)5678’.算法和9):+;)+算法等。与4’&)5678’.算法相比,9):+;)+算法的 作者简介:万罡,男,0B=U年生,湖北荆州人,硕士研究生,主要研究方向:图形图像处理及多媒体技术。周洞汝,0B#B年生,教授,博士生导师,主要研究方向:图形图象视频压缩,V%*应用技术等。

一种基于多模板匹配的字符识别方法

一种基于多模板匹配的字符识别方法 李 婧,龚晓峰,王瑞辉 (四川大学 电气信息学院 成都 610065) 摘要:本文在对字符进行各种预处理,包括倾斜校正,归一化,分割的基础上,依据字符的高度,宽度范围,提出了一种基于多模板匹配的字符识别方法,并将该算法运用于仿宋_GB2312字体,识别率达到98%以上,有效的提高了识别正确率,简单易实现。 关键词:倾斜校正;字符分割;多模板匹配 中图分类号:TP391.41 文献标识码:A A recognition method of characters based on Multi-Template Matching LI Jing, GONG Xiao-feng, Wang Rui-hui (College of Electrical Information, Sichuan University, Chengdu 610065, China) Abstract: This paper first do pretreatment such as skew correction, normalization, segmentation of characters, etc. Then it presented a new muti-template matching method according to the range of the character’s width and height. At last, the experiment used in the FangSong_GB2312 font show that this method can improve recognition accuracy and is easy to put into practice. Keywords: skew correction; character segmentation; multi-template matching 0 引言 字符识别是图像处理和模式识别领域中的研究课题之一,它涉及模式识别、图像处理、人工智能、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、人工智能、车牌识别、交通管理等高技术领域都有着重要的实用价值和理论意义[1]。目前字符识别主要有以下几种方法:1)利用字符的统计特征进行特征提取,2)基于字符结构分析的识别方法,3)利用字符的结构特征和变换进行特征提取,4)基于模板匹配的方法进行字符识别,5)近年来又出现了基于神经网络的算法和基于矩和小波变换的识别算法。但由于同一字体的字符有各种字号的差异,单一的运用上述某一种方法的效果都不理想[2]。为了提高识别率,本文从识别率较高的模板匹配法入手,对单模板匹配和特征模板进行改进,提出了一种根据字符高度,宽度值为每个字聚类多个模板,最后采用海明距离实现多模板的匹配。通过将该算法运用于仿宋_GB2312字体,发现这一方法能有效解决相似度高的字符的正确识别问题,有一定的实用价值。 1 识别系统总体方案 字符识别系统一般包括字符预处理,字符分割,字符识别三个环节,系统框图如图1所示。

DSP数字信号处理

数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。 简介 简单地说,数字信号处理就是用数值计算的方式对信号进行加工的理论和技术,它的英文原名叫digital signal processing,简称DSP。另外DSP也是digital signal processor的简称,即数字信号处理器,它是集成专用计算机的一种芯片,只有一枚硬币那么大。有时人们也将DSP看作是一门应用技术,称为DSP 技术与应用。 《数字信号处理》这门课介绍的是:将事物的运动变化转变为一串数字,并用计算的方法从中提取有用的信息,以满足我们实际应用的需求。 本定义来自《数字信号处理》杨毅明著,由机械工业出版社2012年发行。 特征和分类 信号(signal)是信息的物理体现形式,或是传递信息的函数,而信息则是信号的具体内容。 模拟信号(analog signal):指时间连续、幅度连续的信号。 数字信号(digital signal):时间和幅度上都是离散(量化)的信号。 数字信号可用一序列的数表示,而每个数又可表示为二制码的形式,适合计算机处理。 一维(1-D)信号: 一个自变量的函数。 二维(2-D)信号: 两个自变量的函数。 多维(M-D)信号: 多个自变量的函数。 系统:处理信号的物理设备。或者说,凡是能将信号加以变换以达到人们要求的各种设备。模拟系统与数字系统。 信号处理的内容:滤波、变换、检测、谱分析、估计、压缩、识别等一系列的加工处理。 多数科学和工程中遇到的是模拟信号。以前都是研究模拟信号处理的理论和实现。 模拟信号处理缺点:难以做到高精度,受环境影响较大,可靠性差,且不灵活等。数字系统的优点:体积小、功耗低、精度高、可靠性高、灵活性大、易于大规模集成、可进行二维与多维处理 随着大规模集成电路以及数字计算机的飞速发展,加之从60年代末以来数字信号处理理论和技术的成熟和完善,用数字方法来处理信号,即数字信号处理,已逐渐取代模拟信号处理。 随着信息时代、数字世界的到来,数字信号处理已成为一门极其重要的学科和技术领域。 数字信号处理器 DSP芯片,也称数字信号处理器,是一种特别适合于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法。根据数字信号处理的要求,DSP芯片一般具有如下主要特点: (1)在一个指令周期内可完成一次乘法和一次加法;

视频图像中车辆的车型识别算法研究与实现

毕业设计说明书 作者:学号: 系:信息工程系 专业:电子信息工程 题目:视频图像中车辆的车型识别 算法研究与实现 指导者: 评阅者: 2013年 6月1日

目次 1 绪论 (1) 1.1 课题的研究背景和意义 (1) 1.2 课题的研究现状 (2) 1.3 本文的基本内容和组织结构 (3) 2 车型识别系统简介 (4) 2.1 预处理 (4) 2.2 特征提取 (4) 2.3 特征匹配 (4) 3 基于灰度阈值分割法的车型识别 (6) 3.1 介绍各模块设计 (6) 3.1.1 预处理模块 (6) 3.1.2 特征提取模块 (7) 3.1.3 特征匹配模块 (7) 3.2 运行结果 (8) 3.3 结果分析 (11) 4 基于图像背景差值法的车型识别 (13) 4.1 介绍各模块设计 (13) 4.1.1 预处理模块 (13) 4.1.2 特征提取模块 (14) 4.1.3 特征匹配模块 (14) 4.2 运行结果 (15) 4.3 结果分析 (29) 4.4 结果对比 (30) 结论 (32) 参考文献 (34) 致谢 (35)

1 绪论 车型识别的目的是对待识别车辆进行车型的判别(该课题将车型分为轿车、货车、客车三类),它是通过分析比较待识别车辆侧面视觉特征信息实现的,主要借助于计算机技术的应用,车型识别技术是一种轮廓特征识别技术,是用待识别车辆的侧视轮廓特征来判别所属车型。车辆的侧视轮廓特征主要抽象为车顶长度、车辆高度和车身长度,依此可求得待识别车辆的顶长比、顶高比和前后比(车顶中垂线将车身长分得两部分的比值),而通过统计计算可求得三类车型(轿车、货车、客车)的特征值(顶长比、顶高比、前后比)的范围,将提取的待识别车辆的特征值与统计值相比较可实现对待识别车辆的车型判别[1]。 1.1 课题的研究背景和意义 中国正处在一个快速发展的时期,各种车型车辆数量也在持续上升,使得我国城市交通越来越拥挤,人们需要借助一种交通智能化系统来提高交通情况监控的实时性和交通管理的自动化程度,这也为智能交通系统的产生提供了条件。在我国的一些大城市正在逐步提高交通管理的智能化,主要体现在实现高速公路的快捷收费、公共场所车辆监控自动化加强等方面,我们对交通管理智能化的需求日益增加,这将带动智能交通系统的不断发展。 人们对车型识别的研究虽然已有很长一段时间,但仍有许多难题仍未解决,首先,车辆的颜色、光泽度等都会随着时间的推移和环境的改变而发生变化,而且即使是同一车辆在录入镜头时的形状、大小也各不同,这主要与位置和速度的随机性有关;第二,车辆录入镜头的外观状态还与摄像头位置、临近的物体或临近的车辆对待识别车辆的遮挡程度有关;第三,车型识别的准确性和快捷性还与光照情况的改变、天气季节的交替及背景图像的不断变化紧密相关。因此现在的车型识别技术还远不能满足当代大城市交通智能化管理的需求,我们仍需对车型识别技术进行改进以满足准确性和使用性上的要求。 目前已经解决交通智能管理的大部分关键技术,但是部分细节方面仍然存在不足,准确性不高就是其中的一方面。交通智能管理的关键技术包括车型判别,希冀借

基于MATLAB的字符识别研究

基于MATLAB的字符识别研究 汽车牌照识别程序的设计 摘要:本次课程设计的目的是通过对基于MATLAB的字符识别的研究,以汽车牌照识别的设计为实例,详细介绍字符识别的相关原理。整个汽车牌照识别的过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用MATLAB软件编程来实现每一个部分,最后识别出汽车牌照。在研究的同时对其中出现的问题进行了具体分析,处理。寻找出对于具体的汽车牌照识别过程的最好的方法。 关键词:MATLAB 字符识别车牌识别神经网络图像处理 引言 在MATLAB的字符识别研究中,汽车牌照的识别是最经典的样例,因为车辆牌照识别系统(License Plate Recognition System,简称LPRS)是建设智能交通系统不可或缺的部分。基于 MATLAB 图像处理的汽车牌照识别系统是通过引入数字摄像技术和计算机信息管理技术,采用先进的图像处理模式识别和人工智能技术,通过对图像的采集和处理,获得更多的信息,从而达到更高的智能化管理程度。车牌识别系统整个处理过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用 MATLAB软件编程来实现每一个部分处理工程,最后识别出汽车牌照。 一、 MATLAB及其图像处理工具概述 MATLAB 是 MATrix LABoratory (矩阵实验室)的缩写,是 Math Works 公司开发的一种功能强效率高简单易学的数学软件。MATLAB 的图像处理工具箱,功能十分强大,支持的图像文件格式丰富,如*.BMP、*.JPG、 *.JPEG、 *.GIF、 *.TIF 、*.TIFF、 *.PNG 、*.PCX、 *.XWD、 *.HDF、*.ICO 、*.CUR 等。MATLAB 7.X 提供了20 多类的图像处理函数,几乎涵盖了图像处理的所有技术方法,是学习和研究图像处理的人员难得的宝贵资料和加工工具箱。这些函数按其功能可分为:图像显示、图像文件 I/O、图像算术运算、几何变换、图像登记、像素值与统计图像分析、图像增强、线性滤波、线性二元滤波设计、图像去模糊、图像变换、邻域与块处理、灰度与二值图像的形态学运算、基于边缘的处理、色彩映射表操作色彩空间变换图像类型与类型转换。MATLAB 还着重在图形用户界面(GUI)的制作上作了很大的改善,对这方面有特殊要求的用户也可以得到满足。本文将给出 MATLAB 的图像处理工具箱中的图像处理函数实现图像处理与分析的应用技术实例。 二、基于 MATLAB图像处理的汽车牌照识别系统 1.系统组成 基于MATLAB图像处理的汽车牌照识别系统主要包括车牌定位字符车牌分割和车牌字符识别三个关键环节其识别流程图如图 1所示。 图1 识别流程图 其中, (1)原始图像:由数码相机或其它扫描装置拍摄到的图像; (2)图像预处理:对动态采集到的图像进行滤波、边界增强等处理以克服图像干扰; (3)车牌定位:计算边缘图像的投影面积,寻找峰谷点,大致确定车牌位置,再计算此连通域内的宽 高比,剔除不在域值范围内的连通域,最后得到的便为车牌区域; (4)字符分割:利用投影检测的字符定位分割方法得到单个的字符; (5)字符数据库:为第6步的字符识别建立字符模板数据库; (6)字符识别:通过基于模板匹配的OCR算法或基于人工神经网络的OCR算法,通过特征对比或训练 识别出相关的字符,得到最后的汽车牌照,包括英文字母和数字。

相关文档
最新文档