印刷体数字识别方法的研究---周初洪

印刷体数字识别方法的研究---周初洪
印刷体数字识别方法的研究---周初洪

印刷体数字识别方法的研究

周初洪

(上海交通大学医学院资产管理处,上海,2006.2)

摘要:在信息化飞速发展的今天,光学字符识别是一个重要的信息录入与信息转化的手段。其中数字的识别有着非常广泛的应用。本文中作者结合工作实际,分别分析了十个阿拉伯数字的不同特征,设计了具有通用意义的可能性,着重研究探讨该技术的应用可行性,并且尝试将向其他方面推广该技术。

本文首先探讨数字识别技术的现实意义,然后转向技术层面,重点研究图像处理、特征识别、算法推敲等环节。在特征识别技术中提出了“伤口”算法。

在结合相关硬件进行的实际操作中,识别效果良好。

关键词:OCR、数字识别、编号扫描、图像处理

Research of Printed Digit Recognition

ZHOU Chu-hong

(Asset Dept , Medical College of Shanghai Jiao Tong University, Shanghai, 2006.2)

ABSTRACT: OCR(Optical Character Recognition) has become one of the important method in gathering information and information transformation. Printed digit recognition has a promising business feature in many fields in society. The author found something in practice, analyzed the different characteristic of ten Arabic numerals respectively, designed to the possibility of the in general use meaning, emphasizing that technical applied possibility of the research study, and trying to expand that technique toward other aspects.

This text inquiries into numeral recognition to realistic meaning first, then turns to the technique level, the point is to research picture processing, characteristic identification and recognition, calculate way deliberation etc. Put forward "wound" calculate way in the characteristic identification.

We have got a good result combined with related hardware on the database of MNIST and practice.

Key Words: OCR printed digit recognition image processing

1 绪论

1.1 问题的由来

作为光学字符识别技术(Optical Character Recognition, 简称OCR)的一个分支,数字识别(Numeral Recognition),它的研究对象是:使计算机能够自动识别写在传统载体(纸、标牌等)上的数字。

在条形码普遍使用和条码扫描技术日益成熟的今天,脱机印刷体数字的识别仍然具有非常重要的意义和不可代替的作用,比如:邮政编码、统计报表、银行票据、车牌监管、纸币编码识别等等。近几年,我院开始大力推广设备管理的网络化在很大程度上要依赖原始数据信息的输入,如果能通过对设备标牌上编码的识别技术带动设备普查、设备变更等日常工作的同步数字化,无疑会促进这一项目的进一步发展。在以往浩如烟海的标牌中虽然没有使用条形码,但是却有着非常规范的印刷体设备编码,所以作者就开始着手利用现有资源,尝试着用OCR 技术组建设备管理网络。

图1.1 两种款式的现役设备编号标牌

1.1.1 传统设备检查中普遍存在的问题

1、设备较少的部门实现了设备普查,设备多的部门只能抽查。而抽查率由于人力和时限等原因普遍都不高。

2、各部门的设备保管员与设备检查人员重复检查。设备检查前一般都要求各保管员事先进行自查,然后我们再复查。自查的目的是让各保管员熟悉设备状况和安置地点,这样可以便于复查。但现在复查的时候还是需要双方人员反复走。这样既有碍各部门人员的正常工作,也极大地降低了检查效率,间接伤害了保管员的工作热情。

3、一些非常个人化的物品,比如笔记本电脑、移动硬盘等,往往检查不到。保管员对一些敏感人员也有难言之隐。

4、传统的账本正逐步取消,原先的“帐物卡”体系正向“网物卡”的现代管理模式过渡。管理模式的变革要求我们开发出一套全新的设备检查方式,与时俱进,克服上述不足,适应科学的、以人为本的管理理念。

1.1.2 设想方案

1、开发设计手持式设备检查仪。它能像条形码阅读器那样识别阅读标签上的设备编号,并能通过USB等接口与电脑相连。

2、检查某部门前一段时间(具体看该部门设备数量多少)把手持检查仪下发给该单位,让保管员拿着它先自查。这样一些正常、完好的设备大都能覆盖。有些未贴标牌、标牌残损或者手工书写的情况就能暴露出来。

3、自查结束后我们进驻该部门进行复查。从检查仪上导出已检查的设备编号,对照网上账本,对其中的一部分可以再次复查,重点对没有检查到的设备进行检查,重点听取保管员对某些设备出现问题的描述,重点填写好大型设备效益表等。

1.1.3 预期效果

1、设备检查率大大提高。在人力投入增加不多的情况下,实现了精细管理,更好了适应了设备众多化、复杂化的趋势。

2、认真的考核促进科学的管理。考核制度的变革可以引发管理模式的进步。比如规范贴牌、防止标牌污损等。

3、由于设备检查是一年一度的,所以作为管理部门,我们有半年左右的时间进行前期准备,包括检查仪的开发和适应性校验,对各部门保管员的培训等等。

4、对一些特殊设备,如空调或无法贴牌的移液器、狗笼兔笼等还是需要实地查看的。对个人化很强的物品,可以让保管员在自查阶段找到,这也比在几次复查内获得的效果好。

5、检查仪的识别率做不到百分百,面对数以万计的设备编号,它也许会出现比例很小的识别错误或者无法识别的情况。这可能缘于它自身,也可能是标牌污损或者使用不当。这时也需要一定的人工介入。

1.2 OCR方法简介

对多数OCR系统,其一般步骤如图1.2所示。

图1.2 一般识别过程

1、图像采集阶段,是取得要识别所要的原材料,即各个字符集的图像。主要利用光学仪器,如照相机、摄像机、扫描仪等等。

2、预处理阶段,是对上述采集到的图像进行识别前所必要的一些处理工作,主

要包括:对原始图像进行几何校正、去噪声、复原、二值化,对二值图像进行滤波处理,单字的分割、笔画提取等等,必要时修补缺口。

3、特征提取阶段,经处理过的图像包括很多特征,识别时就需要这些利用经过挑选、行之有效的特征。

4、在识别判断阶段,有些特征无法直接为计算机接受,所以需要经过特定处理。

5、识别后处理阶段,对错误识别、拒绝识别的部分进行挽救性识别。

1.3 阿拉伯数字识别方法简介

本文主要着眼于从0到9十个阿拉伯数字的识别,因此在此简单介绍一下目前流行的数字识别方法。在过去几十年中,人们提出了许多方法用于阿拉伯数字的识别,这些方法可分为两类,即所谓的全局方法和结构方法。

1、模板匹配法

2、从像素点统计分布的角度来抽取特征,主要方法有采样点方法,矩方法、特征轨迹方法等。这类方法能有效应付扭曲和变形的字符、有较好的稳定性、计算复杂度小,但是在一般情况下,特征的模板难以构成。

3、用全局变换和级数展开的方法抽取特征。此法可以减少特征向量的维数,且对于一些全局变量的形变,如平移和旋转,具有一定的不变性。这类方法主要有:Fourier变换、Walsh变换、Harr变换、Hadamard变换、K-L变换、Hough变换以及投影变换等。虽然一般而言此法的计算量较大,单特征抽取和模板生成都比较简单。

对结构方法而言,它一般是通过分析字符的轮廓或骨架来取得字符的几何和拓扑特征,它所关注的特征包括字符笔画端点,交叉点,笔画的交角,凹凸性等。这类方法对数学要求较少,对各种特征的定义和获取大都依赖研究者的直觉和经验,因此这一领域还是开放的,研究者可以不断提出新的特征和方法以达到更好的识别效果。一般来说,结构方法有较高的识别速度,而且对于字符的变形具有良好的抗干扰能力,同时对字符的旋转,平移和伸缩具有较好的稳定性,但是这类方法的特征抽取过程比较复杂,由于特征定义和抽取都直接依赖于研究者的直觉,对图像预处理要求较高。

对于印刷体阿拉伯数字的识别,上述两类方法都各自的优缺点。结构方法对细节变化较为敏感,对噪声大的图像识别率不高,同时结构法一般使用句法分类器进行分类,由于训练样本的限制,总有部分待识字符无法分类,拒识率高但是错误率很低。此法一般适用与印刷体数字或者规范数字的识别。统计方法对噪声不敏感,在噪声较大时还是有较好的稳定性,但这类方法对图像细节上的细微差别不灵敏,难以区分字符之间的细微差异,因此在待识字符比较相似时容易产生错误识别而且资源消耗先对前者较大。因此对于规范的印刷体数字,第一种方法比较合适,所谓宁愿拒绝识别也不要乱识别,没有识别的数字可以通过人工的方法再识别,但一旦误识别的就可能无法挽回了。

另外神经网络的方法也渐渐在数字识别领域得到广泛应用。神经网络方法的优点是:特征抽取较为简单,在神经网络的结构确定以后由通用的软件用于训练和识别,可通过更大的训练样本集来取得更高的识别率,同时由于它使用了统计性的特征,因此和统计方法一样有较高的抗干扰能力,又由于神经网络变换的非线性,使得它也和结构方法一样能区别出不同类别之间的细微差别。因此在实用

的手写体阿拉伯数字识别器中都有神经网络部分。但它同样有缺点:当训练样本数量很大时,训练所用的时间太长;当更换待识字符集后,往往需要重新训练这一网络;另外,神经网络的动力学原理尚未完全揭示,进一步提高识别率的思想受到限制。由于我们的设备标签有两种模式,一种是五位的宋体数字编码,一种是九位的新罗马体数字编码。神经网络的方法也就无法随机地适应不断变化着的识别对象。

1.4 研究的难度

数字的类别只有十种,笔画又简单,其识别问题似乎不是很困难。但实际上,一些测试结果表明,数字的正确识别率并不如汉字识别率高,甚至也不如联机的手写汉字识别率高,而仅仅优于脱机手写体汉字识别。

其中的主要原因是:

1、某些数字的相似性很大,字形相差不大,使得准确区分某些数字变得相当困难。

2、由于数字没有上下文的关系,每个单字都代表特定的意义,所以对数字识别单字识别正确率的要求要比文字要苛刻得多。在金融、统计等领域其严格性更是不言而喻。

3、大批量数据处理对系统速度一般都有颇高的要求,很多理论上很完美但速度过低的方法都是行不通的。

4、由于标牌所处环境不同,标牌上的数字也存在千差万别的污损情况,除了传统的背景污染,可能还会有字体磨损,笔画中断,意外折痕入侵等等。标牌本身也可能存在编号中数字上下跳动,不规则旋转等情况。

1.5 识别系统性能的评价

作为一个识别系统,最终要用某些参数来评价其性能的高低,印刷体数字识别也不例外。评价的指标除了借用一般文字识别里的通常做法外,还要根据数字识别的特点进行修改和补充。

对一个印刷数字识别系统,可以用三方面的指标表征系统的性能:

正确识别率A=(正确识别样本数/全部样本数)×100%

替代率(误识率) S=(误识样本数/全部样本数)×100%

拒识率R=(拒识样本数/全部样本数)×100%

三者的关系:A+S+R=1

数字识别的应用中,人们往往很关心的一个指标是“识别精度”,即,在所有识别的字符中,除去拒识字符,正确识别的比例有多大,定义为:识别精度P=A/(A+S) ×100%

一个理想的系统应该是R,S尽量小,而P,A尽可能大。而在一个实际系统中,S和R是相互制约的,拒识率R的提高总伴随着误识率S的下降,与此同时识别率A和识别精度P的提高。因此,在评价本识别系统时,必须综合考虑这几个指标。

2 主要预处理方法的研究和分析

2.1 引言

字符识别时,首先将印在纸上、标签上的字符,经光电扫描产生模拟电信号,再通过模数转换为带灰度值的数字信号输入处理终端。字符载体的厚度、洁白度、光洁度、弯曲程度、油墨深浅、印刷或书写质量都会造成字形畸形、产生污点、飞白、断笔、交连等干扰。输入设备的鉴别率、线性度、量化过程也会产生噪声。所以,在单个字符识别之前,要对带有随机噪声的字符灰度值数字信号进行预处理(Preprocessing)。

预处理一般包括二值化、行字切分、平滑、去噪声、规范化和细化等。不同的识别方法,对预处理的项目和要求有所差别。基于结构原理的识别方法对预处理尤其有着较大要求,所以本章就予以明确的阐述。

2.2 二值化

把字符灰度图像处理成二值(0和1)图像的过程,称为对字符图像的二值化(Binarization)。对灰度图像二值化能显著减小数据存储的容量,降低后续处理的复杂度。

设扫描、A/D转换后的字符图像点阵为:

C=[f(i,j)] i=1,2,…,p;j=1,2,…,q

式中f(i,j)式像素(i,j)的灰度值。有黑笔画的部分,f(i,j)较小;而白背景部分,f(i,j)较大。最简单的二值化通过设定固定灰度阈值T来完成,即当f(i,j)值笔预定阈值T大,看成背景,赋值为“0”;反之看成文字笔画,赋值为“1”。

1 f(i,j)

g(i,j)= i=1,2,…,p;j=1,2,…,q

0 f(i,j)>T

B=(g(i,j))即为字符二值化后的图像点阵。

对于字符图像二值化,要求二值化后的图像能忠实的再现原字符。基本要求如下:

1、笔画中不能出现空白点;

2、二值化的笔画基本保持原来文字的结构特征。

二值化的关键在于阈值T的选择,下面介绍本设计中采用的阈值选取方法。

2.2.1 整体阈值处理

仅由像素点(i,j)的灰度值f(i,j)确定阈值的方法称为整体阈值选择法。阈值T表示为:T=T[f(i,j)]。

常用的集中整体阈值选择方法为:

1、人工设定整体阈值

根据实验或人的预想和经验,预先给定一个固定的阈值T。这是一种最简单且最快速的二值化方法。当文字清晰,轮廓明显,干扰很小的情况下,它非常行之有效。人工设定整体阈值的缺点也同样显而易见,如不能根据每个文字确定它

最佳的阈值;一旦光源等外界条件改变时,无法使事先设定的阈值适应新的识别环境,通用性差。

2、由灰度直方图确定整体阈值

这是一种根据图像和背景的灰度值自动确定整体阈值的方法。如图所示,图2.1是一副被污损过的文字图像,图2.2是该图像的灰度直方图。

图2.1 带有随机背景污染的原图

图2.2 原图的灰度直方图

从直方图上可以观察到如下几点:

1、原图中的文字和少量的污染大都集中在单点灰度为0到50的区间内,大多数的污染和几乎全部的正常背景都集中在单点灰度为100到255的区间。

2、根据不同原图上字符和背景关系的不同,其灰度直方图的分布是不同的。但是一般印刷体的原图,其字符一般而言清晰可见,它们的灰度都远远小于正常背景和绝大多数的污染,所以印刷体原图的灰度直方图分布一般都呈现“两头高,

中间低”的所谓“盆地”形态。

3、由灰度直方图确定整体阈值所指的就是根据不同图像的不同灰度直方图,确定其“盆地”位置,如50到100,把“盆地”两边的灰度全都归为0和255。这样就能去掉绝大多数污染的干扰,为下一步的特征判断做准备。如图2.3所示。

4、整体阈值处理法的优点就在于它能根据不同灰度直方图,自行探察到“盆地”所在区间,从而确定合适的阈值。这就意味着它能把图像中的有效字体清晰地强化表现,把污染和背景普遍地弱化。同时它也有一些不可回避的问题,那就是当图像中背景污染明显深于字体,污染的灰度等同于或者高于字体灰度时,那么此法就难以胜任了。此时的图像可能就需要人工介入进行预处理,不过人工处理的难度也已经是不言而喻了。

图2.3 经整体阈值处理后的图

2.2.3 平滑

平滑处理,就是将一个n×n的像素窗口,依次在二值化图像的每个像素点上移动,利用逻辑表达式来消除孤立像素的一种技术。通过平滑处理,能够去掉孤立的噪声、干扰,使笔画边缘连续和平滑。

本设计中采用了如图2.4的平滑窗口:

图2.4 四个3×3的平滑窗口(?表示0或1都可以)

上述这些窗口包括将每个窗口旋转90°,180°和270°以后得到的新窗口以及‘0’、‘1’互换后的所有情况。在印刷体数字图像中,如果某像素p的3×3邻域窗口(1)或(2)或这两者的旋转窗口相匹配(即完全一样),则将像素p 的值改为1,使它成为黑像素;如果某像素p的3×3邻域窗口(3)或(4)或这两者的旋转窗口相匹配(即完全一样),则将像素p的值改为0,使它成为白像素;对于处在图像边缘的像素,可按背景色(0值)向外扩张一个像素。

从某种意义上讲,字符识别是一种实验性科学,因此我们可以根据实践对实验做一些有利于识别结果的修补,只要这种修补不影响一般性前提并且是合理的,那么这种处理就是可行的。对平滑窗口(1)而言,中心像素p的四个4-邻居都是黑像素,由于字体的书写带有某种随机性,因而有充分的理由认为中心像素p也应是黑像素。如果p是白像素,那么很可能在图像采集过程中,由于某

种噪声或其它原因使得本该是黑像素的点变成了白像素,所以将p改为黑像素具有相当的合理性。

3 各个数字特征分析与识别方法

基于十个阿拉伯数字的结构,本设计在不断研究中发现,人工辨别阿拉伯数字时,并不注重每个数字的细节,所以即使数字图像质量很差,人们也能比较准确地读出数字。那么我们就得出一个结论,人们识别数字只看数字的一些最基本结构,只要目标数字与之大体吻合,那么就能做出较为准确的判断。在实际操作中也发现,即使被测试人员仅仅得到一些数字的残体或者是扭曲变形的数字,他们也大都能顺利辨认。可见特征识别的重要意义。

3.1 轮廓跳变判断法

根据上述情况,本设计提出了轮廓跳变判别法。

左右轮廓定义:假设一个二值图像四周一圈像素都是背景,如果不是可在周围增添一圈背景像素。在所有有效行中有一个最高有效行和最低有效行分别标记为有效行Top和有效行Bottom,对于整个图像的第Top行到Bottom行从左到右扫描每一行第一个碰到的目标像素构成这个图像的左轮廓。相应的可定义右轮廓。所有的左轮廓点或者由轮廓点构成一个序列。由定义可知左右轮廓点序列的长度相等,且等于目标的高度。

本文的主要识别部分和编程环节都将围绕上图和上表展开,根据实际图像质量情况、图像采集质量等客观因素,可以对上表做适应性修改。同时为了更为明显地表示出左轮廓、右轮廓等特征,在下列各图中,蓝线表示左轮廓,绿线表示右轮廓。

3.1.1 ‘1’的特征分析与识别方法

‘1’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓在20到40之间存在跳变,尤其是30附近尤为明显,其跳变幅度几乎占到整个字符幅度的75%;

2、右轮廓基本光滑,在整个过程中没有任何跳变迹象。

3.1.2 ‘2’的特征分析与识别方法

‘2’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓在20到40之间存在跳变,尤其是40附近尤为明显,其跳变幅度几乎占到整个字符幅度的80%;

2、右轮廓在100到120之间存在跳变,尤其是110附近尤为明显,其跳变幅度几乎占到整个字符幅度的85%。

3.1.3‘3’的特征分析与识别方法

‘3’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓在20到40之间和80到100之间存在两处跳变,尤其是35到40区间和80到90区间尤为明显,其跳变幅度都超过了到整个字符幅度的70%;

2、右轮廓基本光滑,在整个过程中没有任何跳变迹象。

3.1.4‘4’的特征分析与识别方法

‘4’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓在80到100存在跳变,尤其是80到90区间尤为明显,其跳变幅度几乎占到整个字符幅度的65%;

2、右轮廓在60到80之间和80到100之间存在两处跳变,尤其是70到80区间和80到90区间尤为明显,两处跳变幅度几乎占到整个字符幅度的25%。

3.1.5‘5’的特征分析与识别方法

‘5’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓在60到80之间和80到100之间存在两处跳变,尤其是60附近和80到90区间尤为明显,两处跳变幅度都几乎占到整个字符幅度的80%;

2、右轮廓在0到20之间存在跳变,尤其是10附近尤为明显,跳变幅度几乎占到整个字符幅度的65%。

3.1.6‘6’的特征分析与识别方法

‘6’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓基本光滑,在整个过程中没有任何跳变迹象。

2、右轮廓在20到40之间和40到60之间存在两处跳变,尤其是30附近和40到50区间尤为明显,跳变幅度分别占到整个字符幅度的75%和50%。

3.1.7‘7’的特征分析与识别方法

‘7’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓在0到20之间存在跳变,尤其是10附近尤为明显,跳变幅度几乎占到整个字符幅度的80%;

2、右轮廓基本光滑,在整个过程中没有任何跳变迹象。

3.1.8‘8’的特征分析与识别方法

‘8’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、右轮廓基本光滑,在整个过程中没有任何跳变迹象;

2、右轮廓基本光滑,在整个过程中没有任何跳变迹象。

3.1.9‘9’的特征分析与识别方法

‘9’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、左轮廓在60到80之间和80到100之间存在两处跳变,尤其是80附近和90到100区间尤为明显,跳变幅度分别占到整个字符幅度的50%和75%;

2、右轮廓基本光滑,在整个过程中没有任何跳变迹象。

3.1.10‘0’的特征分析与识别方法

‘0’的左右轮廓图像:

观察轮廓化后的图像,我们不难发现:

1、右轮廓基本光滑,在整个过程中没有任何跳变迹象;

2、右轮廓基本光滑,在整个过程中没有任何跳变迹象。

3.1.11轮廓跳变分析流程图

由于字体、图片质量等综合问题,理论值和实际值之间有不小的差距,直接导致很多左右轮廓跳变数不是默认的理论值,导致拒识率上升很大。为此在做流程图时需要根据实际情况做一些调整。

图3.1.11 轮廓跳变分析流程图

3.2 伤口理论

如果把数字看成一个竖放着的容器,容器最上部开个小口子,我们往里面注水。水面会沿着容器壁,也就是数字的边缘自下向上不断上升。注满水后,我们密封注水口,并且从中向容器加压。试想该容器最容易被突破、最容易漏出水、最容易出现伤口的地方在哪里?显然,由于同等受力情况下截面小压强大的原理,伤口最容易出现在数字的笔画的起始和终止处,而不是容器的容器壁上。

其实伤口理论本可以简单地描述成找出各数的起止位置,但是为了编程的需要和为后期神经网络训练提供样本,我们还是需要把各数理解为各种形状的密闭注水模型。

图-3.2 各数的伤口分布情况

通过仔细观察各数伤口的分布情况,我们可以得到如下结论:

1、这些伤口大都集中在各数的边缘,只有数字3存在一个中央伤口;

2、如果仅仅给出每个数字的伤口位置和伤口朝向,人工判断时,只需沿着伤口朝向画反向延长线,就可以大致描绘出数字的大体轮廓,根据所绘轮廓就能判断出数字。这是因为伤口大都是数字的起始和终止位置,这些地方一旦确定,那么数字基本就确定了。

3、数字1的上部伤口非常容易受字体的影响,所以不宜使用该法。建议一开始就利用数字1是十个数字中的长宽比最小这一特性入手,辨别出该数;

4、数字0和数字8没有伤口,所以不宜使用该法。建议放到最后根据中央区域像素求和来判别。

3.3 综合识别和试验结果

本文所用的试验数据库由因特网上得到,是NEC研究中心的MNIST数字数据库,它由60000个训练样本和10000个测试样本构成。图像已经经过归一化处理。MNIST由NIST的SD-3和SD-1重组得到。原NIST的图像被归一化为20×20像素的二值图像,然后被至于28×28像素图像的中间得到MNIST。

实验用的字符集是MNIST训练库中的第10001~第20001个数字,总共有10000个数字,各个数字的分布情况如下表所示:

某数识别率=(该数正确识别+该数错误识别)/(该数全部样本)×100%某数识别可靠性=该数正确识别/该数全部样本×100%

本文针对十个不同印刷体数字采用结构特征提取方法,并根据十个字符的特

征设计了不同的识别方法。最终在MINST训练库第10001~20001个数字上进行了实验,识别率为99.1992%,可靠性为:98.7688%。

致谢

本文的研究工作是在各位资产管理处的同事们悉心指导下完成的。在刚进入新单位工作的数月中,施晓谋、朱林权、马亮、李峻、钟璇等同事谆谆教导以及他们一丝不苟的敬业精神、敏锐的洞察力和平易近人的工作风格都使我受益匪浅,同时也非常感谢他们为我搭建了良好的创新舞台,感谢所给与的给予的大力支持。在论文完成之际,谨向各位资产管理处的同事们表示诚挚的敬意。

感谢上海卓诚科技公司的技术督导和各位技术人员的帮助,从你们给我的回复中,我深切地感受到大家对我的关心和支持。

感谢我的父母,是他们把我抚育成人;感谢最爱我的人,是她鼓励着我不断向前!

参考文献

1、胡小锋、赵辉,VC++/MATLAB图像处理与识别使用案例精选,人民邮电出版社,2004.9

2、董林、陈锡先,一种新的手写体数字识别方法,北京邮电大学学报,1997.Vol.20 No.1 p79-83

3、李波,刘东华,一种计算任意形状封闭区域面积的新方法,国防科技大学学报,2002.Vol.24 No.4 P61-64

4、鲍苏苏,杨璐,实时图像处理中的垂直和水平直线检测算法,合肥工业大学学报,2003 Vol.26 No.4 P550-552

5、刘兆妮,雷振山,蒙丽,候荣涛,应用机器视觉技术的齿轮测量方法,唐山学院学报

6、射频标签技术与通用资产管理系统,上海卓诚科技公司

7、智能标签特点及其印制技术现状分析,上海卓诚科技公司

8、条码及射频标签技术EAMS解决方案,上海卓诚科技公司

基于模板匹配算法的数字识别讲解

中南民族大学 毕业论文(设计) 学院: 计算机科学学院 专业: 软件工程年级:2009 题目: 基于模板匹配算法的数字识别学生姓名: 李成学号:09065093指导教师姓名: 李波职称: 讲师 2013年5月

中南民族大学本科毕业论文(设计)原创性声明 本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。本人完全意识到本声明的法律后果由本人承担。 作者签名:2013年月日

摘要 (1) Abstract (1) 1 绪论 (2) 1.1 研究目的和意义 (2) 1.2 国内外研究现状 (2) 2 本文基本理论介绍 (3) 2.1 位图格式介绍 (3) 2.2 二值化 (3) 2.3 去噪 (3) 2.4 细化 (4) 2.5 提取骨架 (4) 3 图像的预处理 (5) 3.1 位图读取 (5) 3.2 二值化及去噪声 (5) 3.3 提取骨架 (6) 4 基于模板匹配的字符识别 (8) 4.1 样本训练 (8) 4.2 特征提取 (8) 4.3 模板匹配 (9) 4.4 加权特征模板匹配 (10) 4.5 实验流程与结果 (10) 5 结论 (16) 5.1 小结 (16) 5.2 不足 (16) 6 参考文献 (17)

基于模板匹配算法的数字识别 摘要 数字识别已经广泛的应用到日常生活中,典型的数字自动识别系统由图像采集、预处理、二值化、字符定位、字符分割和字符识别等几部分组成, 这些过程存在着紧密的联系。传统的模板匹配算法因为图像在预处理之后可能仍然存在较大的干扰,数字笔画粗细不均匀,有较大的噪声,识别效率不高。本文采的主要思想就是对字符进行分类,之后对字符进行细化,提取细化后字符的特征矢量,与模板的特征矢量进行加权匹配,误差最小的作为识别结果。本文在模板匹配法的基础上, 采用了特征值加权模板匹配法, 并且改进了匹配系数的求法。应用该法取得了满意的效果, 提高了识别率。 关键词:模板匹配;数字识别;特征值加权;字符识别; Template matching algorithm-based digital identification Abstract Digital identification has been widely applied to daily life, the typical digital automatic identification system by the image acquisition, pre-processing, binarization, character positioning, character segmentation and character recognition several parts, there is a close link these processes. Traditional template matching algorithm because the image may still exist after pre-greater interference, digital strokes uneven thickness, the noise, the identification efficiency is not high. Adopted herein main idea is to classify the character after character refinement, the characters feature vector extraction refinement, and the template feature vector is weighted matching, the minimum error as a recognition result. Template matching method based on feature weighted template matching method, and improve the matching coefficient method. The application of the method to obtain satisfactory results, to improve the recognition rate. Key words:Template matching; digital identification; characteristic value weighted; character recognition;

现代数字信号处理及其应用——LMS算法结果及分析

LMS 算法MATLAB 实现结果及其分析 一、LMS :为课本155页例题 图1.1:LMS 算法学习曲线(初始权向量[]T 00w ?=) 图1.2滤波器权系数迭代更新过程曲线(步长075.0=μ) 图1.3滤波器权系数迭代更新过程曲线(步长025.0=μ)图1.4滤波器权系数迭代更新过程曲线(步长015.0=μ) 分析解释: 在图1.1中,收敛速度最慢的是步长为015.0=μ的曲线,收敛速度最快的是步长075.0=μ的曲线,所以可以看出LMS 算法的收敛速度随着步长参数的减小而相应变慢。图1.2、1.3、1.4分别给出了步长为075.0=μ、025.0=μ、025.0=μ的滤波器权系数迭代更新过程曲线,可以发现其不是平滑的过程,跟最抖下降法不一样,体现了其权向量是一个随机过程向量。

LMS2:为课本155页例题,156页图显示结果 图2.1:LMS 算法学习曲线(初始权向量[]T 00w ?=) 图2.2滤波器权系数迭代更新过程曲线(步长025.0=μ) 图2.3滤波器权系数迭代更新过程曲线(步长025.0=μ)图2.4最陡下降法权值变化曲线(步长025.0=μ) 分析解释: 图2.1给出了步长为025.0=μ的学习曲线,图2.2给出了滤波器权向量的单次迭代结果。图2.3给出了一 次典型实验中所得到的权向量估计()n w ?=,以及500次独立实验得到的平均权向量()}n w ?E{=的估计,即()∑==T t n w T 1 t )(?1n w ?,其中)(?n w t 是第t 次独立实验中第n 次迭代得到的权向量,T 是独立实验次数。可以发现,多次独立实验得到的平均权向量()}n w ?E{=的估计平滑了随机梯度引入的梯度噪声,使得其结果与使用最陡下降法(图2.4)得到的权向量趋于一致,十分接近理论最优权向量[]T 7853.08361.0w 0-=。 LMS3:为课本172页习题答案

印刷体汉字识别及其MATLAB实现

印刷体汉字的识别及其MATLAB实现 0.汉字识别研究的意义 汉字已有数千年的历史,是中华民族文化的重要结晶,闪烁着中国人民智慧的光芒。同时也是世界上使用人数最多和数量最多的文字之一。现如今,汉字印刷材料的数量大大增加,一些专业单位所接触的印刷材料更是浩如烟海,信息量均是爆炸性增长。然而,汉字是非字母化、非拼音化的文字,因此,如何将汉字快速高效地输入计算机,是信息处理的一个关键问题,也是关系到计算机技术能否在我国真正普及的关键问题,更是传播与弘扬中华民族悠久历史文化的关键问题。而且随着劳动力价格的升高,利用人工方法进行汉字输入也将面临经济效益的挑战。因此,对于大量已有的文档资料,汉字自动识别输入就成为了最佳的选择。因此,汉字识别技术也越来越受到人们的重视。汉字识别是一门多学科综合的研究课题,它不仅与人工智能的研究有关,而且与数字信号处理、图像处理、信息论、计算机科学、几何学、统计学、语言学、生物学、模糊数学、决策论等都有着千丝万缕的联系。一方面各学科的发展给它的研究提供了工具;另一方面,它的研究与发展也必将促进各学科的发展。因而有着重要的实用价值和理论意义。 1.印刷体汉字识别的研究 1.1印刷体汉字识别技术的发展历程 计算机技术的快速发展和普及,为文字识别技术应运而生提供了必备条件。加上人们对信息社会发展的要求越来越高,文字识别技术的快速发展可想而知。印刷体文字的识别可以说很早就成为人们的梦想。印刷体汉字的识别最早可以追溯到60年代,但都是西方国家进行的研究。我国对印刷体汉字识别的研究始于70年代末80年代初。同国外相比,我国的印刷体汉字识别研究起步较晚。从80年代开始,汉字ORC的研究开发一直受到国家重视,经过科研人员十多年的辛勤努力,印刷体汉字识别技术的发展和应用,有了长足进步。 1.2印刷体汉字识别的原理分析及算法研究 汉字识别实质是解决文字的分类问题,一般通过特征辨别及特征匹配的方法来实现。目前汉字识别技术按照识别的汉字不同可以分为印刷体汉字识别和手写体汉字识别。印刷体汉字识别从识别字体上可分为单体印刷体汉字识别与多体印刷体汉字识别。 印刷体汉字识别的流程如图1-1所示:

车辆牌照图像识别算法研究与实现本科毕设论文

Q260046902 专业做论文 西南科技大学 毕业设计(论文)题目名称:车辆牌照图像识别算法研究与实现

车辆牌照图像识别算法研究与实现 摘要:近年来随着国民经济的蓬勃发展,国内高速公路、城市道路、停车场建设越来越多,对交通控制、安全管理的要求也日益提高。因此,汽车牌照识别技术在公共安全及交通管理中具有特别重要的实际应用意义。本文对车牌识别系统中的车牌定位、字符分割和字符识别进行了初步研究。对车牌定位,本文采用投影法对车牌进行定位;在字符分割方面,本文使用阈值规则进行字符分割;针对车牌图像中数字字符识别的问题,本文采用了基于BP神经网络的识别方法。在学习并掌握了数字图像处理和模式识别的一些基本原理后,使用VC++6.0软件利用以上原理针对车牌识别任务进行编程。实现了对车牌的定位和车牌中数字字符的识别。 关键词:车牌定位;字符分割;BP神经网络;车牌识别;VC++

Research and Realization of License Plate Recognition Algorithm Abstract:In recent years, with the vigorous development of the national economy,there are more and more construct in the domestic expressway, urban road, and parking area. The requisition on the traffic control, safety management improves day by day. Therefore, license plate recognition technology has the particularly important practical application value in the public security and the traffic control. In the paper, a preliminary research was made on the license location, characters segment and characters recognition of the license plate recognition. On the license location,the projection was used to locate the license plate; On the characters segmentation, the liminal rule was used to divide the characters; In order to solve the problem of the digital characters recognition in the plate, BP nerve network was used to recognize the digital characters. After studying and mastering some basic principles of the digital image processing and pattern recognition, the task of license plate recognition was programmed with VC++ 6.0 using above principles. The license location and the digital characters recognition in the license plate were implemented. Keywords: license location, characters segmentation, BP nerve network, license plate recognition, VC++

基于知识库的手写体数字识别

HUNAN UNIVERSITY 课程模式识别 题目基于知识库的手写体数字识别学生姓名 学生学号

专业班级 学院名称 2016 年6 月25 日

基于知识库的手写体数字识别 1案例背景: 手写体数字识别是图像识别学科下的一个分支,是图像处理和模式识别研究领域的重要应用之一,并且具有很强的通用性。由于手写数字的随意性很大,如笔画粗细、字体大小、倾斜角度等因素都有可能直接影响到字符的识别准确率,所以手写体数字识别是一个很有挑战性的课题。在过去的数十年中,研究者们提出了许多识别方法,并取得了一定的成果。在大规模数据统计如例行年检、人口普查、财务、税务、邮件分拣等应用领域都有广阔的应用前景。 本案例实现了手写阿拉伯数字的识别过程,并对手写数字识别的基于统计的方法进行了简要介绍和分析。本文实现的手写字体识别程序具有手写数字图像读取、特征提取、数字模板特征库以及识别功能。 2 理论基础: 2-1手写字体识别方法: 手写体数字识别是一个跨学科的复杂问题,综合了图像处理、模式识别、机器学习等多个领域的知识,其识别过程一般包含图像预处理、特征提取、分类器的设定及其后处理等组成。处理流程如图2-1所示。

图2-1 手写体数子识别流程图 2-2 图像预处理 手写体数字识别的首要工作是图像预处理。在图像预处理过程中需要解决的主要问题有:定位、图像二值化、平滑化(去噪)H J、字符切分、规范化等。图像二值化是指将整个图像呈现出明显的黑白效果。待识别的手写体数字图像在扫描过程中,常会带来一些噪声,用不同的扫描分辨率得到的数字图像,其质量也各不相同,故而要先将这些干扰因素排除掉。另外,还需要正确分割整幅文档图像中的手写体数字,而分割后的数字大小、字体常各不相同,故还需进行归一化处理。 2-3 特征提取 特征提取的目的是从经过预处理后的数字图像中,提取出用以区分与其它数字类别的本质属性并数值化,形成特征矢量的过程。常见的手写体数字特征有:模板特征、统计特征、结构特征和变换特征。 2-4 分类器 不同的分类方式对应不同的分类器,可选的分类器有神经网络、支持向量机

数字信号处理期末论文

题目:基于DSP的FFT程序设计的研究 作者届别 系别专业 指导老师职称 完成时间2013.06

内容摘要 快速傅里叶变(Fas Fourier Tranformation,FFT)是将一个大点数N的DFT分解为若干小点的D F T的组合。将用运算工作量明显降低,从而大大提高离散傅里叶变换(D F T) 的计算速度。因各个科学技术领域广泛的使用了FFT 技术它大大推动了信号处理技术的进步,现已成为数字信号处理强有力的工具,本论文将比较全面的叙述各种快速傅里叶变换算法原理、特点,并完成了基于MATLAB的实现。 关键词:频谱分析;数字信号处理;MATLAB;DSP281x

引言: 1965年,库利(J.W.Cooley)和图基(J.W.Tukey)在《计算数学》杂志上发表了“机器计算傅立叶级数的一种算法”的文章,这是一篇关于计算DFT的一种快速有效的计算方法的文章。它的思路建立在对DFT运算内在规律的认识之上。这篇文章的发表使DFT的计算量大大减少,并导致了许多计算方法的发现。这些算法统称为快速傅立叶变换(Fast Fourier Transform),简称FFT,1984年,法国的杜哈梅尔(P.Dohamel)和霍尔曼(H.Hollmann)提出的分裂基快速算法,使运算效率进一步提高。FFT即为快速傅氏变换,是离散傅氏变换的快速算法,它是根据离散傅氏变换的奇、偶、虚、实等特性,对离散傅立叶变换的算法进行改进获得的。它对傅氏变换的理论并没有新的发现,但是对于在计算机系统或者说数字系统中应用离散傅立叶变换,可以说是进了一大步。 随着科学的进步,FFT算法的重要意义已经远远超过傅里叶分析本身的应用。FFT算法之所以快速,其根本原因在于原始变化矩阵的多余行,此特性也适用于傅里叶变换外的其他一些正交变换,例如,快速沃尔什变换、数论变换等等。在FFT的影响下,人们对于广义的快速正交变换进行了深入研究,使各种快速变换在数字信号处理中占据了重要地位。因此说FFT对数字信号处理技术的发展起了重大推动作用。 信号处理中和频谱分析最为密切的理论基础是傅立叶变换(Fouriertransform,FT)。快速傅立叶变换(FFT)和数字滤波是数字信号处理的基本内容。信号时域采样理论实现了信号时域的离散化,而离散傅里叶变换理论实现了频域离散化,因而开辟了数字技术在频域处理信号的新途径,推进了信号的频谱分析技术向更广的领域发展。 1.信号的频谱分析 如果信号频域是离散的,则信号在时域就表现为周期性的时间函数;相反信号在时域上是离散的,则该信号在频域必然表现为周期的频率函数。不难设想,一个离散周期序列,它一定具有既是周期又是离散的频谱。有限长序列的离散傅里叶变换和周期序列的离散傅里叶级数本质是一样的。因而有限长序列的离散傅里叶变换的定义为:x(n)和X(k)是一个有限长序列的离散傅里叶变换对。

基于神经网络方法的字符识别方法

论文写作与规范 题目:基于神经网络方法的字符识别方法 学号: 210802102 专业:计算机系统结构 姓名:靳飞飞 2009 年 1 月 9日

基于神经网络方法的字符识别方法 靳飞飞 (中国海洋大学信息科学与工程学院, 山东青岛266071) 摘要:字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,而是模式识别领域中大多数课题都会遇到的基本问题,并且在不同的课题中,由于具体的条件不同,解决的方法也不尽相同,因而字符识别的研究仍具有理论和实践意义。这里讨论的是用神经网络方法实现基于照相的数字图像的字符识别的问题。并且通过模板匹配的方法作为参照,以体现神经网络在处理模式识别问题上的优势。由于人工神经网络的非线性以及并行性和鲁棒性等特点,在上述领域,其取得了以往传统算法无法获得的成功。 关键词:神经网络;字符识别;图像处理 Character recognition based on neural network Jin Feifei (College of Information Science and Engineering,Ocean University of China,Qingdao 266071,China) Abstract:Character recognition is a traditional problem in the field of pattern recognition, for it is rather an isolated task than a fundamental problem in most work of pattern recognition area, with which we have various methods to deal in terms of specific conditions. That means the pursuit of character recognition is of great significance both in theory and in practice .The goal of this paper is using neural network to recognize characters on digital image based on camera. It also can be seen, in the paper, the advantage of neural network compared with the template matching method. Because its nonlinearity, parallel and strong, in these fields mentioned above, artificial neural network has achieved the success which other traditional algorithms can not reach. Key word: neural network, character recognition, image processing 1引言 字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,

数字验证码识别算法的研究与设计

数字验证码识别算法的研究和设计 王虎, 冯林, 孙宇哲 Wang Hu, Feng Lin, Sun Yuzhe 大连理工大学大学生创新院,大连116023 Institute of University Students’ Innovation, Dalian University of Technology, Dalian 116023, China E-mail: wlys111@https://www.360docs.net/doc/c0791876.html, Research and Design of Digital character-based CAPTCHA Recognition Abstract:CAPTCHA Recognition can be used in multi-send technology. Digital character-based CAPTCHA Recognition, which is foundation of pattern recognition research, is a kind of OCR. In this paper, we proposed a CAPTCHA Recognition System based on simple distortion and its architecture is template matching. Hilditch thinning algorithm, circle structure searching algorithm and dynamic template analyzing algorithm is chose and the weigh of template is also used to improve the recognition accuracy. The advantage of the system is that the recognition precision is perfect. Key words:Template matching, Weighted Template, dynamic template, grid feature, crossing points feature 摘要:验证码识别技术可以用于网站的群发软件,数字验证码识别是光学字符识别(OCR)的一种,是进行模式识别研究的基础。论文提出了以简单变形的数字字符为理论研究素材,将模板匹配作为基本框架的验证码识别系统。系统采用图像的Hilditch细化算法、环结构的搜索算法、活动模板分析算法,加入模板分量的权值。其优点在于能够对特定数字验证码精确识别,实验中识别准确率基本达到100%。 关键字:模板匹配,加权模板,活动模板,网格特征,交叉点特征 文章编号:文献标识码:A 中图分类号:TP391.43 引言 目前,网络上出现了很多以图片形式出现的基于文本的验证码。所谓验证码,就是将一串随机产生的字符,生成一幅图片,图片里随机的加入一些像素干扰、颜色干扰和形变干扰等等,以达到防止恶意注册等目的。有的验证码是无像素干扰的、大小固定的、质心位置居中,含有形变干扰的数字字符,我们称之为简单变形体。反之,我们称加入了更多干扰的字符为复杂变形体。 验证码千变万化,而当前的识别系统都具有很强针对性,只能够识别一种类型的验证码,而且验证码的技术不断发展,出现了更加复杂的基于图像的验证码系统[5],并且目前人工智能(机器智能)还远未赶上人类智能,但是对于给定的验证码系统,在获知其特点之后,基本能够以一定的准确率进行识别[6、7]。 基金项目: 国家自然科学基金( the National Foundation of China under Grant No.10471051 )。 作者简介: 王虎(1984-),学士,研究方向:计算机图形处理,模式识别与智能控制; 冯林(1969-),博士,教授,研究方向:图像压缩、配准及融合和演化算法; 孙宇哲(-),硕士,研究方向:.

(完整版)手写体数字识别系统设计毕业设计

石河子大学 信息科学与技术学院毕业论文 课题名称:手写体数字识别系统设计 学生姓名: 学号: 学院:信息科学与技术学院

专业年级:电子信息工程2007级指导教师: 职称: 完成日期:二○一一年六月十一日

手写体数字识别系统设计 学生: 指导教师: [摘要] 随着科学技术的迅速发展,在邮政编码、统计报表、财务报表、银行票据等处理大量字符信息录入的场合,手写数字识别系统的应用需求越来越强烈,如何将数字方便、快速地输入到计算机中已成为关系到计算机技术普及的关键问题。本文设计实现了一个基于Matlab软件的手写体数字识别系统,采用模块化设计方法,编写了摄像头输入、直接读取图片、写字板输入三个模块,利用摄像头等工具,将以文本形式存在的手写体数字输入进计算机,完成对手写体数字图片的采集,并设计了一种手写数字识别方法,对手写体数字图像进行预处理、结构特征提取、分类识别,最终以文本形式输出数字,从而实现手写体数字的识别。 [关键词] 预处理,结构特征提取,分类识别,手写体数字识别

Handwritten Digit Recognition System Students: Teacher:

Abstract:With the rapid development of science and technology, in zip code, statistics, reports, financial statements, Bank bills dealing with a large number of characters, such as information recorded occasions, handwritten digit recognition system of requirement has become stronger and stronger, how easily and quickly the number entered in the computer has become a key issue relates to the popularization of computer technology. This article design implementation has a based on Matlab software of handwriting body digital recognition system, used module of design method, write has camera entered, and directly read pictures, and write Board entered three a module, using camera, tools, will to text form exists of handwriting body digital entered into computer, completed on handwriting body digital pictures of collection, and design has a handwriting digital recognition method, on handwriting body digital image for pretreatment, and structure features extraction, and classification recognition, eventually to text form output digital, to implementation handwriting body digital of recognition. Key words: Pretreatment, structure feature extraction, classification and recognition, handwritten digit recognition.

数字信号处理技术及发展趋势

数字信号处理技术及发展趋势 贵州师范大学物电学院电子信息科学与技术 罗滨志 120802010051 摘要 数字信号处理的英文缩写是DSP,而数字信号处理又是电子设计领域的术语,其实现的功能即是用离散(在时间和幅度两个方面)所采样出来的数据集合来表示和处理信号和系统,其中包括滤波、变换、压缩、扩展、增强、复原、估计、识别、分析、综合等的加工处理,从而达到可以方便获得有用的信息,方便应用的目的【1】。而DPS实现的功能即是对信号进行数字处理,数字信号又是离散的,所以DSP大多应用在离散信号处理当中。 从DSP的功能上来看,其发展趋势日益改变着我们的科技的进步,也给世界带来了巨大的变化。从移动通信到消费电子领域,从汽车电子到医疗仪器,从自动控制到军用电子系统中都可以发现它的身影【2】。拥有无限精彩的数字信号处理技术让我们这个世界充满变化,充满挑战。 In this paper Is the abbreviation of digital signal processing DSP, the digital signal processing (DSP) is the term in the field of electronic design, the function of its implementation is to use discrete (both in time and amplitude) sampling represented data collection and processing of signals and systems, including filtering, transformation, compression, extension, enhancement, restoration, estimation, identification, analysis, and comprehensive processing, thus can get useful information, convenient for the purpose of convenient application [1]. And DPS the functions is to digital signal processing, digital signal is discrete, so most of DSP applications in discrete signal processing. From the perspective of the function of DSP, and its development trend is increasingly changing our of the progress of science and technology, great changes have also brought the world. From mobile communication in the field of consumer electronics, from automotive electronics to medical equipment, from automatic control to the military electronic systems can be found in the figure of it [2]. Infinite wonderful digital signal processing technology to let our world full of changes, full of challenges

一种基于多模板匹配的字符识别方法

一种基于多模板匹配的字符识别方法 李 婧,龚晓峰,王瑞辉 (四川大学 电气信息学院 成都 610065) 摘要:本文在对字符进行各种预处理,包括倾斜校正,归一化,分割的基础上,依据字符的高度,宽度范围,提出了一种基于多模板匹配的字符识别方法,并将该算法运用于仿宋_GB2312字体,识别率达到98%以上,有效的提高了识别正确率,简单易实现。 关键词:倾斜校正;字符分割;多模板匹配 中图分类号:TP391.41 文献标识码:A A recognition method of characters based on Multi-Template Matching LI Jing, GONG Xiao-feng, Wang Rui-hui (College of Electrical Information, Sichuan University, Chengdu 610065, China) Abstract: This paper first do pretreatment such as skew correction, normalization, segmentation of characters, etc. Then it presented a new muti-template matching method according to the range of the character’s width and height. At last, the experiment used in the FangSong_GB2312 font show that this method can improve recognition accuracy and is easy to put into practice. Keywords: skew correction; character segmentation; multi-template matching 0 引言 字符识别是图像处理和模式识别领域中的研究课题之一,它涉及模式识别、图像处理、人工智能、中文信息处理等学科,是一门综合性技术,在中文信息处理、办公室自动化、人工智能、车牌识别、交通管理等高技术领域都有着重要的实用价值和理论意义[1]。目前字符识别主要有以下几种方法:1)利用字符的统计特征进行特征提取,2)基于字符结构分析的识别方法,3)利用字符的结构特征和变换进行特征提取,4)基于模板匹配的方法进行字符识别,5)近年来又出现了基于神经网络的算法和基于矩和小波变换的识别算法。但由于同一字体的字符有各种字号的差异,单一的运用上述某一种方法的效果都不理想[2]。为了提高识别率,本文从识别率较高的模板匹配法入手,对单模板匹配和特征模板进行改进,提出了一种根据字符高度,宽度值为每个字聚类多个模板,最后采用海明距离实现多模板的匹配。通过将该算法运用于仿宋_GB2312字体,发现这一方法能有效解决相似度高的字符的正确识别问题,有一定的实用价值。 1 识别系统总体方案 字符识别系统一般包括字符预处理,字符分割,字符识别三个环节,系统框图如图1所示。

DSP数字信号处理

数字信号处理是将信号以数字方式表示并处理的理论和技术。数字信号处理与模拟信号处理是信号处理的子集。 简介 简单地说,数字信号处理就是用数值计算的方式对信号进行加工的理论和技术,它的英文原名叫digital signal processing,简称DSP。另外DSP也是digital signal processor的简称,即数字信号处理器,它是集成专用计算机的一种芯片,只有一枚硬币那么大。有时人们也将DSP看作是一门应用技术,称为DSP 技术与应用。 《数字信号处理》这门课介绍的是:将事物的运动变化转变为一串数字,并用计算的方法从中提取有用的信息,以满足我们实际应用的需求。 本定义来自《数字信号处理》杨毅明著,由机械工业出版社2012年发行。 特征和分类 信号(signal)是信息的物理体现形式,或是传递信息的函数,而信息则是信号的具体内容。 模拟信号(analog signal):指时间连续、幅度连续的信号。 数字信号(digital signal):时间和幅度上都是离散(量化)的信号。 数字信号可用一序列的数表示,而每个数又可表示为二制码的形式,适合计算机处理。 一维(1-D)信号: 一个自变量的函数。 二维(2-D)信号: 两个自变量的函数。 多维(M-D)信号: 多个自变量的函数。 系统:处理信号的物理设备。或者说,凡是能将信号加以变换以达到人们要求的各种设备。模拟系统与数字系统。 信号处理的内容:滤波、变换、检测、谱分析、估计、压缩、识别等一系列的加工处理。 多数科学和工程中遇到的是模拟信号。以前都是研究模拟信号处理的理论和实现。 模拟信号处理缺点:难以做到高精度,受环境影响较大,可靠性差,且不灵活等。数字系统的优点:体积小、功耗低、精度高、可靠性高、灵活性大、易于大规模集成、可进行二维与多维处理 随着大规模集成电路以及数字计算机的飞速发展,加之从60年代末以来数字信号处理理论和技术的成熟和完善,用数字方法来处理信号,即数字信号处理,已逐渐取代模拟信号处理。 随着信息时代、数字世界的到来,数字信号处理已成为一门极其重要的学科和技术领域。 数字信号处理器 DSP芯片,也称数字信号处理器,是一种特别适合于进行数字信号处理运算的微处理器,其主要应用是实时快速地实现各种数字信号处理算法。根据数字信号处理的要求,DSP芯片一般具有如下主要特点: (1)在一个指令周期内可完成一次乘法和一次加法;

基于MATLAB的字符识别研究

基于MATLAB的字符识别研究 汽车牌照识别程序的设计 摘要:本次课程设计的目的是通过对基于MATLAB的字符识别的研究,以汽车牌照识别的设计为实例,详细介绍字符识别的相关原理。整个汽车牌照识别的过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用MATLAB软件编程来实现每一个部分,最后识别出汽车牌照。在研究的同时对其中出现的问题进行了具体分析,处理。寻找出对于具体的汽车牌照识别过程的最好的方法。 关键词:MATLAB 字符识别车牌识别神经网络图像处理 引言 在MATLAB的字符识别研究中,汽车牌照的识别是最经典的样例,因为车辆牌照识别系统(License Plate Recognition System,简称LPRS)是建设智能交通系统不可或缺的部分。基于 MATLAB 图像处理的汽车牌照识别系统是通过引入数字摄像技术和计算机信息管理技术,采用先进的图像处理模式识别和人工智能技术,通过对图像的采集和处理,获得更多的信息,从而达到更高的智能化管理程度。车牌识别系统整个处理过程分为预处理、边缘提取、车牌定位、字符分割、字符识别五大模块,用 MATLAB软件编程来实现每一个部分处理工程,最后识别出汽车牌照。 一、 MATLAB及其图像处理工具概述 MATLAB 是 MATrix LABoratory (矩阵实验室)的缩写,是 Math Works 公司开发的一种功能强效率高简单易学的数学软件。MATLAB 的图像处理工具箱,功能十分强大,支持的图像文件格式丰富,如*.BMP、*.JPG、 *.JPEG、 *.GIF、 *.TIF 、*.TIFF、 *.PNG 、*.PCX、 *.XWD、 *.HDF、*.ICO 、*.CUR 等。MATLAB 7.X 提供了20 多类的图像处理函数,几乎涵盖了图像处理的所有技术方法,是学习和研究图像处理的人员难得的宝贵资料和加工工具箱。这些函数按其功能可分为:图像显示、图像文件 I/O、图像算术运算、几何变换、图像登记、像素值与统计图像分析、图像增强、线性滤波、线性二元滤波设计、图像去模糊、图像变换、邻域与块处理、灰度与二值图像的形态学运算、基于边缘的处理、色彩映射表操作色彩空间变换图像类型与类型转换。MATLAB 还着重在图形用户界面(GUI)的制作上作了很大的改善,对这方面有特殊要求的用户也可以得到满足。本文将给出 MATLAB 的图像处理工具箱中的图像处理函数实现图像处理与分析的应用技术实例。 二、基于 MATLAB图像处理的汽车牌照识别系统 1.系统组成 基于MATLAB图像处理的汽车牌照识别系统主要包括车牌定位字符车牌分割和车牌字符识别三个关键环节其识别流程图如图 1所示。 图1 识别流程图 其中, (1)原始图像:由数码相机或其它扫描装置拍摄到的图像; (2)图像预处理:对动态采集到的图像进行滤波、边界增强等处理以克服图像干扰; (3)车牌定位:计算边缘图像的投影面积,寻找峰谷点,大致确定车牌位置,再计算此连通域内的宽 高比,剔除不在域值范围内的连通域,最后得到的便为车牌区域; (4)字符分割:利用投影检测的字符定位分割方法得到单个的字符; (5)字符数据库:为第6步的字符识别建立字符模板数据库; (6)字符识别:通过基于模板匹配的OCR算法或基于人工神经网络的OCR算法,通过特征对比或训练 识别出相关的字符,得到最后的汽车牌照,包括英文字母和数字。

手写体数字的识别

手写体数字识别 第一章绪论 (4) 1.1课题研究的意义 (4) 1.2国内外究动态目前水平 (4) 1.3手写体数字识别简介 (5) 1.4识别的技术难点 (5) 1.5主要研究工作 (6) 第二章手写体数字识别基本过程: (6) 2.1手写体数字识别系统结构 (6) 2.2分类器设计 (7) 2.2.1 特征空间优化设计问题 (7) 2.2.2分类器设计准则 (8) 2.2.3分类器设计基本方法 (9) 3.4 判别函数 (9) 3.5训练与学习 (10) 第三章贝叶斯方法应用于手写体数字识别 (11) 3.1贝叶斯由来 (11) 3.2贝叶斯公式 (11) 3.3贝叶斯公式Bayes决策理论: (12) 3.4贝叶斯应用于的手写体数字理论部分: (16) 3.4.1.特征描述: (16) 3.4.2最小错误分类器进行判别分类 (17) 第四章手写体数字识别的设计流程及功能的具体实现 (18) 4.1 手写体数字识别的流程图 (18) 4.2具体功能实现方法如下: (19) 结束语 (25) 致谢词 (25) 参考文献 (26) 附录 (27)

摘要 数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展,人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。 对手写数字进行识别,首先将汉字图像进行处理,抽取主要表达特征并将特征与数字的代码存储在计算机中,这一过程叫做“训练”。识别过程就是将输入的数字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。 本文主要介绍了数字识别的基本原理和手写的10个数字字符的识别系统的设计实现过程。第一章介绍了数字识别学科的发展状况。第二章手写体数字识别基本过程。第三章贝叶斯方法应用于手写体数字识别。第四章手写体数字识别的设计流程及功能的具体实现,并对实验结果做出简单的分析。 关键词:手写体数字识别分类器贝叶斯vc++6.0 错误!未找到引用源。

相关文档
最新文档