基于神经网络的印刷体数字字符的识别_周泽华

基于神经网络的印刷体数字字符的识别_周泽华
基于神经网络的印刷体数字字符的识别_周泽华

110

基于神经网络的印刷体数字字符的识别

周泽华,胡学友,谭 敏,张为堂

(合肥学院电子信息与电气工程系 合肥,230601)

摘 要:提出了一种基于BP网络的印刷体数字字符的识别方法。通过对BP网络的研究与学习,设计了一种结构合理,收敛速率快的BP网络。实验结果表明,该方法对标准的印刷体数字字符的识别率达到了100%,对有1~3度倾斜角度的字符识别率也达到了96%以上。

关键词:神经网络;BP网络;印刷体数字字符识别

Abstract: A method based on BP neural network was put forward to realize printed numeric character diagnosis, with satisfied results

in experimental test. The rate reaches 100% for standard printed numbers and more than 96% for tilt character with 1-3 angles.

Key words: Neural network ; BP network ; Printed numeric character

中图分类号:TP181 文献标识码:B 文章编号:1001-9227(2009)05-0110-03

0 引 言

印刷体数字识别有极大的实用价值,它可以应用于身份证号码识别、汽车牌照识别、银行票据识别等各种印刷体编号的识别,涉及到交通、银行、教育和邮政等多个领域。它是字符识别的一个重要分支,现有的识别方法主要可分为两类

:基于统计特征的方法[1]

和基于结构特征的

方法

[2]

。由于印刷体数字恰是一种结构性字符,一般采用

“特征提取+分类器”的方法[3-5]

进行分类识别。

近年来,人工神经网络以其高度并行性、良好的容错性、联想记忆功能力、自适应和自学习等特点,备受人们重视,在字符识别领域得到了广泛的应用。本文对神经网络分类器进行研究,提出了一种基于BP网络的印刷体数字字符识别系统的实现方法,为印刷体数字字符识别提供了一条识别率高,识别速度快的新途径。1 人工神经网络

神经网络是由大量处理单元(神经元、处理元件、电子元件、光电元件等)广泛互连而成的网络,它是在现代神经科学研究成果的基础上提出的,反映了人脑功能的基本特征。人工神经网络是一个并行的分布处理结构,它的工作原理是以人脑的组织结构和活动规律为背景,反映了人脑的很多特征,但并不是对人脑部分的真实实现。人工神经网络是通过人工神经元模型来实现模拟生物神经元,人工神经元相当于一个多输入单输出的非线性阈值器件。

BP神经网络是指采用了BP算法的多层前向神经网络。典型的三层BP神经网络结构如图1所示。它由输入层、隐含层(中间层)和输出层组成。其中,X 1,X 2,…X 3为输入向量,T 1,T 2,…T n 为神经元的阈值,W ij ,W jp 为连接权值,Y 1,Y 2,…Y n 为输出向量。网络按有导师指导的方式进行学习,输入信息传播到隐含层结点上,经过logsig型(也可以是其他函数)的激活函数运算后,将隐含结点的输出信息传播到输出结点,在输出层的各神经元获得网络的输入响应。如果输出层不能得到期望输出,即实际输出值与期望输出值之间有误差,那么就将误差信号沿原来的连接通路返回,逐次向输入层传播并进行计算,逐层修正各连接权,再经过正向传播过程。这两个过程反复进行,使得误差信号不断减小,网络对输入信息响应的正确率不断提高。当误差达到所期望的要求时,网络的学习过程就结束。

图1 典型的三层BP神经网络结构

2 BP网络的设计与实现2.1 字符特征提取

在进行BP网络设计之前,我们要对待识别的字符进行特征提取,本设计是选取字符的网格特征作为识别的特

收稿日期:2009-05-20

*基金项目:安徽省教育厅自然科学研究重点项目(KJ2009A55)、合肥学院科研发展基金重点项目(09KY02ZD)、合肥学院自然科学研究发展基金一般项目(09KY02ZR)资助。

作者简介:周泽华(1982-),男,安徽宿松人,助教,硕士,主要研究方向为数字图像处理。

基于神经网络的印刷体数字字符的识别 周泽华,等

《自动化与仪器仪表》2009年第5期(总第145期)111

征,将提取的字符特征直接输入到BP神经网络分类器进行训练。图2是一个归一化后的二值数字0字符点阵图像,图3是0字符的32×24象素网格特征图,白象素1表示该点有笔划,黑象素0表示该点没有笔划。

图2 待识别的0字符

2.2 BP网络的设计

BP网络设计的最大特点就是网络的权值是通过使网络输出与样本输出之间的误差平方和达到期望值而不断调整网络的权值训练出来的。进行神经网络设计的首要任务就是网络结构的确定,一般情况下,网络结构的设计包括:

输入输出神经元个数、隐含层个数、隐含层中神经元数目以及每层传递函数来确定。

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 00 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 00 1 1 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 00 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 0 0 0 0 0 0 0 0 0 0 01 1 1 1 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 0 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 0 0 0 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 00 1 1 1 1 1 0 0 0 1 1 1 1 1 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 0 0 1 1 1 1 0 0 0 0 0 0 0 0 0 0 00 0 1 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 00 0 0 1 1 1 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 1 1 1 1 1 1 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 00 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

图3 32×24的网络特征图

(1)输入层神经元个数

输入层神经元个数根据待识别字符所提取的网格像素特征的维数大小确定。在本系统中,对归一化为32×24点阵大小的字符,以每一个像素点为一个网格,故输入层神经元个数取768。

(2)输出层神经元个数

如果BP网络用作分类器,其类别数为m个,那么输出一般也就取m个神经元。本系统是对0~9这10个数字进行识别,故输出层应为10个神经元。

(3)隐含层个数

神经网络的许多特性正是由于隐含层的存在才具备,然而,具体取多少隐含层合适却没有确定的规律可循,不同的应用对象,与其相适应的网络结构差别很大。理论上已经证明:具有偏差和至少一个S型隐含层加上一个线性输出层的网络,能够逼近任何有理函数,也即含有一个隐含层的三层BP网络即可完成非线性函数的逼近。由于BP网络的功能实际上是通过网络输入到网络输出的计算来

完成的,所以多于一个隐含层的BP网络虽然具有更快的训练速度,但在实际中需要较多的计算时间;另一方面,训练速度也可以通过增加隐含层神经元数来达到。因此,本系统采用具有一个隐含层的三层BP神经网络。

(4)隐含层中神经元数目

在实际设计中,确定隐含层神经元个数的办法是:对于给定的输入输出模式,通过反复调试和对不同神经元数进行训练对比得到合适的值。下面为隐含层神经元个数选择的经验公式:

(1)

式中,h_num 为隐藏层神经元个数,i_num 为输入层神经元个数,o_num 为输出层神经元个数。由此公式可得本系统的隐含层神经元个数h_num 应为92个。

(5)每层传递函数

由于logsig函数不仅具有光滑、可微、非线性和饱和等特性,而且导函数容易用其本身

来表达,简

化了计算。故本系统中采用了logsig函数作为传递函数,

其算法是:

(2)

2.3 BP网络的训练和字符识别

本系统主要包括两个部分:一是训练网络;二是运用已训练好的网络对待测试字符进行识别处理,整个系统框图如图4所示。

a)样本训练 b)字符测试

图4 字符识别系统框图

训练的样本是从已归一化好的单个数字字符数据库中所随机抽取的100个样本,即0~9中每个字符的样本数

112

都为10个。而测试的样本则分为两个部分,一个是直接从字符数据库中(已被选为训练样本的字符除外)随机抽取出600个样本,即0~9中每个字符的样本数都为60个;另一个则是从数据库中对每个字符抽取10个样本,然后对每个样本进行倾斜处理,分别顺时针和逆时针倾斜1度、2度、3度,即每个样本可倾斜处理得到6个样本,然后对倾斜的样本归一化为原来的大小,所以总共可以获得的倾斜字符总数为600个,即0~9中每个字符的倾斜样本数都为60个。总共1200个测试样本送到训练好的BP网络中进行识别。经过测试可以看出,训练后的BP神经网络对字符的识别效果相当好,对未作倾斜的标准字符,识别率达到100%,对字符进行倾斜1~3度处理之后,识别率也达到96.17%。3 结 论

神经网络模式识别技术是近几年来兴起的模式识别领域的一个重要研究方向。它较强的自组织学习能力、容错性、鲁棒性以及非线性处理等优点,使得神经网络模式识别方法在各个领域得到了广泛的应用。BP网络训练是通

过不断地调整权值和阈值来学习发现变量之间的关系,即BP网络训练的目的就是找到合适的权值和阈值,从而达到对目标的分类和识别.本文提出的BP算法具有寻优的全局性和精确性、收敛速度快等特点.

从测试结果来看,识别效果较好.可以在训练样本中添加倾斜字符以进一步提高倾斜字符的识别率。

参考文献

黄 涛.模板匹配在图像识别中的应用[J].云南大学学报:自然科学版,2005,27:327~332

滕书华,孙即祥,邵晓芳.一种鲁棒性的印刷体数字识别算法[J].光学与光电技术,2005,3(6):12~15

Mori S,Suen C Y,Yamamoto K.Historical review of OCRresearch and development[J].IEEE,1992,80(7):1029~1058Mantas J.An overview of character recognition methodologies[J].Pattern Recognition,1986,19(6):425~430

Govindan V K,Shivaprasad A P.Character recognition areview[J].Pattern Recognition,1990,23(7):671~683

234

5图9 A/D转换程序流程图

3 结 论

设计了基于P89LPC9408单片机的数据监测系统,其中

硬件电路主要包括直流电流采集电路、直流电压采集电路、交流电流采集电路、交流电压采集电路、温度采集电路和通信接口电路等。另外,设计了系统的软件,用于监控风/光互补电站的运行情况。设计的数据监测系统已应用到风/光互补电站中,取得了很好的效果。

参考文献

张 源.我国新能源发电技术现状与发展[J].中国能源,1997(7):48-65王 健,娄承芝.风光互补发电数据采集管理系统研究[J].计算机测量与控制,1997,15(9):1247-1249广州周立功单片机发展有限公司.P89LPC9408 Flash单片机使用指南.http://www.zlgmcu.com孟克其劳,贾大江,王利平.风光互补控制器的智能化设计[J].太阳能学报,2005(4):192-195

林 闽.风光互补家用电源的研制[D].合肥工业大学,2007王兆安等.电力电子技术[M].机械工业出版社,2000

(上接第101页)

基于神经网络的印刷体数字字符的识别 周泽华,等

离散Hopfield神经网络的联想记忆-数字识别

1.实现1,2在加噪声之后的识别 array_one=[-1 -1 -1 -1 1 1 -1 -1 -1 -1;-1 -1 -1 -1 1 1 -1 -1 -1 -1;... -1 -1 -1 -1 1 1 -1 -1 -1 -1;-1 -1 -1 -1 1 1 -1 -1 -1 -1;... -1 -1 -1 -1 1 1 -1 -1 -1 -1;-1 -1 -1 -1 1 1 -1 -1 -1 -1; ... -1 -1 -1 -1 1 1 -1 -1 -1 -1;-1 -1 -1 -1 1 1 -1 -1 -1 -1;... -1 -1 -1 -1 1 1 -1 -1 -1 -1;-1 -1 -1 -1 1 1 -1 -1 -1 -1]; array_two=[-1 1 1 1 1 1 1 1 1 -1;-1 1 1 1 1 1 1 1 1 -1;... -1 -1 -1 -1 -1 -1 -1 1 1 -1;-1 -1 -1 -1 -1 -1 -1 1 1 -1;... -1 1 1 1 1 1 1 1 1 -1;-1 1 1 1 1 1 1 1 1 -1;... -1 1 1 -1 -1 -1 -1 -1 -1 -1;-1 1 1 -1 -1 -1 -1 -1 -1 -1;... -1 1 1 1 1 1 1 1 1 -1;-1 1 1 1 1 1 1 1 1 -1 ]; T=[array_one;array_two]'; net=newhop(T); noisy_array_one=array_one; noisy_array_two=array_two; for i=1:100 a=rand; if a<0.1 noisy_array_one(i)=-array_one(i); noisy_array_two(i)=-array_two(i); end end noisy_one={(noisy_array_one)'}; identify_one=sim(net,{10,10},{},noisy_one); identify_one{10}' noisy_two={(noisy_array_two)'}; identify_two=sim(net,{10,10},{},noisy_two); identify_two{10}' subplot(3,2,1) Array_one=imresize(array_one,20); imshow(Array_one) title('standard number 1') subplot(3,2,2) Array_two=imresize(array_two,20); imshow(Array_two) title('standard number 2') subplot(3,2,3) Noisy_array_one=imresize(noisy_array_one,20); imshow(Noisy_array_one) title('noisy number 1') subplot(3,2,4) Noisy_array_two=imresize(noisy_array_two,20); imshow(Noisy_array_two) title('noisy number 2')

印刷体汉字识别及其MATLAB实现

印刷体汉字的识别及其MATLAB实现 0.汉字识别研究的意义 汉字已有数千年的历史,是中华民族文化的重要结晶,闪烁着中国人民智慧的光芒。同时也是世界上使用人数最多和数量最多的文字之一。现如今,汉字印刷材料的数量大大增加,一些专业单位所接触的印刷材料更是浩如烟海,信息量均是爆炸性增长。然而,汉字是非字母化、非拼音化的文字,因此,如何将汉字快速高效地输入计算机,是信息处理的一个关键问题,也是关系到计算机技术能否在我国真正普及的关键问题,更是传播与弘扬中华民族悠久历史文化的关键问题。而且随着劳动力价格的升高,利用人工方法进行汉字输入也将面临经济效益的挑战。因此,对于大量已有的文档资料,汉字自动识别输入就成为了最佳的选择。因此,汉字识别技术也越来越受到人们的重视。汉字识别是一门多学科综合的研究课题,它不仅与人工智能的研究有关,而且与数字信号处理、图像处理、信息论、计算机科学、几何学、统计学、语言学、生物学、模糊数学、决策论等都有着千丝万缕的联系。一方面各学科的发展给它的研究提供了工具;另一方面,它的研究与发展也必将促进各学科的发展。因而有着重要的实用价值和理论意义。 1.印刷体汉字识别的研究 1.1印刷体汉字识别技术的发展历程 计算机技术的快速发展和普及,为文字识别技术应运而生提供了必备条件。加上人们对信息社会发展的要求越来越高,文字识别技术的快速发展可想而知。印刷体文字的识别可以说很早就成为人们的梦想。印刷体汉字的识别最早可以追溯到60年代,但都是西方国家进行的研究。我国对印刷体汉字识别的研究始于70年代末80年代初。同国外相比,我国的印刷体汉字识别研究起步较晚。从80年代开始,汉字ORC的研究开发一直受到国家重视,经过科研人员十多年的辛勤努力,印刷体汉字识别技术的发展和应用,有了长足进步。 1.2印刷体汉字识别的原理分析及算法研究 汉字识别实质是解决文字的分类问题,一般通过特征辨别及特征匹配的方法来实现。目前汉字识别技术按照识别的汉字不同可以分为印刷体汉字识别和手写体汉字识别。印刷体汉字识别从识别字体上可分为单体印刷体汉字识别与多体印刷体汉字识别。 印刷体汉字识别的流程如图1-1所示:

基于某某BP神经网络地手写数字识别实验报告材料

基于BP神经网络的手写体数字图像识别 PT1700105 宁崇宇 PT1700106 陈玉磊 PT1700104 安传旭 摘要 在信息化飞速发展的时代,光学字符识别是一个重要的信息录入与信息转化的手段,其中手写体数字的识别有着广泛地应用,如:邮政编码、统计报表、银行票据等等,因其广泛地应用范围,能带来巨大的经济与社会效益。 本文结合深度学习理论,利用BP神经网络对手写体数字数据集MNIST进行分析,作为机器学习课程的一次实践,熟悉了目前广泛使用的Matlab工具,深入理解了神经网络的训练过程,作为非计算机专业的学生,结合该课题掌握了用神经网络处理实际问题的方法,为今后将深度学习与自身领域相结合打下了基础。

1 引言 从计算机发明之初,人们就希望它能够帮助甚至代替人类完成重复性劳作。利用巨大的存储空间和超高的运算速度,计算机已经可以非常轻易地完成一些对于人类非常困难的工作,然而,一些人类通过直觉可以很快解决的问题,却很难通过计算机解决,这些问题包括自然语言处理、图像识别、语音识别等等,它们就是人工智能需要解决的问题。 计算机要想人类一样完成更多的智能工作,就需要掌握关于这个世界的海量知识,很多早期的人工智能系统只能成功应用于相对特定的环境,在这些特定环

境下,计算机需要了解的知识很容易被严格完整地定义。 为了使计算机更多地掌握开放环境下的知识,研究人员进行了很多的尝试。其中影响力很大的一个领域就是知识图库(Ontology),WordNet是在开放环境中建立的一个较大且有影响力的知识图库,也有不少研究人员尝试将Wikipedia中的知识整理成知识图库,但是建立知识图库一方面需要花费大量的人力和物力,另一方面知识图库方式明确定义的知识有限,不是所有的知识都可以明确地定义成计算机可以理解的固定格式。很大一部分无法明确定义的知识,就是人类的经验,如何让计算机跟人类一样从历史的经验中获取新的知识,这就是机器学习需要解决的问题。 卡内基梅隆大学的Tom Michael Mitchell教授在1997年出版的书籍中将机器学习定义为“如果一个程序可以在任务T上,随着经验E的增加,效果P 也可以随之增加,则称这个程序可以从经验中学习”。逻辑提取算法可以从训练数据中计算出每个特征和预测结果的相关度,在大部分情况下,在训练数据达到一定数量之前,越多的训练数据可以使逻辑回归算法的判断越精确,但是逻辑回归算法有可能无法从数据中学习到好的特征表达,这也是很多传统机器学习算法的共同问题。 对机器学习问题来说,特征提取不是一件简单的事情。在一些复杂问题上,要通过人工的方式设计有效的特征集合,需要很多的时间和精力,甚至需要整个领域数十年的研究投入。既然人工无法很好地抽取实体中的特征,那么是否有自动的方式呢?深度学习解决的核心问题就是自动地将简单的特征组合成更加复杂的特征,并使用这些特征解决问题。 因为深度学习的通用性,深度学习的研究者往往可以跨越多个研究方向,甚至同时活跃于数个研究方向。虽然深度学习受到了大脑工作原理的启发,但现代深度学习研究的发展并不拘泥于模拟人脑神经元和人脑的工作原理,各种广泛应用的机器学习框架也不是由神经网络启发而来的。 MATLAB是美国MathWorks公司出品的商业数学软件,用于算法开发、数据可视化、数据分析以及数值计算的高级技术计算语言和交互式环境,主要包括MATLAB和Simulink两大部分。 MNIST是一个非常有名的手写体数字识别数据集,被广泛用作机器学习的入门样例,它包含了60000张图片作为训练数据,10000张图片作为测试数据,每一张图片代表了0~9中的一个数字,图片的大小为28x28,且数字会出现在图片的正中间。本文以该数据集为例,基于Matlab来分析BP神经网络的性能。 2 运行环境 本设计在Windows 10 下进行设计、主要利用Matlab工具环境,进行模拟演示。

基于知识库的手写体数字识别

HUNAN UNIVERSITY 课程模式识别 题目基于知识库的手写体数字识别学生姓名 学生学号

专业班级 学院名称 2016 年6 月25 日

基于知识库的手写体数字识别 1案例背景: 手写体数字识别是图像识别学科下的一个分支,是图像处理和模式识别研究领域的重要应用之一,并且具有很强的通用性。由于手写数字的随意性很大,如笔画粗细、字体大小、倾斜角度等因素都有可能直接影响到字符的识别准确率,所以手写体数字识别是一个很有挑战性的课题。在过去的数十年中,研究者们提出了许多识别方法,并取得了一定的成果。在大规模数据统计如例行年检、人口普查、财务、税务、邮件分拣等应用领域都有广阔的应用前景。 本案例实现了手写阿拉伯数字的识别过程,并对手写数字识别的基于统计的方法进行了简要介绍和分析。本文实现的手写字体识别程序具有手写数字图像读取、特征提取、数字模板特征库以及识别功能。 2 理论基础: 2-1手写字体识别方法: 手写体数字识别是一个跨学科的复杂问题,综合了图像处理、模式识别、机器学习等多个领域的知识,其识别过程一般包含图像预处理、特征提取、分类器的设定及其后处理等组成。处理流程如图2-1所示。

图2-1 手写体数子识别流程图 2-2 图像预处理 手写体数字识别的首要工作是图像预处理。在图像预处理过程中需要解决的主要问题有:定位、图像二值化、平滑化(去噪)H J、字符切分、规范化等。图像二值化是指将整个图像呈现出明显的黑白效果。待识别的手写体数字图像在扫描过程中,常会带来一些噪声,用不同的扫描分辨率得到的数字图像,其质量也各不相同,故而要先将这些干扰因素排除掉。另外,还需要正确分割整幅文档图像中的手写体数字,而分割后的数字大小、字体常各不相同,故还需进行归一化处理。 2-3 特征提取 特征提取的目的是从经过预处理后的数字图像中,提取出用以区分与其它数字类别的本质属性并数值化,形成特征矢量的过程。常见的手写体数字特征有:模板特征、统计特征、结构特征和变换特征。 2-4 分类器 不同的分类方式对应不同的分类器,可选的分类器有神经网络、支持向量机

(完整版)手写体数字识别系统设计毕业设计

石河子大学 信息科学与技术学院毕业论文 课题名称:手写体数字识别系统设计 学生姓名: 学号: 学院:信息科学与技术学院

专业年级:电子信息工程2007级指导教师: 职称: 完成日期:二○一一年六月十一日

手写体数字识别系统设计 学生: 指导教师: [摘要] 随着科学技术的迅速发展,在邮政编码、统计报表、财务报表、银行票据等处理大量字符信息录入的场合,手写数字识别系统的应用需求越来越强烈,如何将数字方便、快速地输入到计算机中已成为关系到计算机技术普及的关键问题。本文设计实现了一个基于Matlab软件的手写体数字识别系统,采用模块化设计方法,编写了摄像头输入、直接读取图片、写字板输入三个模块,利用摄像头等工具,将以文本形式存在的手写体数字输入进计算机,完成对手写体数字图片的采集,并设计了一种手写数字识别方法,对手写体数字图像进行预处理、结构特征提取、分类识别,最终以文本形式输出数字,从而实现手写体数字的识别。 [关键词] 预处理,结构特征提取,分类识别,手写体数字识别

Handwritten Digit Recognition System Students: Teacher:

Abstract:With the rapid development of science and technology, in zip code, statistics, reports, financial statements, Bank bills dealing with a large number of characters, such as information recorded occasions, handwritten digit recognition system of requirement has become stronger and stronger, how easily and quickly the number entered in the computer has become a key issue relates to the popularization of computer technology. This article design implementation has a based on Matlab software of handwriting body digital recognition system, used module of design method, write has camera entered, and directly read pictures, and write Board entered three a module, using camera, tools, will to text form exists of handwriting body digital entered into computer, completed on handwriting body digital pictures of collection, and design has a handwriting digital recognition method, on handwriting body digital image for pretreatment, and structure features extraction, and classification recognition, eventually to text form output digital, to implementation handwriting body digital of recognition. Key words: Pretreatment, structure feature extraction, classification and recognition, handwritten digit recognition.

基于神经网络的手写数字识别系统的设计与实现

中南大学 本科生毕业论文(设计) 题目基于神经网络的手写数字 识别系统的设计与实现

目录 摘要 (Ⅰ) ABSTRACT (Ⅱ) 第一章绪论 (1) 1.1手写体数字识别研究的发展及研究现状 (1) 1.2神经网络在手写体数字识别中的应用 (2) 1.3 论文结构简介 (3) 第二章手写体数字识别 (4) 2.1手写体数字识别的一般方法及难点 (4) 2.2 图像预处理概述 (5) 2.3 图像预处理的处理步骤 (5) 2.3.1 图像的平滑去噪 (5) 2.3.2 二值话处理 (6) 2.3.3 归一化 (7) 2.3.4 细化 (8) 2.4 小结 (9) 第三章特征提取 (10) 3.1 特征提取的概述 (10) 3.2 统计特征 (10) 3.3 结构特征 (11) 3.3.1 结构特征提取 (11) 3.3.2 笔划特征的提取 (11) 3.3.3 数字的特征向量说明 (12) 3.3 知识库的建立 (12) 第四章神经网络在数字识别中的应用 (14) 4.1 神经网络简介及其工作原理 (14) 4.1.1神经网络概述[14] (14) 4.1.2神经网络的工作原理 (14) 4.2神经网络的学习与训练[15] (15) 4.3 BP神经网络 (16) 4.3.1 BP算法 (16) 4.3.2 BP网络的一般学习算法 (16)

4.3.3 BP网络的设计 (18) 4.4 BP学习算法的局限性与对策 (20) 4.5 对BP算法的改进 (21) 第五章系统的实现与结果分析 (23) 5.1 软件开发平台 (23) 5.1.1 MATLAB简介 (23) 5.1.2 MATLAB的特点 (23) 5.1.3 使用MATLAB的优势 (23) 5.2 系统设计思路 (24) 5.3 系统流程图 (24) 5.4 MATLAB程序设计 (24) 5.5 实验数据及结果分析 (26) 结论 (27) 参考文献 (28) 致谢 (30) 附录 (31)

基于神经网络方法的字符识别方法

论文写作与规范 题目:基于神经网络方法的字符识别方法 学号: 210802102 专业:计算机系统结构 姓名:靳飞飞 2009 年 1 月 9日

基于神经网络方法的字符识别方法 靳飞飞 (中国海洋大学信息科学与工程学院, 山东青岛266071) 摘要:字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,而是模式识别领域中大多数课题都会遇到的基本问题,并且在不同的课题中,由于具体的条件不同,解决的方法也不尽相同,因而字符识别的研究仍具有理论和实践意义。这里讨论的是用神经网络方法实现基于照相的数字图像的字符识别的问题。并且通过模板匹配的方法作为参照,以体现神经网络在处理模式识别问题上的优势。由于人工神经网络的非线性以及并行性和鲁棒性等特点,在上述领域,其取得了以往传统算法无法获得的成功。 关键词:神经网络;字符识别;图像处理 Character recognition based on neural network Jin Feifei (College of Information Science and Engineering,Ocean University of China,Qingdao 266071,China) Abstract:Character recognition is a traditional problem in the field of pattern recognition, for it is rather an isolated task than a fundamental problem in most work of pattern recognition area, with which we have various methods to deal in terms of specific conditions. That means the pursuit of character recognition is of great significance both in theory and in practice .The goal of this paper is using neural network to recognize characters on digital image based on camera. It also can be seen, in the paper, the advantage of neural network compared with the template matching method. Because its nonlinearity, parallel and strong, in these fields mentioned above, artificial neural network has achieved the success which other traditional algorithms can not reach. Key word: neural network, character recognition, image processing 1引言 字符识别是模式识别领域的一项传统的课题,这是因为字符识别不是一个孤立的问题,

手写体数字的识别

手写体数字识别 第一章绪论 (4) 1.1课题研究的意义 (4) 1.2国内外究动态目前水平 (4) 1.3手写体数字识别简介 (5) 1.4识别的技术难点 (5) 1.5主要研究工作 (6) 第二章手写体数字识别基本过程: (6) 2.1手写体数字识别系统结构 (6) 2.2分类器设计 (7) 2.2.1 特征空间优化设计问题 (7) 2.2.2分类器设计准则 (8) 2.2.3分类器设计基本方法 (9) 3.4 判别函数 (9) 3.5训练与学习 (10) 第三章贝叶斯方法应用于手写体数字识别 (11) 3.1贝叶斯由来 (11) 3.2贝叶斯公式 (11) 3.3贝叶斯公式Bayes决策理论: (12) 3.4贝叶斯应用于的手写体数字理论部分: (16) 3.4.1.特征描述: (16) 3.4.2最小错误分类器进行判别分类 (17) 第四章手写体数字识别的设计流程及功能的具体实现 (18) 4.1 手写体数字识别的流程图 (18) 4.2具体功能实现方法如下: (19) 结束语 (25) 致谢词 (25) 参考文献 (26) 附录 (27)

摘要 数字识别就是通过计算机用数学技术方法来研究模式的自动处理和识别。随着计算机技术的发展,人类对模式识别技术提出了更高的要求。特别是对于大量己有的印刷资料和手稿,计算机自动识别输入己成为必须研究的课题,所以数字识别在文献检索、办公自动化、邮政系统、银行票据处理等方面有着广阔的应用前景。 对手写数字进行识别,首先将汉字图像进行处理,抽取主要表达特征并将特征与数字的代码存储在计算机中,这一过程叫做“训练”。识别过程就是将输入的数字图像经处理后与计算机中的所有字进行比较,找出最相近的字就是识别结果。 本文主要介绍了数字识别的基本原理和手写的10个数字字符的识别系统的设计实现过程。第一章介绍了数字识别学科的发展状况。第二章手写体数字识别基本过程。第三章贝叶斯方法应用于手写体数字识别。第四章手写体数字识别的设计流程及功能的具体实现,并对实验结果做出简单的分析。 关键词:手写体数字识别分类器贝叶斯vc++6.0 错误!未找到引用源。

基于神经网络的印刷体数字字符的识别_周泽华

110 基于神经网络的印刷体数字字符的识别 * 周泽华,胡学友,谭 敏,张为堂 (合肥学院电子信息与电气工程系 合肥,230601) 摘 要:提出了一种基于BP网络的印刷体数字字符的识别方法。通过对BP网络的研究与学习,设计了一种结构合理,收敛速率快的BP网络。实验结果表明,该方法对标准的印刷体数字字符的识别率达到了100%,对有1~3度倾斜角度的字符识别率也达到了96%以上。 关键词:神经网络;BP网络;印刷体数字字符识别 Abstract: A method based on BP neural network was put forward to realize printed numeric character diagnosis, with satisfied results in experimental test. The rate reaches 100% for standard printed numbers and more than 96% for tilt character with 1-3 angles. Key words: Neural network ; BP network ; Printed numeric character 中图分类号:TP181 文献标识码:B 文章编号:1001-9227(2009)05-0110-03 0 引 言 印刷体数字识别有极大的实用价值,它可以应用于身份证号码识别、汽车牌照识别、银行票据识别等各种印刷体编号的识别,涉及到交通、银行、教育和邮政等多个领域。它是字符识别的一个重要分支,现有的识别方法主要可分为两类 :基于统计特征的方法[1] 和基于结构特征的 方法 [2] 。由于印刷体数字恰是一种结构性字符,一般采用 “特征提取+分类器”的方法[3-5] 进行分类识别。 近年来,人工神经网络以其高度并行性、良好的容错性、联想记忆功能力、自适应和自学习等特点,备受人们重视,在字符识别领域得到了广泛的应用。本文对神经网络分类器进行研究,提出了一种基于BP网络的印刷体数字字符识别系统的实现方法,为印刷体数字字符识别提供了一条识别率高,识别速度快的新途径。1 人工神经网络 神经网络是由大量处理单元(神经元、处理元件、电子元件、光电元件等)广泛互连而成的网络,它是在现代神经科学研究成果的基础上提出的,反映了人脑功能的基本特征。人工神经网络是一个并行的分布处理结构,它的工作原理是以人脑的组织结构和活动规律为背景,反映了人脑的很多特征,但并不是对人脑部分的真实实现。人工神经网络是通过人工神经元模型来实现模拟生物神经元,人工神经元相当于一个多输入单输出的非线性阈值器件。 BP神经网络是指采用了BP算法的多层前向神经网络。典型的三层BP神经网络结构如图1所示。它由输入层、隐含层(中间层)和输出层组成。其中,X 1,X 2,…X 3为输入向量,T 1,T 2,…T n 为神经元的阈值,W ij ,W jp 为连接权值,Y 1,Y 2,…Y n 为输出向量。网络按有导师指导的方式进行学习,输入信息传播到隐含层结点上,经过logsig型(也可以是其他函数)的激活函数运算后,将隐含结点的输出信息传播到输出结点,在输出层的各神经元获得网络的输入响应。如果输出层不能得到期望输出,即实际输出值与期望输出值之间有误差,那么就将误差信号沿原来的连接通路返回,逐次向输入层传播并进行计算,逐层修正各连接权,再经过正向传播过程。这两个过程反复进行,使得误差信号不断减小,网络对输入信息响应的正确率不断提高。当误差达到所期望的要求时,网络的学习过程就结束。 图1 典型的三层BP神经网络结构 2 BP网络的设计与实现2.1 字符特征提取 在进行BP网络设计之前,我们要对待识别的字符进行特征提取,本设计是选取字符的网格特征作为识别的特 收稿日期:2009-05-20 *基金项目:安徽省教育厅自然科学研究重点项目(KJ2009A55)、合肥学院科研发展基金重点项目(09KY02ZD)、合肥学院自然科学研究发展基金一般项目(09KY02ZR)资助。 作者简介:周泽华(1982-),男,安徽宿松人,助教,硕士,主要研究方向为数字图像处理。 基于神经网络的印刷体数字字符的识别 周泽华,等

印刷体数字识别方法的研究---周初洪

印刷体数字识别方法的研究 周初洪 (上海交通大学医学院资产管理处,上海,2006.2) 摘要:在信息化飞速发展的今天,光学字符识别是一个重要的信息录入与信息转化的手段。其中数字的识别有着非常广泛的应用。本文中作者结合工作实际,分别分析了十个阿拉伯数字的不同特征,设计了具有通用意义的可能性,着重研究探讨该技术的应用可行性,并且尝试将向其他方面推广该技术。 本文首先探讨数字识别技术的现实意义,然后转向技术层面,重点研究图像处理、特征识别、算法推敲等环节。在特征识别技术中提出了“伤口”算法。 在结合相关硬件进行的实际操作中,识别效果良好。 关键词:OCR、数字识别、编号扫描、图像处理 Research of Printed Digit Recognition ZHOU Chu-hong (Asset Dept , Medical College of Shanghai Jiao Tong University, Shanghai, 2006.2) ABSTRACT: OCR(Optical Character Recognition) has become one of the important method in gathering information and information transformation. Printed digit recognition has a promising business feature in many fields in society. The author found something in practice, analyzed the different characteristic of ten Arabic numerals respectively, designed to the possibility of the in general use meaning, emphasizing that technical applied possibility of the research study, and trying to expand that technique toward other aspects. This text inquiries into numeral recognition to realistic meaning first, then turns to the technique level, the point is to research picture processing, characteristic identification and recognition, calculate way deliberation etc. Put forward "wound" calculate way in the characteristic identification. We have got a good result combined with related hardware on the database of MNIST and practice. Key Words: OCR printed digit recognition image processing

自由手写体数字识别系统的设计与实现

自由手写体数字识别系统的设计与实现 戴建辉 信息科学与工程学院,电子信息工程系 指导老师:吴谨 摘要:本文论述并设计实现了一个脱机自由手写体数字识别系统。文中首先对待识别数字的预处理进行了介绍,包括二值化、平滑滤波、规范化、细化等图像处理方法;其次,探讨了如何提取数字字符的结构特征和笔划特征,并详细地描述了知识库的构造方法;最后采用了以知识库为基础的模板匹配识别方法,并以MATLAB作为编程工具实现了具有友好的图形用户界面的自由手写体数字识别系统。实验结果表明,本方法具有较高的识别率,并具有较好的抗噪性能。 关键词:手写体数字;预处理;模式识别;特征提取 Abstrct: This paper describes and designs a free handwritten number recognition system. Firstly, the pretreatment of the character to be recognized is introduced, including binarization, smoothing, normalization and thinning. Next, how to extract the structural features of the numbers is discussed, and we describe the constructing method of repository. Finally, we use the method of template matching, based on repository, to recognize the digital number. Matlab is used as a program tool to realize this free handwritten digital recognition system with friendly graphical user interface. The experimental results show that the rate of the recognition system is high, and the proposed method is robust to noise. Keywords: handwritten number; pretreatment;pattern recognition; feature extraction 1 引言 OCR(Optical Character Recognition)即光学字符识别技术,是通过扫描仪把印刷体或手写体文稿扫描成图像,然后识别成相应的计算机可直接处理的字符。OCR是模式识别的一个分支,按字体分类主要分为印刷体识别和手写体识别两大类。对于印刷体识别又可以分成单一字体单一字号和多种字体多种字号几类。而手写体识别又可分为受限手写体和不受限手写体两类;按识别方式可分为在线识别和脱机识别两类。 字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文字(如:汉字,英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成的各种编号和统计数据,如:邮政编码、统计报表、财务报表、银行票据等等,处理这类

手写体数字识别系统的设计与实现

大学生研究计划项目 论文报告 项目名称:_手写体数字识别系统的设计与实现 负责人:_________ _______________ 学院/专业:_____ ______ 学号:____ ________ 申请经费:_____ _________________ 指导教师:______ _______ 项目起止时间:2011年6月-2012年3月

摘要 手写体数字识别系统依托计算机应用软件为载体,利用C++程序设计的相关知识,运用模块设计等相关技术,最终完成手写体设计系统的程序综合设计。 关键字:手写体数字处理模式识别程序设计 一、论题概述 模式识别是六十年代初迅速发展起来的一门学科。由于它研究的是如何用机器来实现人(及某些动物)对事物的学习、识别和判断能力,因而受到了很多科技领域研究人员的注意,成为人工智能研究的一个重要方面。 字符识别是模式识别的一个传统研究领域。从50年代开始,许多的研究者就在这一研究领域开展了广泛的探索,并为模式识别的发展产生了积极的影响。 字符识别一般可以分为两类:1.联机字符识别;2.光学字符识别(Optical Chara- cter Recognition,OCR)或称离线字符识别。在联机字符识别中,计算机能够通过与计算机相连的输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状,所以相对OCR来说它更容易识别一些。但联机字符识别有一个重要的不足就是要求输入者必须在指定的设备上书写,然而人们在生活中大部分的书写情况是不满足这一要求的,比如人们填写各种表格资料,开具支票等。如果需要计算机去认识这些己经成为文字的东西,就需要OCR技术。比起联机字符识别来,OCR不要求书写者在特定输入设备上书写,它可以与平常一样书写,所以OCR 的应用更为广泛。OCR所使用的输入设备可以是任何一种图像采集设备,如CCD、扫描仪、数字相机等。通过使用这类采集设备,OCR系统将书写者已写好的文字作为图像输入到计算机中,然后由计算机去识别。由于OCR的输入只是简单的一副图像,它就不能像联机输入那样比较容易的从物理特性上获得字符笔划的顺序信息,因此OCR是一个更具挑战性的问题。 数字识别是多年来的研究热点,也是字符识别中的一个特别问题,它是本文研究的重点。数字识别在特定的环境下应用特别广泛,如邮政编码自动识别系统,税表和银行支票自动处理系统等。一般情况下,当涉及到数字识别时,人们往往要求识别器有很高的识别可靠性,特别是有关金额的数字识别时,如支票中填写

数字识别论文

保密类别编号 毕业论文 数字识别实现 学院计算机学院 专业软件工程 班级2班 姓名王茜 指导教师黄祥林 中国传媒大学 年月日

数字识别实现 王茜 摘要 在信息化飞速发展的时代,光学字符识别是一种重要的信息录入与信息转化的手段。数字识别作为光学字符识别中的一个分支,在车牌识别、邮政编码识别、统计报中等领域有着非常广泛的应用,用数字识别系统代替手工录入,可节约大量的人力和财力。因此,数字识别的研究有着重大的现实意义。 本文主要研究的即数字识别问题。首先,对数字图像的预处理工作进行了详细的介绍,其中包括:二值化、字符切分、归一化等。接着介绍了当前数字识别的几种常用方法。然后重点描述了用于印刷体数字识别的模板匹配法和基于整体特征的快速手写体数字识别法的原理,并给出了算法实现的过程。 实验结果证明,上述算法能取得较好的识别效果。 关键词:数字识别,图像预处理,模板匹配,整体特征

Xi. Wang ABSTRACT OCR (Optical Character Recognition) has become one of the important methods in gathering information and information transformation. Digit recognition has a promising business feature in many fields in society, for example the car license plate recognition、postcode recognition, the statistics of report forms, financial report forms. So the researching on the Digit recognition is one of the important things. The paper describes the basic process and methods of numeral recognition system. First, Keywords: Numeral recognition \

手写数字识别实践指导手册

手写数字系统实践指导手册 1 问题描述 设计一个简单的手写数字识别系统,能够识别手写输入的数字1-9并且能够识别选中的文本文件中的数字,应具有简单方便的操作界面,输入输出等。 1.1功能需求分析 通过分析,以及从用户的角度考虑,系统应该具有以下功能: (1)数字的手写输入。作为一个手写数字识别系统,首先应该能够让用户过绘制窗口进行数字绘制,系统得到用户的手写输入进行处理。 (2)直接选择文件。用户还可以选择系统中的文本文件进行处理。 (3)数据预处理。包括计算数据大小、二值化、格式化处理等。 (4)数字提取。将经过二值化后的图像中的个数字区域进行提取,只有能够将数字进行准确的提取,才能将其一一识别。 (5)基准库的选择与建立。选择一个可供系统训练和测试的样本库非常重要,本系统的训练集和测试集选择的是《机器学习实战》中所给的数据。 (6)识别数字。经过训练集进行训练后,使用knn算法对需要识别的数字识别。 2 数据集获取 ●任务要求: 从网上爬取或者下载适合进行手写数字识别系统的训练集和测试集 ●实践指导: 方式一:自己从网上找适合的数据下载 方式二:推荐数据集:“手写数字数据集的光学识别”一文中的数据集合,该文登载与2010年10月3日的UCI机器学习资料库中https://www.360docs.net/doc/8917832471.html,/ml

3 功能设计与实现 3.1手写数字识别系统结构图: 图一:系统结构图 3.2识别用户选择手选文件功能设计与实现 ●任务要求: 用户可以自己从电脑中选择文本文件进行识别。 ●实践指导: KNN分类器的构造思路及原理如下: 1)选择训练集和测试集。系统所采用的数据集选用的是“手写数字数据集的光学识别”一文中的数据集合。0-9每个数字大约有200个训练数据20个测试数据。数字的文本格式如图所示。

神经网络应用于手写数字识别-matlab说课讲解

神经网络应用于手写数字识别-m a t l a b

实验报告 实验课程:管理运筹学 实验名称:神经网络应用于手写数字识别-matlab 学生姓名: 指导教师: 实验时间: 2018年1月16日

实验要求: 运用matlab编程进行神经网络进行手写数字识别。 小组成员: 姓名学号 实验过程: 一、BP神经网络 神经网络是由很多神经元组成,可以分为输入,输出,隐含层。 BP神经网络的特点:信号前向传递,信号反向传播。若输出存在误差,根据误差调整权值和阈值,使网络的输出接近预期。 在用BP神经网络进行预测之前要训练网络训练过程如下: 1.网络初始化:各个参数的确定包括输入,输出,隐含层的节点数,输入和隐含,隐含和输出层之间的权值,隐含,输出层的阈值,学习速度和激励函数。 2.计算隐含层输出 3.计算输出层输出 4.误差计算 5.权值更新 6.阈值更新 7.判断迭代是否结束 二、模型建立 数据集介绍: 数据集包含0-9这10个数字的手写体。是放在10个文件夹里,文件夹的名称对应存放的手写数字图片的数字,每个数字500张,每张图片的像素统一为28*28。 识别流程: 首先要对数据进行处理,这个主要是批量读取图片和特征提取的过程,特征提取的方法很多,这里只挑选最简单的来实现,然后是训练出一个神经网络的模型,最后用测试数据进行测试。为了方面,这里的神经网络的创建,训练和测试采用matlab函数来实现。

训练 运行流程: 1.确定神经网络的输入,输出。 输入是BP神经网络很重要的方面,输入的数据是手写字符经过预处理和特征提取后的数据。预处理有二值化,裁剪掉空白的区域,然后再统一大小为70*50为特征提取做准备。特征提取采用的是粗网格特征提取,把图像分成35个区域,每个区域100像素,统计区域中1像素所占的比例。经过预处理特征提取后,28*28图像转成1*35的特征矢量。提取完5000张图片后,依次把所有的特征存于一个矩阵(35*5000)中。 2.神经的网络的训练 用matlab的rands函数来实现网络权值的初始化,网络结构为输入层35,隐藏层34,输出层10,学习速率为0.1,隐藏层激励函数为sigmoid函数。随机抽取4500张图片提取特征后输入,按照公式计算隐含层和输出层输出,误差,更新网络权值。 3.神经网络的预测 训练好神经网络之后,用随机抽取的500个数字字符对网络进行预测,输入特征向量,计算隐含层和输出层输出,得到最后预测的数据。同时计算每个数字的正确率和全体的正确率。最后得到的总体正确率为0.8620。 主函数:

相关文档
最新文档