手写体数字识别的软件设计.doc
《手写体数字识别的软件设计.doc》由会员分享,可在线阅读,更多相关《手写体数字识别的软件设计.doc(58页珍藏版)》请在沃文网上搜索。
1、 手写体数字识别的软件设计 摘 要手写体数字识别是利用机器或计算机自动辨认手写体阿拉伯数字的一种技术,是光学字符识别技术的一个分支。由于阿拉伯数字的世界通用性,并且数字的识别和处理也常常是一些自动化系统的核心和关键,所以对手写体数字识别研究通用性强,且意义重大。本文主要的研究的工作集中在图像预处理和选择合适的特征向量,并实现一个完整手写体数字识别系统。本文中对几种常见的二值化算法进行比较,并最终选择基于梯度的二值化算法;在本文中,提出了一种方法来解决结构点检测的传统方法的缺陷。另外本文还提出将一般用来直接识别字符的凸凹特征作为字符的特征向量之一。通过对NIST的数据进行测试,实验数据表明本文设
2、计的数字识别系统对手写体数字识别具有较高的识别率。关键词:手写体数字识别,特征向量,二值化算法,凸凹特征The Software Design of Handwritten Numeral Recognition AbstractThe handwritten numeral recognition is a technology, which auto recognizes the handwriting Arabian numeral via machines or computers, and a special field in the Optical Character Recogn
3、ition technology. Then handwritten numeral recognition research is greatly general-purpose and significative, because of the universal Arabic numerals. On the same score, the handwritten numeral, recognition technologies are playing an important role in a number of automatization systems.In this pap
4、er, the main study focused on image pre-processing and selection of appropriate feature vectors, and to realize a complete system of handwritten numeral recognition. There are several common comparisons of binarization algorithm in this article, and choose the gradient-based binarization algorithm f
5、inally; and objecting to the defection of traditional methods of structural point detection, a solution to the problem was put up in this article. In addition, this paper also raises the convex-concave feature as one of the character feature vectors.Through the NIST test data, experimental data show
6、s that the digital identification system designed for handwritten numeral recognition has a high recognition rate.Keywords: Handwritten numeral recognition, Character feature vectors, Binarization algorithm, Convex-concave feature中北大学2009届毕业设计说明书目 录1 绪论11.1 字符识别概述11.2 手写数字识别的意义和应用前景21.3 字符识别的研究与发展31
7、.4 手写数字识别的难点31.5 国内外研究现状41.6 手写体数字识别系统概述51.7 本文内容安排62 手写体数字识别中预处理技术82.1 平滑去噪82.2 二值化102.3 归一化162.4 倾斜校正202.5 细化223 手写体数字识别中串切分技术253.1 切分方法概述253.2 手写数字串常用方法简介253.2.1 投影法的直线切分253.2.2 滴水算法263.2.3 动态规划算法263.2.4 滑动窗口法263.2.5 多模具切分法263.3 本文手写数字串切分方法介绍274 手写体数字识别中特征值提取技术294.1 特征提取概述294.2 手写体字符特征提取方法概述304.3
8、 手写体数字识别中的结构特征提取324.3.1 结构点特征32第 页 共 页4.3.2 穿越密度特征344.3.3 投影特征354.4 手写体数字识别中的统计特征提取364.4.1 重心矩特征364.4.2 粗网格特征364.4.3 水平、垂直投影特征374.4.4 环凸凹特征384.4.5 全局Kirsh边缘方向特征395 人工神经网络分类器415.1 人工神经网络概述415.2 BP神经网络概述425.3 本文的神经网络结构设计446 系统实现与结果分析476.1 系统实现476.1.1 系统实现环境476.1.2 系统处理过程图476.2 结果分析487 结束语50附录:NIST样本库的
9、文件结构51参 考 文 献52致 谢54第 页 共 页中北大学2009届毕业设计说明书1 绪论1.1 字符识别概述光学字符识别(Optical Character Recognition,简称OCR)是20世纪20年逐步发展起来的一门自动化技术,是图像处理与模式识别领域的一个重要分支1。其目的就是通过扫描、摄像等光学输入方式将汉字报刊、书籍、文稿及其它印刷品的文字转化为图像信息,将图形、表格的图像进行保存,再利用文字识别技术将图像内的文字或表格中的资料一律变成计算机能识别的文字,以便于计算机的管理维护。它能够减少存储容量、通讯交流的信息、循环利用已识别出的文字以及节省因键盘输入而浪费的人力、物
10、力、财力和时间。手写数字识别(Handwritten Numeral Recognition,简称HNR)是OCR的一个分支,它的任务是把手写阿拉伯数字(如0,1,2,9)通过非键盘方式输入到计算机中,以便作进一步的处理和应用,给计算机建立视觉系统,自动辨识人用笔写在纸(介质)上的数字。它属于模式识别、人工智能的一个重要分支,涉及到模式识别和图像处理、人工智能、统计决策理论、模糊数学、组合数学、信息论、计算机等学科;同时也涉及心理学等,是介于基础研究与应用研究之间的一门综合性的技术2,在办公室、机器翻译等方面具有重大实用意义。手写体数字的识别是人们研究较为深入的一个领域。文字识别作为计算机技术
11、的一个领域在许多的环境当中都有着非常广泛的应用。文字识别是新一代智能计算机接口的重要组成部分。近二十年来,国内外对各种字符进行了广泛深入的研究,研究出了许多非常有效的识别算法,与此同时用于各种字符识别的应用软件也越来越丰富。 字符识别可以分为两个大类,文字识别和数字识别。数字识别又可以分为手写体数字识别和印刷体数字识别,而对于手写体数字识别可分为联机手写体数字和脱机手写体数字的识别。当今手写体数字识别是人们研究的一个热点,而且手写体数字识别的技术相对于以前已经有了较大的提高。国内专门做识别技术成果比较好的是汉王公司,该公司的识别软件对各种字符识别率已经很不错。相对于联机手写体数字识别技术,脱机
12、手写体数字识别技术识别率相对要低,而且在生活实际应用得到很多应用(例如:手机手写输入,手写板等都是基于联机识别)。由于联机识别相对于脱机识别能够获取更多的信息,其除了获取了图片信息外,计算机还可以通过与计算机相连的手写输入设备获得输入字符笔划的顺序、笔划的方向以及字符的形状。因此一般的联机识别要比脱机识别的识别率要高。所以联机识别的已经投入使用,但是对于脱机识别由于其技术限制,以至其到现在还没有大范围的应用。虽然脱机手写体数字识别难度较大,识别率较低,但是比起联机手写体数字识别来说,脱机手写体数字识别不要求书写者在特定的输入设备上书写,它可以与平常一样书写,所以脱机手写体数字识别的应用更为广泛
13、,如邮政编码、统计报表、财务报表、银行票据、学生成绩、车牌号码等。一旦脱机手写体数字的研究取得成功,满足实用需求,并投入应用,将产生巨大的社会效益。1.2 手写数字识别的意义和应用前景对手写体数字的识别研究不仅有着重大的现实意义而且还有十分广阔的应用前景。当今经济的发展,金融市场化进程的日益加快,票据业务发展很快,票据数量也与日俱增。其中个人凭证,支票,发票,进账单等等票据均需要处理大量的信息。而目前,票据录入仍然依赖人工处理方式,因而使得票据管理工作也相对落后。如果通过手写体字符识别技术来实现信息的自动录入,无疑将会有效解决传统人工处理方式中存在的工作量大、成本高、效率低、时效性差等问题。此
14、外,手写数字识别应用领域还有:1) 手写数字识别被应用在大规模数据统计中。例如:人口普查、成绩单录入、行业年检、财务报表录入等应用中。2) 手写数字识别被应用在财务、税务、金融领域应用。随着我国经济的快速发展,每天会有大量的财务、税务、支票等需要处理。3) 手写数字识别被应用到邮件分拣系统中3。由上可见,对手写体数字识别有着很高的实用价值,除此之外,手写体数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:1) 阿拉伯数字是唯一的被世界各国通用的符号,对于手写体数字识别的研究基本上与文化背景无关,这样就为世界各国研究者提供了一个供大家共同探讨技术的平台,研究并比较各种算法的优缺点。2
15、) 由于手写体数字识别的类别少,有助于作深入分析与验证一些新的理论。这方面最明显的例子是人工神经网络(ANN)。很多ANN模型和算法都是以手写体数字识别作为实验测试平台,验证其理论的有效性,评价各种方法各自的优缺点。3) 尽管人们对手写体数字识别已经从事了很长时间的研究,并取得了一定的成果,但是到目前为止,机器识别本领与人的认知能力相比,还是有很大的差距。4) 手写体数字识别的方法很容易被推广到其它相关问题上,比如英文字母识别、汉字识别等等。1.3 字符识别的研究与发展字符识别的最早能追溯到1890年一项帮助盲人阅读装置的发明专利。1929年,有德国人Tausheck首先正式提出OCR概念,并
16、取得了OCR专利权,四年后美国人Handel也取得了同样的专利权4。但真正OCR是在本世纪50年代随着计算机的出现而到来的。在字符识别大发展时期(1990年后),许多研究者对字符识别进行了探索与研究,当时提出许多新的有效识别工具,其中人工神经网络(Artificial Neural Network ,ANN)5,支持向量机(Support Vector Machine)6,7,隐马尔科夫模型(Hidden Markov Model,HMM)8等,而这些识别工具至今仍然是研究的热点。1) 在人工神经网络识别方法中,模式类的描述方法一般还是特征向量,只是在分类时,利用了神经网络的自动学习和记忆功能
17、,通过对样本的训练建立起记忆,然后将未知样本作为输入让神经网络“回忆”出该样本所属的类别。2) 支持向量机是Vapnik 等人根据统计学理论提出的一种新型机器学习方法。由于其出色的学习性能,该技术已成为机器学习界的研究热点,并在很多领域都得到了成功的应用,如人脸识别、手写体数字识别、文本自动分类等。3) 隐马尔科夫模型是一类基于马尔科夫随机过程的统计模型9。隐马尔科夫模型对于随机信号具有很强的学习和建模能力,因此在语音识别中取得了很大的成功。从上世纪90年代开始,一些研究者已经将隐马尔科夫模型引入到了图像处理、识别和分析中来。1.4 手写数字识别的难点虽然,人们对字符识别的研究有百余年,并在字
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 手写体 数字 识别 软件设计
