欢迎来到沃文网! | 帮助中心 分享知识,传播智慧!
沃文网
全部分类
  • 教学课件>
  • 医学资料>
  • 技术资料>
  • 学术论文>
  • 资格考试>
  • 建筑施工>
  • 实用文档>
  • 其他资料>
  • ImageVerifierCode 换一换
    首页 沃文网 > 资源分类 > DOC文档下载
    分享到微信 分享到微博 分享到QQ空间

    嵌入式课程设计论文.doc

    • 资源ID:851412       资源大小:840.60KB        全文页数:27页
    • 资源格式: DOC        下载积分:20积分
    快捷下载 游客一键下载
    账号登录下载
    微信登录下载
    三方登录下载: QQ登录 微博登录
    二维码
    微信扫一扫登录
    下载资源需要20积分
    邮箱/手机:
    温馨提示:
    快捷下载时,用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)。
    如填写123,账号就是123,密码也是123。
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP,下载更划算!
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    嵌入式课程设计论文.doc

    1、 目录摘要2关键词:3第一章 绪论311引言312嵌入式系统概述413手写识别及原样保存的基本问题5131泰文手写识别存在的难点514手写汉字识别流程715样本处理过程7151笔画提取7152预处理8第二章 联机手写识别概述821联机手写识别922预处理923归一化924特征提取1025特征匹配方法1026多分类器的集成11第三章 泰文手写识别系统设计与实现1231嵌入式系统架构12311嵌入式系统总体架构12312触摸屏的基本原理1332识别系统整体设计1433预处理设计与实现1434分类器设计与实现15第四章 手写识别系统测试1641系统界面1642系统测试1743小结18第五章 结束语1

    2、851术语解析1852工作原理1953在Linux系统中存储设备的两种表示方法2054 IDE接口硬盘,对于整块硬盘的两种表示方法;2055、IDE接口硬盘分区的两种表示方法:2156 本章小结22第六章 结束语2361本系统有以下优点:2362后续研究工作与展望23致谢24参考文献25基于嵌入式平台的手写识别及原笔迹存储系统的设计 摘要随着移动技术与相关技术的迅速发展,手机、个人掌上电脑(PDA)、笔记本电脑等各种电子设备变得流行,它们已成为人们工作和娱乐必不可少的随身用品。对于各种移动电子设备在中国的推广使用,原手写输入是一个必须考虑的问题,传统的输入方式大多使用键盘,不论是笔记本电脑使用

    3、的标准键盘,还是各手机厂商设计的简化键盘,都是使用键盘采集信息,然后通过汉语拼音或者笔画输入等方式完成汉字输入。对于嵌入式小型设备来说,原有键盘设计引起占用空间大和输入汉字效率低等诸多问题。如何解决这些问题,同时保证设备足够的显示空间,又不添加新的复杂硬件设备,一种叫做触摸屏手写汉字输入的技术越来越受到人们的推崇。以 Windows CE 5.0 为运行平台,Embedded Visual C+ 4.0 为开发环境,设计和实现了一套屏幕手写识别系统,不仅能对现有汉字进行有效识别,用户还可以根据需要自行对字库扩展,有助于提高汉字的识别率。随着联机手写识别技术的发展,多种语言的联机手写识别系统都已

    4、应用在各种嵌入式系统上。但泰文文字形状和结构特殊、相似文字多、手写体文字形变复杂,所以对泰文手写文字的识别有一定的难度,并且由于嵌入式系统CPU的运算能力较差,所以在嵌入式系统上实现泰文联机手写识别,需要依据具体情况进行设计,才能取得满意的效果。本系统在对联机手写识别技术和泰文文字深入分析的基础上,针对手写原样独特形状选择特征提取方法,并结合嵌入式系统的实际情况对识别系统各关键阶段预处理、字符分离和识别匹配阶段进行详细设计。在此基础上,本系统设计并实现了一个三级分类器集成的识别系统,其识别速度和准确性较原有系统得到了很大提高。最终在低性能嵌入式系统上实现了手写识别及。测试表明,本系统的识别速度

    5、和识别率都达到了满意的效果,显示出本文所设计的识别系统的优越性。本文所采用的思想和设计的算法,具有一定的通用性,对与泰文文字识别相关的应用都有一定的借鉴意义。关键词:手写汉字识别,触摸屏,嵌入式系统泰文,联机手写识别,特征提取,存储系统,嵌入式系统第一章 绪论11引言随着科技进步和全球信息交流的扩大,个人便携式消费电子产品(包括手机、PDA、掌上电脑、电子词典等1迅速发展,手机和PDA等典型的电子产品更成了生活的一部分,其拥有的数量已经大大超过个人电脑而成为人们同常生活的必需品。嵌入式系统就是当Ijf各种电子产品的软件和硬件实现,是一种单片机技术的发展。随着市场的成熟和人们信息需求的提高,小体

    6、积大屏幕的电子产品配备触摸屏幕和手写笔是必然趋势,而联机手写识别的文字输入方法成了此类产品最吸引人的功能。所以当前联机手写识别技术成为便携式电子产品的很大的竞争优势。泰文联机手写识别目前仅对单字进行识别,如果能够对连续输入的泰文文字进行识别,对用户来说更为方便和快捷。为达到此目标需要提高识别系统的性能和解决连笔问题,今后将会对相关算法作更为深入的研究。汉字识别是模式识别的分支,也是机器学习和智能化的一个方面,就目前的发展状况同时根据设备的依赖关系,可大致分为两类:联机识别和脱机识别 联机识别由于有强大的数据库服务器支持,所以识别率较高,但存在的缺点是响应速度慢,灵活性差。而脱机识别恰好相反,识

    7、别率低但响应速度较快,灵活性好,所以哪种方案较好,只能根据使用场合判断。如银行的手写签名认证就适合采用联机识别,而脱机识别主要用在如移动电话、PDA 等。汉字识别的方法也主要有四种:结构模式识别,统计模式识别,统计与结构识别相结合。人工神经网络 结构模式识别需先提取笔端或基本笔画作为基元。由这些基元构成部件 再由部件组合及其相互关系来精确地对汉字加以描述,就像一篇文章有字、词、短语和句子并按语法规律所组成一样,所以这种方法也叫句法模式识别。统计模式发展教早,理论也较为成熟,其要点是提取待识别模式的一组统计特征。然后按照一定准则所确定的决策函数进行分类裁决,人工神经网络是一种模拟人脑神经元细胞的

    8、网络结构,它是由大量简单的基本元件-神经元相互连接的自适应非线形动态系统,其缺点是规模大、复杂度太大,本系统将采用结构识别方法作为设计原则联机手写识别或称为在线手写识别(online Handwriting Recognition),它给用户提供了一种自然的文字输入方式。用户利用某种输入设备直接书写文字,经过系统识别处理后,转换为文字统一表示的输入方法。在嵌入式系统上的联机泰文手写识别输入,是通过压电式触摸屏幕来实现的。在书写时,手写笔在触摸屏上的接触点的电压变化可以转化为坐标,所以手写笔的运动轨迹被转化为坐标序列并被记录下来,从这些坐标序列可以比较容易地抽取书写文字的笔划和笔顺的信息,进而对

    9、书写者所书写的笔迹进行识别,转化为泰文文字输出。从90年代以来,联机手写体的识别正逐步走向实用。各国的科研工作者相继研究出了多种语言的联机手写识别系统,包含英文、中文、韩文、日文等联机手写识别系统都已经应用在计算机和各种电子产品上。泰国是一个发展中国家,拥有6千万人口,电子产品和计算机软硬件技术也在迅速的发展,因此具有广泛的市场前景。过去20年泰文手写识别技术得到了很大的发展,尤其在过去10年内。但是目前泰文手写字符识别仅有少量的研究,大多集中于印刷体泰文字符的识别,这是因为泰文手写字符识别在某些方面比其他字符识别更困难,比如字符相似度很高、不同书写者的书写方式变化较大、文字内缺乏空隙等等,这

    10、些导致对泰文文字特征提取和识别的困难。泰文文字是一种以字符为基础的文字,是由不同字符组合成的,并且字符中含有圆环、之字型、曲线和字符头部尾部的圆圈等等很多因素成为了泰文手写识别的难点,所以对泰文手写识别的研究具有一定的难度。过去的手写板只是文字输入的工具,并不能记录笔迹,无法传达出书写者的意愿情感。“原笔迹”的概念和技术都来源于国内厂商汉王,此后虽然有少数厂商进行了效仿,但在专业性和用户体验方面都远不如原汁原味的汉王手写。早在2007年,汉王就推出了汉王笔“墨宝”系列,这被认为是“原笔迹”的雏形,当然“墨宝”系列本身还是表现得非常成熟,它采用当时最新的微压传感技术,可以根据用户使用笔的力度来进

    11、行感应,并传达出笔迹粗、细、浓、淡等效果,让电子设备上的手写文字和在纸质上书写无论手感还是效果都更加接近,乃至达到完全一样的效果。经过几年的发展,在今年汉王推出的TouchPad B16上,“原笔迹”技术已经相当完善,手写便签、手写邮件等应用都一应俱全,真正为商务认识打造出了最适合办公的平板产品。12嵌入式系统概述嵌入式系统【24l一般指非PC系统,有计算机功能但又不称之为计算机的设备或器材。它是以应用为中心,软硬件可裁减的应用系统,对功能、可靠性、成本、体积、功耗等综合性严格要求的专用计算机系统。简单地说,嵌入式系统集系统的应用软件和硬件于一体,具有软件代码小、高度自动化、响应速度快等特点,

    12、特别适合于要求实时和多任务的体系。嵌入式系统主要由嵌入式处理器、相关支撑硬件、嵌入式操作系统及应用软件系统等组成,它是可独立工作的“器件”。嵌入式系统几乎包括了生活中的所有电器设备,如掌上PDA、移动计算设备、电视机顶盒、手机上网、数字电视、多媒体、汽车、微波炉、数字相机、家庭自动化系统、电梯、空调、安全系统、自动售货机、蜂窝式电话、消费电子设备、工业自动化仪表与医疗仪器等。嵌入式系统的硬件部分,包括处理器微处理器、存储器和I,o端口、图形控制器等。嵌入式系统大多使用EPROM、EEPROM或闪存(Flash Memory)作为存储介质。软件部分包括操作系统软件(要求实时和多任务操作)和应用程

    13、序编程。应用程序控制着系统的运作和行为;操作系统控制着应用程序编程与硬件的交互。嵌入式系统在应用中,按其制造成本分类大致可以由高、中、低端三个层次组成。在高端应用中,成本往往不是考虑的主要条件,而更强调稳定性、J下确性、和功能性,有许多系统设计时通过增加系统冗余来保证系统稳定性和正确性。这种系统以军事工业和航天工业控制系统为典型代表。中、低端的应用一般是消费类电子产品,消费大众对价格的敏感导致了成本为第一要素,其CPU的计算能力和外部存储空间经常被压缩到最低。本文设计的泰文联机手写识别系统运行在一个低端嵌入式系统上,由于低端嵌入式系统CPU的运算能力较差,所以在嵌入式系统上实现泰文联机手写识别

    14、,需要依据具体情况对识别系统进行设计和优化,才能取得满意的效果。13手写识别及原样保存的基本问题131泰文手写识别存在的难点对于嵌入式系统中联机泰文手写文字的识别存在着一定的困难,主要可以从下面几点体现:(1)相似文字多泰文字符在其结构特征上存在很高的相似性,相似字符所构成的文字之间的相似性也很高。如图14中每行字符其构成几乎相同,字符之间的差别仅在于很小得部分。起笔、落笔处或中间笔顺的弧度的差别等。同时,文字的这种相似性随着文字所含字符数量的增多而增加。这给文字识别过程中的预处理、特征提取乃至分类处理带来很大困难,在手写体文字识别情况下这一困难显得更为突出。图14列举了部分印刷体泰文相似文字

    15、,图15列举出部分手写体题相似文字。(2)文字形变方式多样手写文字识别的最大难点在于由书写不同引起的模式结构的变形,这种变形因人而异,而且变形可能十分严重。抗干扰能力,也称为鲁棒性,对于联机手写识别系统的性能是非常重要的。因为泰文字本身是复杂的二维结构,书写的时候,笔画的畸变、丢失、多余笔段(如笔锋)的插入、字的倾斜、部件问相对位置和大小变化等,这些都是经常发生的现象,所以形变后的文字结构更加复杂。对于结构识别来说,会造成基元提取和识别的错误。传统的结构识别方法恰好在鲁棒性上是薄弱环节。因此,要想取得好的性能,必须对传统识别方法进行改进,增强其鲁棒性,从而增加实用性,如何吸收手写体文字中的个性

    16、因素和环境因素是识别系统需要解决的关键问题之一。如图16列举了泰文字符的18种手写体变形Il”。 (3)笔顺问题由于不同人有不同的书写习惯,笔划的书写顺序经常发生变化。因此,单纯通过文字结构的串匹配进行识别难以达到理想效果。对手写泰文进行识别时,仅仅:通过笔段、笔划等细节特征进行分析是不够的,还需要增加对轮廓、笔划密度等整体分析。(4)识别系统的性能目前研究的很多泰文联机手写识别系统都能达到较高的识别率,然而其识别方法需要大量的数值运算,包括浮点运算。面大多数嵌入式系统由于成本的限制,所选取的CPU较低端,无法进行复杂的计算,更罕有浮点协处理器。浮点运算由编译器自带的浮点处理程序实现。一条普通

    17、的浮点加法,需要消耗数百个时钟周期,更刁:用髓浮点乘除法了。所以对泰文丁J写识别系统各阶段的设计需要进行考量和优化,使其能够适应低端嵌入式系统。14手写汉字识别流程141建立字库142字型匹配15样本处理过程151笔画提取屏幕汉字输入面板的区域为 192*192,我们将用 STORE15300 结构体数组保存构成当前面板中手写汉字的点集信息,横纵坐标 15 表示最多能处理一个有 15 个笔画的汉字,300 表明一个笔画最多能包括 300 个点。实验证明 300 个点对于这片区域已经足够。如比较复杂的一笔画汉字“乙”也未超出该范围。所以这样的规定是能满足书写要求的,在面板内,当触摸笔与屏幕接触到

    18、离开的过程,我们认为汉字的一个笔画的书写完成;如果用户在输入汉字的某个笔画的点的数目超过 300 系统则不认为用户的输入规范,同时提示用户再次输入一个较为规范的汉字。详细原因见开头对“乙”字的说明152预处理调整笔画顺序,汉字的书写顺序一般是自左向右、自上而下,而用户在书写时,也有可能不按照此顺序去书写。但汉字的呈现结果与正常书写顺序书写出的汉字是一样的,为了不至于因为用户习惯性笔画顺序影响特征点的提取,所以须对汉字结构体中每个笔画的顺序做判断。若不符合书写规范应则进行响应的调整。 调整,从右到左,为从左到右:如 “横”笔画,若发现一个笔画中所有点纵坐标相同,而横坐标递减,则说明该笔画为“横”

    19、而书写顺序为从右到左,此时应将该笔画的所有点逆序排列,然后存回到笔画结构体中。调整,从下至上,为 从上至下。如“竖”笔画 若发现一个笔画中所有点横坐标相同,而纵坐标递减,则说明该笔画为“竖”而书写顺序为从下至上。此时应将该笔画的所有点逆序排列,然后存回到笔画结构体中。将一定倾斜度的“横”笔画规范为标准笔画,一般用户使用鼠标书写一个“横”笔画,不可能达到与屏幕水平线持平,总是或多或少的都有一定的倾斜角度 X 2 * Y 所以上面的笔画在以后的处理中会被归为“横”笔画。如图 4 所示:第二章 联机手写识别概述手写字符识别是模式识别学科的一个传统研究领域,它将人工语言输入转换成象征意义的符号或者编码

    20、,手写识别分为两类口5l:(1)联机手写字符识别,又称在线手写识别:(2)光学字符识别OCR(Optical charactcr Recognition)或称离线 (Off-line)字符识别。联机手写字符识别通过与计算机连接的手写输入设备获取输入的字符。汉字识别的方法也主要有四种:结构模式识别,统计模式识别,统计与结构识别相结合。人工神经网络 结构模式识别需先提取笔端或基本笔画作为基元。由这些基元构成部件 再由部件组合及其相互关系来精确地对汉字加以描述,就像一篇文章有字、词、短语和句子并按语法规律所组成一样,所以这种方法也叫句法模式识别。统计模式发展教早,理论也较为成熟,其要点是提取待识别模

    21、式的一组统计特征。然后按照一定准则所确定的决策函数进行分类裁决,人工神经网络是一种模拟人脑神经元细胞的网络结构,它是由大量简单的基本元件-神经元相互连接的自适应非线形动态系统,其缺点是规模大、复杂度太大,本系统将采用结构识别方法作为设计原则联机手写识别或称为在线手写识别(online Handwriting Recognition),它给用户提供了一种自然的文字输入方式。用户利用某种输入设备直接书写文字,经过系统识别处理后,转换为文字统一表示的输入方法。在嵌入式系统上的联机泰文手写识别输入,是通过压电式触摸屏幕来实现的。21联机手写识别联机手写识别的理论和技术,在经历了三十多年的发展之后,日臻

    22、成熟,己形成了一个完整的体系。联机手写识别一般采用多阶段处理方式,主要包括预处理、特征抽取(模式表达)、特征匹配(模式匹配)等阶段,图21给出了相应的原理图。这是一个总体上的阶段划分,根据不同的识别方法,预处理、特征抽取和特征匹配阶段又可以进一步细分成各阶段。22预处理联机手写识别时,书写者用笔在图形输入板(也叫平板型数字化仪)上写字把笔相对于板的坐标位置(或是笔相对于前一点的坐标偏移值)检测出来,字笔划上各点的x,y坐标对(数字化信号)不断输入计算机,完成信号的模数转经过模数转换的数字信号不能直接用来识别,因为它含有各种干扰和噪声。对联机手写识别而占,干扰、噪声主要有人手抖动、笔的速度变化、

    23、图形板的量化噪声、感应噪声等,取出这些干扰、噪声,把单字分割出来都需要预处理。噪声消除主要采用线性平滑算子(如低通滤波器)或非线性平滑算予(如中值滤波)来处理笔划数据。另外,还有一类笔划扰动是由人的书写不稳定产生的。例如,在抬笔和落笔时,手很可能会发生抖动造成笔划弯曲或抖动,这种噪声通常只出现在一个笔划的端点附近,因此可以采取适当的方法加以消除。23归一化手写文字的规一化是识别过程中的一个重要步骤。归一化的内容包括字符尺寸、位置、倾斜方向、笔划密度和方向等。归一化方法分为线性归一化方法和非线性归一化方法两大类120l。线性归一化针对的是尺寸缩放和位置偏移两种变形,在字符识别中使用也最为普遍,其

    24、基本的方法是将去掉四边空白后的字符图像线性映射到归一化点阵中去;非线性归一化针对的是笔划密度不均匀等手写文字的形变问题,这也是手写文字识别中的关键问题。24特征提取特征选择与提取的基本任务是如何从许多特征中找出那些最有效地特征。特征选择就是从一组特征中选择出一些最有效地特征以达到降低特征空间维数的目的,特征提取就是通过映射(或变换)的方法将高维空间中的样本用低维空间表示。经过上述预处理变换可以得到一种简单象素点输入表达式,从而为特征提取打下基础。下列原则可以用来选取特征:1可区别性:对于属于不同类别的对象来说,特征值应具有明显的差异;2可靠性:对同类的对象特征值应比较接近;3独立性:所用的各特

    25、征之阃应彼此不相关;4数量少:模式识别系统的复杂度随系统的维数(特征的个数)迅速增长。模式中的特征选择和提取的目的是多重的:一是为了降低模式表达维数;二是源于工程的考虑;三是辨识出与特定分类任务不相干的或多余的测量值。手写文字的特征提取方法目前有很多种,针对不同语言手写文字的识别已经提出了很多有效的方法。在研究泰文手写字符特征提取方法时,一方面要充分借鉴其他语言文字识别领域中产生的研究结果,另一方面要充分考虑泰文文字的固有特性,寻求符合泰文文字的特征提取方法。25特征匹配方法特征匹配方法是整个系统的核心,模式识别有许多种方法,一般可以分为四类:模板匹配、统计分类、句法与结构匹配、神经网络。这些

    26、方法也可以交织在一起使用,总体结构采用多级分类识别模型。人工神经网络方法用于文字识别的研究主要包括以下几个方面:1神经刚络用于特征抽取与选择:通常直接将字符点阵信息送入网络进行学习iJ EI练,山网络抽取得到的特征不县有明湿的物理含义。2神经网络用于学习训练及分类器的设计:这是目前人工神经网络在文字识别领域的主要研究方向,也是最为成功的应用。3,神经网络用于单字识别后处理。通常,用于文字识别的人工神经网络模型有:HopField神经网络、前向多层神经网络(如反向传播BP(Backpropagation)网络,径向基函数RBF(Radial BasisFunction)网络等)、ART网络、自组

    27、织特征映射网络、认知器模型等等。目前常用的做法是将神经网络方法和传统的识别方法结合起来使用,互相取长补短,如先用传统的方法抽取较为稳定的特征,然后再用神经网络进行自组织聚类学习并设计性能良好的分类器等。神经网络可以作为单纯的分类器(不包含特征提取、选择),也可以用作功能完善的分类器。在英文字母与数字的识别等类别数目较少的分类问题中,常常将字符的图象点阵直接作为神经网络的输入。不同于传统的模式识别方法,在这种情况下,神经网络所“提取”的特征并无明显的物理含义,而是储存在神经物理中各个神经元的连接之中,省去了由人来决定特征提取的方法与实现过程。从这个意义上来说,神经网络提供了一种“字符自动识别”的

    28、可能性。此外,神经网络分类器是一种非线性的分类器,它可以提供很难想象到的复杂的类间分界面,这也为复杂分类问题的解决提供了一种可能的解决方式。在对于象泰文文字识别这样多类的分类问题,神经网络的规模会很大,结构也很复杂,现在还远未达到实用的程度。其中的原因很多,主要的原因还在于目前对人脑的工作方式以及神经网络本身的许多问题还没有找到完美的答案。26多分类器的集成为了提高系统性能采用多分类器模型,采用易计算、分类能力较弱的特征作粗分类,缩小各选集,然后再用难计算、分类能力较强的特征作细分类,粗分类、细分类都可以是多级的,它们之间并没有一个很严格的界限。总的多级分类模型如图25所示。多分类器集成的方法

    29、从体系结构上分为串行、并行与混合三种类型。所谓串行则是将前一级识别子系统的结果作为后一级识别的输入,因而各识别子系统之间是不独立的,其关系相对于并行方法要复杂得多。串行方法需要对识别器性能和相互关系有充分的认识。在训练集上统计得到识别器的相互关系,根据一组识别器的结果选择启用另一组识别器,然后以第二组识别器的结果作为选择下一级识别器的依据,直到得到满意的最终结果。其中,前级的识别器起到了粗分类的作用,而后级的识别器则应是对粗分类后的特定集合有较好的识别效果。这种结构的缺点是;前级识别器的错误不能被后级识别器纠正,所以整个系统的错误是所有参与组合的识别器的累加,而且也会相应延长分类所需的时间。P

    30、arinyaSangnansat等人曾经提出了采用HMM和SVM串行两级分类器来实现联机泰文手写识别。所谓并行是指各个识别子系统分别独立地接受原始图像并给出相应的识别结果,然后在相互独立的识别结果基础上得到最终的答案,因此整个系统的错误不是各成员分类器的简单累加,且各成员分类器可以用并行处理器来实现,能更好地满足实时性的要求。常用的并行分类器集成方法主要包括择多判决法(投票法、计分法等)、概率法、贝叶斯估计、DempsterSharer证据推理法、模糊推理法以及将分类结果作为一种新的输入特征的神经网络组合方法等等。混合方式结合了串行与并行的特点。至于如何进行混合式的组合,应当与实际的应用有关”

    31、。第三章 泰文手写识别系统设计与实现本系统设计的目标是在一个CPU为32位40 MHz主频,不带浮点协处理器的嵌入式系统上实现泰文联机手写识别,识别用户在触摸屏上书写的泰文文字。本章将介绍嵌入式系统的架构和触摸屏的基本原理,然后对识别系统进行总体设计,并对预处理和识别阶段进行详细的设计。31嵌入式系统架构对于联机泰文手写识别系统的设计要参考其所应用的嵌入式系统的架构,比如CPU的性能,RAM的大小等等,以选择适合的算法并对其进行优化,最终能取得最好的效果。311嵌入式系统总体架构嵌入式系统部分由CPU、存储体系和显示模块组成,其组成如图41所示。CPU是整个系统的核心,负责执行软件指令,控制L

    32、CD控制器,并从总线上得到数据和指令,本文所应用的CPU是TOSHIBA 32位40 MHz主频,不带浮点协处理器。LCD控制器负责控制嵌入式系统的显示部分,对在LCD上绘图和触摸屏操作提供支持。LCD即人们常说的液晶显示屏,具有耗电省、体积小等特点,被广泛应于嵌入式系统中,本文应用320240,4色狄度触摸式LCD进行手写输入,用户在触摸屏上使用点笔书写文字,书写的数据被送入辨识系统;RAM采用现代4M SDRAM。FLASH即I-J存,一般有两种:传统的NOR闪存,可以直接读取其芯片内储存的数据并可片内执行,因而速度比较快,fFI擦除速度慢并且价格较高: NAND闪存,它内部数据以块为单位

    33、进行处处,地址线和数据线共用,使用控制信号选择。本文采用TOSHIBA 32M NAND FLASH,在成块处理数据时比NORFlash速度还快,同时又可以和CPu中的NANDFlash控制器配合,泰文识别系统的模板数据存储在FLASH中。312触摸屏的基本原理嵌入式系统中手写数据的采样是通过触摸屏输入的,所以需要简单了解触摸屏的工作原理和特性,以便对输入的采样数据进行分析,并针对触摸屏的输入设计滤波算法。典型触摸屏的工作部分一般由三部分组成,如图42所示。两层透明的阻性导体层、两层导体之间的隔离层、电极。阻性导体层选用阻性材料,如铟锡氧化物(ITO)涂在衬底上构成,上层衬底用塑料,下层衬底用

    34、玻璃。隔离层为粘性绝缘液体材料,如聚脂薄膜。电极选用导电性能极好的材料(如银粉墨)构成,其导电性能大约为ITO的1000倍。触摸屏工作时,上下导体层相当于电阻网络,如图43所示。当某一层电极加上电压时,会在该网络上形成电压梯度。如有外力使得上下两层在某一点接触,则在电极未加电压的另一层可以测得接触点处的电压,从而知道接触点处的坐标。比如,在顶层的电极(X+,x一)上加上电压,则在顶层导体层上形成电压梯度,当有外力使得上下两层在某一点接触,在底层就可以测得接触点处的电压,再根据该电压与电极(x+)之间的距离关系,知道该处的x坐标。然后,将电压切换到底层电极(Y+,Y一)上,并在顶层测量接触点处的

    35、电压,从而知道Y坐标。触摸屏硬件采样频率较快,相对较慢的书写速度会造成大量的冗余数据,所以在滤波阶段要对冗余数据进行过滤。32识别系统整体设计在详细描述泰文手写识别系统的各阶段之前,首先说明系统的功能和每阶段的处理过程。本章的目标是在低端嵌入式系统上应用泰文联机手写谚别技术,并达到以下功能:1用户在触摸屏上的书写框内书写泰文文字;2识别系统得到采样数掘;3识别系统对输入的采样数据进行识别,然后输出第一候选字作为辨识结果,同时列出其余7个候选字供用户选择。33预处理设计与实现采样得到的的文字坐标数据并不直接使用,因为含有各种噪声,需要在识别系统中加入相应的去噪模块(391。触摸屏输入的手写泰文字

    36、,采样数据含有各种噪声。对系统噪声合理处理的基础,是要对它的产生和危害进行充分的分析研究。这里把“噪声”定义为:对识别系统来讲冗余或错误地数据。它包含两层意思,即数据冗余部分和错误部分。数据冗余是由触摸屏硬件采样频率和相对较慢的书写速度造成的。硬件采样频率一定且较高时,书写相对较慢,数据点就不断地传入系统,造成大量冗余数据。为提岛后续算法时空效率,必须删除或拒绝这些冗余数据点。数据的错误现象是由手写屏的感应和量化、人手抖动等噪声造成的,表现为笔迹线有时不很光滑如锯齿状等,若采用适当的空J、日J滤波算法可去除或减轻这些噪声,即所谓的笔划“平滑”。 本系统主要采用的滤波方法是使用笔划方向码和拐码滤

    37、波,下面介绍对于滤波的分析和处理方法。34分类器设计与实现分类器设计是识别系统的核心,决定最终的辨识结果。目前的泰文手写识别系统多采用单一分类方法,都是通过提取单一特征向量进行相似匹配。这些方法有各自的优点,但也不可避免地存在一定的局限性和适用条件,如要识别手写形变较大的泰文字都无法达到高识别率。为了提高识别速度,并达到高识别率的目的,本章设计了一种三级分类集成系统,将各级分类器采用的特征值有机结合,互为补充,从而能够提高识别系统的整体性能。本文所设计的三级分类器中一级粗分类器采用精确匹配的方法,以提高系统的效率和分类准确性,二级粗分类器和三级细分类器采用相似匹配法设计,可以降低系统的拒识率。

    38、一级粗分类器将模板精确匹配筛选,如果一级分类器拒识则采用另一种粗分方式,筛选出的模板送入二级分类器再进行相似匹配,最后将相似度排序,相似度最高的前8个作为候选字输出。粗分类主要任务是完成模式分类而非唯一判定。细分类是对粗分类结果集作进一步细分,给出更精确的识别结果,其分类范围为粗分类输出的结果集,不会产生新的模式类别。如果粗分类有误,那么细分类必然得到错误结果。为此,在设计模板和匹配时对特殊的情况进行额外处理,保证粗分类的精确性,对粗分可能会产生的错误进行一定的补偿。本系统的拓补结构如图413:35小结本章详细介绍了泰文手写识别系统在各阶段所采用的处理方法,包括系统所运行的嵌入式系统的架构和输

    39、入手写文字采样数据的触摸屏的原理。在预处理阶段提出了使用了八方向码与拐码相结合的噪声消除算法来平滑笔划,可以达到非常好的效果。在字符分割过程中,依据泰文文字的组字规律,对泰文笔划可能出现的位置作出了全面的估计,有效地避免了字符的误识,并且此方法由笔划位置判断字符,可以忽略手写字符的笔划顺序,对于不同笔顺输入的相同泰文字也可以有效识别。最后在识别过程中,采用了三级分类器的识别方法,一级分类器分类器精确匹配,二、三级分类器相似匹配,可以有效提高系统速度和识别精度。第四章 手写识别系统测试本系统最终运行在一个自主开发的PDA嵌入式系统上。本章将展现样本采集和识别系统的最终实现和用户界面,对实现的各个

    40、部分进行说明,并列出在嵌入式系统上运行的测试结果。41系统界面本系统分为三个部分:PDA主机端采样工具,PC端模板生成工具,PDA主机端的最终识别系统。其中PC端的模板生成工具的开发使用vC+十60,采样工具和识别系统在TOSHIBA T900的c语言编译环境下开发。样本采集工具主要负责泰文手写字符模板库的采集。该程序基于一套简化的图形用户界面(GUI),能在嵌入式系统上进行绘图和窗口操作。采集方式主要是书写者在触摸屏上规定的方框内书写泰文字符,并选择书写字符相应的码值,然后保存输出。书写笔迹的存储格式与上一章中所介绍的识别系统输入样本的格式相同,都是坐标点序列,不同的是数据前增加了该字符的U

    41、NICODE码值。样本采集工具记录的大量手写笔迹样本被存储成文件,然后汇入模板工具生成识别模板。样本采集工具界面如图中Input区域为手写输入区;Filter区域为滤波结果察看区域;右侧为泰文字符码值选择区域。码值选择区域从上到下依次为音标选择(Tone Marks)、辅音选择(Consonants)、元音选择(Volwels)、符号及数字(Signs)。b)中可以看到码值选择的菜单项,列出了全部辅音字符的选项。最终的泰文联机手写识别系统做为PDA系统的输入法,对手写输入的文字进行识别。如图下方为泰文手写识别在PDA上的输入面板。图右下方两个方框为手写输入区,左上角为输入法的关闭和切换。左侧的

    42、数字和下方的按钮是进行阿拉伯数字输入和删除等操作。数字上方两行分别为两个输入区对应的识别结果的输出,如图分别为两个输入区输入后的识别结果。最终识别出的泰文字输出到面板上方的编辑框内。42系统测试本系统使用的模板数据由独立的lO个书写者(包含两个泰国客户)书写训练样本。泰文单字符78个,每个字符的手写体变形20种【1”,平均每个字符的手写体变形平均书写3个样本,包含多笔划泰文单字符可能出现连笔的样本,总共78*20*3=4680个泰文字符样本。这些样本由书写者使用PDA主机端的样本采集工具书写,然后由PC端的样本采集工具汇入,最后对这些样本进行人工筛选,删除一些特征明显相似的样本和错误的样本,最

    43、终生成字符模板3763个。测试样本根掘泰文文字结构中的单字符和组合字符(辅音+元音,辅音+音标,辅音+元音+音标)共计2330个为一组,使用5组数据,总共2330*5=11650个测试样本。测试方法分两种:第一种是由测试人员在触摸屏上直接书写进行识别,辨识系统显示出调试信息,包含辨识速度和8个候选字,辨识速度以毫秒(ms)为单位。然后测试人员对结果记录并统计出识别率。第二种是测试人员使用样本采集工具在触摸屏上书写大量泰文手写文字,并选择出每个文字的码值,将保存的书写笔迹和对应码值存储成文件,最后汇总全部笔迹文件,在PDA端由辨识系统统一批量识别,并生成对全部数据的测试结果,包含识别速度、第一候

    44、选字识别率、第二候选字识别率、拒识率。在本系统测试时,采用两种测试方法相结合。43小结本章介绍了泰文联机手写识别系统的的各个组成部分及界面,包括采样系统、模板工具、识别系统的实现界面和功能。最后给出了识别系统的测试报告,列出本文所描述的泰文手写识别系统的最终辨识率和辫识速度。测试结果表明,本系统在CPU为32位、40MHZ主频的PDA系统上平均辨识速度达到980ms,平均辨识率达到9408,取得了比较好的结果。第五章 结束语51术语解析活动区域:数位板的绘图区域,又名工作区域,与数位板的物理尺寸不同。我们常说的4*5、6*8.就是指活动区域的大小是4英寸*5英寸、6英寸*8英寸。 纵横比:数位

    45、板或显示屏幕的垂直方向尺寸和水平方向尺寸的比例。 数位板的尺寸比例一般与显示屏相对应,以4:3为主流比例。对应宽屏比例的数位板为16:9或者16:10,尺寸多为11*7、或者11*6;9*6;6*4等等。 点击力度:为了激发单击而必须施加到笔的笔尖的力量大小。 双击间距:两次单击被作为一次双击接受时,光标可以在两个单击期间移动的最大间距(以屏幕像素作为单位)。增大双击间距可以使双击更加容易,但是在某些图形应用程序中,较大的双击间距可能会使笔刷操作产生迟疑。 双击速度:两次单击被作为一次双击接受时,两次单击期间所能间隔的最长时间。 可识别橡皮擦的应用程序内置有对橡皮擦支持的应用程序软件。这些应用

    46、程序以不同方式使用橡皮擦所带来的好处,取决于不同应用程序的实际需求。 指动轮:数位笔上的控制滚轮。 横向:数位板的一个“方向”设置。在横向放置的状态下,数位板的状态指示灯位于数位板的顶部。直角数位板将会处于水平位置。 映射:数位笔与显示器屏幕上光标位置之间的关系。 数位板上的快捷键对于Windows,快捷键包括SHIFT、ALT和CTRL。对于Macintosh,快捷键包括SHIFT、CONTROL、COMMAND和OPTION。您还可以自定义您的快捷键到任何一个键盘键或者程序。 鼠标加速度一个可以用来调整当您的数位笔在鼠标模式下的屏幕光标加速度的设置。 相对定位和绝对定位数位笔的定位方式被称

    47、为绝对定位,鼠标的定位方式被称为相对定位。在您把一个数位板配备鼠标放在数位板上的时候,您可以通过“拾起和滑动”动作移动屏幕光标,这和使用传统鼠标类似。这也被称为相对定位。 笔芯:可替换的笔尖。52工作原理数位板硬件上采用的是电磁式感应原理,在光标定位及移动过程中,完全是通过电磁感应来完成的。光标移动过程中笔不需要接触数位板就可以移动,感应高度一般为15毫米。硬件解决Linux平台wacom产品使用指南(Linux Wacom Project Chinese HOWTO)CintiQ 21UX相信是众多CG设计者梦寐以求的设计工具,在业界甚至流传这样一句话:“不认识wacom的设计师不是好设计师

    48、”。如果得知黑客帝国、泰坦尼克号等经典巨作都是使用unix-like系统来制作的,相信各位朋友会很情愿自己的wacom产品可以在Linux上使用自如。而来自sourceforge的Linux Wacom Project正是致力于开发Linux下的wacom产品驱动。如果在安装驱动时遇到任何问题,强烈推荐翻阅该HOWTO。在Linux Wacom Project里有两个驱动:wacom.o和wacom_drv.o。第一个驱动是USB内核驱动,第二个驱动是xFree86(或xorg)的wacom驱动。串口设备的用户只需要关注第二个驱动,而USB设备的用户则需要这两个驱动。如果用户使用的Linux没有官方提供的linuxwacom安装包,那么需要手动编译linuxwacom驱动。驱动的源代码可以在http:/


    注意事项

    本文(嵌入式课程设计论文.doc)为本站会员(精***)主动上传,沃文网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知沃文网(点击联系客服),我们立即给予删除!




    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服点击这里,给沃文网发消息,QQ:2622162128 - 联系我们

    版权声明:以上文章中所选用的图片及文字来源于网络以及用户投稿,由于未联系到知识产权人或未发现有关知识产权的登记,如有知识产权人并不愿意我们使用,如有侵权请立即联系:2622162128@qq.com ,我们立即下架或删除。

    Copyright© 2022-2024 www.wodocx.com ,All Rights Reserved |陕ICP备19002583号-1

    陕公网安备 61072602000132号     违法和不良信息举报:0916-4228922