基于内容的图像检索系统.doc
《基于内容的图像检索系统.doc》由会员分享,可在线阅读,更多相关《基于内容的图像检索系统.doc(59页珍藏版)》请在沃文网上搜索。
1、摘要近年来,随着多媒体技术和计算机网络的飞速发展,全世界的数字图像的容量正以惊人的的速度增长。这些数字图像中包含了大量有用的信息。然而,由于这些图像是无序地分布在世界各地,图像中包含的信息无法被有效的访问和利用。一般的文字搜索引擎对于图像数据来说,几乎束手无策,这就要求有一种能够快速而且准确的查找访问图像的技术,也就是所谓的图像检索技术。基于内容的图像检索(Content-Based Image Retrieval,CBIR)指的是查询条件本身就是一幅图像,它建立索引的方式是通过提取图像特征,然后通过计算比较这些特征和查询条件之间的距离,来决定两幅图像的相似程度。本文主要对基于内容的图像检索系
2、统进行设计,系统设计的重点在于图像的低层特征提取。本系统设计主要包括:图像低层特征(颜色、纹理等特征)的提取及描述,多特征融合技术和特征匹配技术等方面。本文首先论述了国内外基于内容的图像检索技术的研究现状、检索特点以及应用领域,然后从图像检索系统的基本原理入手,实现了图像的预处理,图像颜色特征、纹理特征的提取,以及图像库、特征库的构成,接着通过欧式距离进行相似度匹配。最后,本系统为查询接口提供一个友好的用户界面,采用MATLAB GUI(Graphical User Interface)设计实现了一个基于内容的图像检索系统,并对系统的各个模块及其功能进行了介绍。通过仿真实验,对Corel图像库
3、中的500幅图像进行了检索实验。实验结果表明,本系统计算简单、有效,能够取得较好的检索效果。关键词:图像检索; 颜色特征; 纹理特征; 相似性度量; GUI设计AbstractIn recent years, with the development of multimedia technology and the rapid development of computer network, the worldwide digital image capacity is increasing at an alarming rate. These digital image contains a
4、 lot of useful information. However, these images are randomly distributed throughout the world, the image contains information cannot be accessed and used effectively. General text search engine for the image data seems almost incapable, this requires a fast and accurate image searching technology,
5、 also known as the image retrieval technology.Content based image retrieval ( Content-Based Image Retrieval, CBIR ) itself is a pair of images, it is indexed by the image feature extraction, then determine the degree of similarity of two images through the calculation and comparison of the features
6、and the distance between the query conditions.This paper focuses on the CBIR system design,. This design is focused on low-level feature extraction.of image .The system design mainly includes: low level image features ( color, texture feature extraction and description ) extraction and description,
7、multiple features fusion and feature matching technology and so on. This paper first discusses the domestic and foreign content based image retrieval technology research status, characteristics and application field of retrieval, and then from the image retrieval system basic principle, realization
8、of image preprocessing, image color feature, texture feature extraction, and image library, characteristic database, and then through the Euclidean distance similarity matching. Finally, the system for the query interface provides a friendly user interface, using MATLAB GUI ( Graphical User Interfac
9、e ) design and implementation of a content-based image retrieval system, and of the various modules of the system and its function are introduced. Through the simulation test, the Corel image database of 500 images retrieval experiment. The experimental results show that, this system has the advanta
10、ges of simple calculation, effective, can obtain good retrieval results.Keywords:Image retrieval; Color feature; Texture feature; Similarity measurement; GUI design目 录摘要IAbstractII目 录III1 绪论11.1 选题背景及研究意义11.2 图像检索技术发展历程11.2.1 基于文本的图像检索21.2.2 基于内容的图像检索系统21.3 CBIR技术应用31.4 经典CBIR系统介绍41.5 论文结构62 图像特征分析8
11、2.1 图像颜色特征分析82.1.1 颜色空间及转换82.1.2 颜色量化102.1.3 颜色特征的提取方法112.2 图像纹理特征分析132.2.1图像纹理特征描述132.2.2纹理特征的提取方法143 特征提取算法选择193.1 颜色特征提取算法193.1.1 颜色的量化193.1.2 颜色特征的提取193.2 纹理特征提取算法203.2.1 图像预处理203.1.2 纹理特征的提取214 图像特征匹配算法224.1 相似度量定理224.2 常用的匹配算法224.3 本系统的匹配算法245 CBIR的设计与实现255.1 开发工具及系统运行环境255.1.1 开发工具255.1.2 运行环
12、境265.2 系统结构设计、系统功能265.2.1 系统的结构265.2.2系统实现的功能描述275.3 系统运行方法及设计结果275.3.1 系统运行示例275.3.2 设计运行结果315.4 性能评价335.4.1 性能评价准则335.4.2 性能分析346 总结与展望36致谢37参考文献38附录 A39附录 B5555河南理工大学毕业设计(论文)说明书1 绪论1.1 选题背景及研究意义随着多媒体技术、计算机通信技术及Internet网络的迅速发展,图像多媒体信息来源不断扩大。图像作为一种内容丰富,表现直观的多媒体信息,长期以来一直受到人们的亲睐。每天人们熟知的天气预报离不开卫星云图的帮助
13、,公安人员迅速破案需要大量的罪犯图像信息作为辅助,网上时兴的电子购物,也多半是以图像的形式向用户展现商品的。各种各样的应用需求的出现,使图像信息资源的管理和检索显得日益重要。基于内容的图像检索技术正是在这种背景下,成为近10年的研究热点之一。这项技术的主要思想是根据图像中物体(或区域)的颜色、形状、纹理,空间位置关系等特征以及这些特征的组合来查询图像。研究该项技术既有深远的意义,也将面临着巨大的挑战。随着我国社会经济的发展,使得从公共媒体到家庭娱乐、从自然科学到社会科学,每一个领域都渗透着对多媒体技术和因特网技术的应用,都要求对各种资料的智能化的管理。国内较有代表性的系统有:浙江大学计算机系研
14、究的基于图像颜色的检索系统Photo Navigator、清华大学的Internet上静态图像的基于图像内容检索的原形系统、中科院计算技术研究所数字化技术研究室开发的Image Hunter系统、南京邮电学院研制的基于纹理和颜色特征的实验系统等。这些系统的框架和查询的处理过程都很相似,只是采用的特征和搜索方法各具特色,性能也互有差异。国外著名系统如:IBM公司的QBIC系统,是IBM公司与20世纪90年代开发制作的图像和动态景象检索系统,是第一个商用基于内容的图像检索系统,它的系统结构及所采用的技术对后来的检索系统有很深远的影响。QBIC支持基于示例图像、用户构造的略图、选择颜色、纹理等的查询
15、。另外国外其他典型系统代表有:Virage公司的VIR工程系Photo book系统、哥伦比亚大学的Visual SEEK和WEB SEEK查询系统以及美国伊利诺斯大学的MARS系统等。1.2 图像检索技术发展历程随着数据库管理技术和计算机视觉的发展,图像检索技术自20世纪70年代依赖,一直成为人们研究的热门课题。从图像检索技术发展的过程来看,主要经历了两个阶段:基于文本的图像检索阶段和基于内容的图像检索阶段。1.2.1 基于文本的图像检索基于文本的图像检索技术(Text-Based Image Retrieval,TBIR)属于传统的图像检索技术,它的历史可以追溯到20世纪70年代末。它主要
16、是对图像进行人工分析,对图像的物理特征、内容特征进行文本注录或标引,建立类似于文本文献注录的索引数据库,并通过检索这些数据库获得图像编号,继而利用这些编号索引实际图像。TBIR的技术广泛应用,如google、baidu、sohu、yahoo等搜索引擎目前均采用这种方式来检索图像。但是,这种采用对图像建立关键词等文本描述信息的方式已经越来越不适应图像信息检索的要求,究其原因主要是存在以下几个局限性:(1)对图像加注文本信息是由手工完成,费时费力。(2)文本描述信息是非常主观的,不同的人对同一幅图像可能有不同的理解,这样就使得文本描述信息存在二义甚至是多义性,因此当用户在查询时输入的关键词和数据库
17、中的关键词不一致就会导致查询失败。(3)一幅图像所表达的意思是不可能用几个关键词表达清楚的。(4)不同国家不同民族很难用同一种语言对图像加注标志,而且对图像语义理解的差异很大。为了突破基于文本的图像检索技术的诸多弊端,人们转向研究将图像中所包含的内容信息来作为图像的索引。1.2.2 基于内容的图像检索系统基于内容的图像检索技术的主要思想是根据图像的一些低级视觉特征,如颜色、纹理、图像对象的形状以及它们之间的空间关系等内容特征作为图像的索引,计算基准查询图像和图像数据库中图像的相似距离,按照相似度匹配进行检索。基于内容的图像检索技术的研究涉及到人工智能、计算机视觉、信号处理、模式识别、认知心理学
18、、数据库、人机交互等诸多学科领域,具有重要的理论意义。同时,它也是理论和实践紧密结合的一项研究,其最终目的就是帮助人们更方便、更快捷和更准确地去找到锁需要的多媒体资源,因此该技术具有巨大的应用前景。基于内容的图像检索系统的主要目的还是要克服基于文本图像检索技术的局限性。基于内容的图像检索技术具有如下的特点:(1)直接从图像的内容中提取线索。正是由于这一特点,使得基于内容的图像检索技术突破了传统的基于关键词检索的局限,直接对图像本身进行分析并提取特征,使得检索能够更加接近目标。(2)提取特征的方法多种多样。从图像中可以提取的特征包括颜色、纹理、形状、目标轮廓等。(3)检索是人机交互的。一般来讲,
19、人对于目标的特征比较敏感,能够迅速分辩出目标的颜色、形状等信息,但是对于大量的对象,一方面难以记住这些特征,另一方面人工从大量数据中查找目标效率非常低,而这正是计算机的长处。因此,在基于内容的图像检索中,人和计算机相互分工配合进行检索。(4)基于内容的图像检索是一种近似匹配。在检索中,可以采取逐步求精的算法,每一层中间结果都是一个集合,不断减小集合的范围,直到定位到近似目标。这一点和传统数据库的精确匹配算法有明显的不同。CBIR的一般框架如图1-1所示。特征提取(颜色、纹理等)图像数据库建立用 户索引机制相似图像匹配机制查询接口图像特征库数据库查询图1-1 CBIR一般框架1.3 CBIR技术
20、应用CBIR技术将对大规模图像信息的管理和访问提供有力的支持。它可以应用于信息检索服务、犯罪预防、医疗诊断、新闻和广告、商标和知识产权、地理信息和远程遥感、教育培训和军事等领域,目前比较成熟的应用有指纹识别、人脸识别和图像搜索引擎等。CBIR应用非常广泛,如:(1)知识产权保护科技的飞速发展使得人们越来越关注知识产权的保护问题。许多知识产权的载体都是图像,最明显的是商标和艺术作品。商标知识产权体现在专用的文字描述和专用的图形标记两个方面。为了防止侵权,需要通过严格的商标审查程序来确认新申请的候选商标是否与己注册商标过分相似。毫无疑问,利用基于内容的图像检索技术实现商标的专用图形标记的自动审查具
21、有非常现实的意义。(2)新一代网上搜索网络正逐渐渗透到人们的日常生活中,除了文本资源外,网上还存在非常丰富的图像资源。新一代网上搜索引擎应该具有协助用户从海量而且无序的网上图像资源中寻找符合要求的图像的能力。(3)医学和遥感图像的分析和处理尽管传统的图像处理领域早就开始涉足医学和遥感图像的分析和处理的研究,但它们仍然是一个开放的研究课题,无论是民用还是军事,医学和遥感图像的分析和处理都具有非常重大的现实意义。特别当图像规模增加时,准确有效的图像分析手段以及快速的图像识别和检索技术将凸现其重要性。(4)犯罪与安全预防当将图像的内容限制在特定领域时,基于内容的图像检索技术将找到更为具体的应用。例如
22、,安全部门可以将人的主要特征(如指纹和脸部)的图像存储在数据库中,通过指纹识别和人脸识别就有可能从大量的指纹库或者人脸库中自动识别出特定的目标。毫无疑问,这具有重大的社会价值。除此以外,基于内容的图像检索技术还可以应用到设计(时装、装演和结构)、远程教育以及个人相册管理等方面。综上所述,基于内容的图像检索技术涉及多个研究领域,有着广泛的应用前景。1.4 经典CBIR系统介绍迄今为止,已经有许多比较成功的基于内容的图像检索系统问世。这些系统在一定范围内都得到比较理想的效果,下面对图像检索系统方面的研究成果进行介绍。(1)QBIC:国际商用机器公司IBM公司的QBIC(Query by Image
23、 Content)系统是第一个商用的基于内容的图像检索系统。QBIC的系统结构由图像入库、特征计算和查询阶段三部分构成。QBIC支持在大型图像数据库中基于视觉特征的检索,这些特征包括颜色百分比、颜色分布、纹理特征等。在检索时,用户可以使用例子图像、用户草图、所选颜色、纹理模式等方式进行查询。QBIC使用的颜色特征有平均(R,G,B)、(Y,I,Q)、(L,A,B)和MTM(Mathematical Transform to Mussel)坐标,及元颜色直方图,对于黑白商标还提供了分形检索方法。纹理特征用的是Tamura纹理描述的改进版本,也就是粗糙度,对比度和方向性的结合。形状特征则采用形状的
24、面积、圆形度、离心率、主轴方向以及一组变换无关矩等描述方法。QBIC的索引子系统中,对于维数比较高的特征,如形状特征,采用KLT(Karhunen Loeve transform)变换或将主分量变换降维至2到3维,然后用树组织多维索引结构。在检索时,为了提高匹配效率,在执行真正的匹配算法前将先通过快速滤波器(fast filter)来产生最优的一些分量来参与后续比较慢的匹配算法。在它的新系统中,结合了基于文本的关键词检索和基于内容的相似性检索。QBIC结合了多种查询方式,如标准的系统查询方式、选择特征查询和草图查询等,界面比较友好,其系统构架对后来的图像检索系统有深远影响。(2)Virage系
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 内容 图像 检索系统