基于机器学习的通用型无参考图像质量评价方法研究.doc
《基于机器学习的通用型无参考图像质量评价方法研究.doc》由会员分享,可在线阅读,更多相关《基于机器学习的通用型无参考图像质量评价方法研究.doc(66页珍藏版)》请在沃文网上搜索。
1、中 图 分 类 号 : TP391.4论 文 编 号 : 10006SY 0915102硕士学位论文基于机器学习的通用型无参考图像质量评价方法研究作 者 姓 名封刃学 科 专 业控 制 科 学 与 工 程指 导 教 师张弘教 授培 养 院 系宇 航 学 院The R esearch of No-reference Image Quality Assessment On Gener a l Use Based on M achine L ear ningA Dissertation Submitted for the Degree of MasterC andidate: FENG R enSu
2、per visor : Prof. ZHANG HongSchool of AstronauticsBeihang University, Beijing, China中 图 分 类 号 : TP391.4论 文 编 号 : 10006SY 0915102硕士学位论文基于机器学习的通用型 无参考图像质量评价方法研究作者姓名封 刃申请学位级别工学硕士指导教师姓名张 弘职称教授学科专业控制科学与工程研究方向模式识别与智能系统 学习时间自2011 年 9 月 12 日起至2013 年 12 月 30 日止论文提交日期2013 年 11 月 25 日论文答辩日期 2013 年 12 月 12 日 学位
3、授予单位北京航空航天大学学位授予日期年月日关于学位论文的独创性声明本人郑重声明:所呈交的论文是本人在指导教师指导下独立进行研究工作所取得 的成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致 谢外,本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得 北京航空航天大学或其它教育机构的学位或学历证书而使用过的材料。与我一同工作 的同志对研究所做的任何贡献均已在论文中作出了明确的说明。若有不实之处,本人愿意承担相关法律责任。学位论文作者签名: 日期:年月日学位论文使用授权书本人完全同意北京航空航天大学有权使用本学位论文(包括但不限于其印刷版和 电子版),使用方
4、式包括但不限于:保留学位论文,按规定向国家有关部门(机构) 送交学位论文,以学术交流为目的赠送和交换学位论文,允许学位论文被查阅、借阅 和复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、缩印或 其他复制手段保存学位论文。保密学位论文在解密后的使用授权同上。学 位 论 文 作 者 签 名 : 日 期 :年月日指 导 教 师 签 名 : 日 期 :年月日摘 要数字图像、视频日益成为人们日常生活中离不开的媒体信息。在数字图像的获取、 处理、编码、存储、传输和重建的每一个步骤中,通常都会对图像的质量产生影响。因 此,图像质量评价算法的研究既有重要的理论意义,同时具有广泛的应用背景,已
5、经成 为图像处理领域重要的基础研究课题之一。图像质量的客观评价算法根据是否需要参考 图像的信息分为三类:全参考、半参考和无参考评价方法。其中无参考评价方法又可分 为针对特定失真类型和应用场合的专用型方法和对任何失真及场合均有效的通用性方 法。在很多实际应用中,不仅无法获得原始图像作为参考源,常常也没有图像失真类型 等先验知识。因此,本文致力于不需要先验知识和参考图像的通用型无参考图像质量评 价方法研究。由于目前人类对自身视觉机理认识的局限性,现在还难以建立详细描述视觉评价机 制的模型。然而利用机器学习的方法可以忽略内部评价机理简化模型,获得与人眼评价 结果较高的一致性。本文重点研究了用于图像客
6、观质量评价的局部特征提取及融合方法, 提出了一种用于通用型无参考图像质量评价的学习框架。框架中采用了基于图像显著性 的特征提取方法和基于视觉词袋模型的编码计算方法,获得了更加符合人眼视觉特性的 全局特征。最后以该全局特征向量作为输入构建了机器学习框架,以主观评价分值作为 训练目标进行回归学习,用对图像主观评价分值进行预测的方式实现了无参考图像质量 的客观评价。实验结果表明,本文提出的方法对各种失真类型,包括混合失真类型的图像,与主 观质量评价结果保持了良好的一致性,而且具有极快的运算速度。 关键字:无参考图像质量评价,机器学习,特征提取,显著性iAbstr actDigital images
7、and videos are becoming inseparable medial information of peoples daily life. In most cases, every step of image acquisition, processing, coding, storing, transmission and restoring can affect the quality of image. Therefore, the research on image quality assessment(IQA) method has become one of the
8、 most important basic research topics in the field of image processing. Based on whether the reference image information is needed, objective image quality assessment methods can be classified into three categories: full-reference, semi-reference and no-reference, among which the no-reference method
9、 can be subdivided into dedicated methods for specific distortion types and occasions, as well as general methods for any distortion types and occasions. In most practical applications, the original image is usually not available for reference, and the prior knowledge on image distortion type is usu
10、ally lacking. Therefore, the present study focuses on the general NR-IQA method that need neither the prior knowledge nor the reference image.Since the current understanding in Human Vision System(HVS) is limited, establishing a model that can describe the visual assessment mechanism in details is c
11、hallenging. However, with machine learning, we can skip the simplified internal assessment mechanism model, and achieve an assessment result that is highly consistent with that of the human eyes. Focusing on the methods used in objective image quality assessment to extracting and fusing the local fe
12、atures, the current article proposes a learning framework for general no-reference image quality assessment. In this framework, we extracted features based on image salience and computed the code based on the bag of visual words, resulting in a global feature that is more consistent with human eyesv
13、isual characteristics. By input this global feature as a vector to establish a machine-learning framework, we used objective scores as targets for regression learning, and achieved a subjective no-reference image quality assessment by predicting the objective assessment scores of the image.Experimen
14、tal results show that our method provides consistent and reliable performance in quality estimation.Keywor ds: no-reference image quality assessment, machine learning, feature extraction, saliency目录第一章绪论11.1 研究背景与意义11.2 国内外研究进展与现状21.2.1 无参考图像质量评价方法的研究现状21.2.2 基于机器学习图像质量评价方法的研究现状31.3 论文内容与结构安排41.3.1
15、研究目标41.3.2 论文工作的主要内容51.3.3 论文的结构安排5第二章图像质量评价方法72.1 主观质量评价72.1.1 常用方法72.1.2 评分标准82.1.3 评价数据处理82.1.4 主观评价的缺点92.2 客观质量评价92.2.1 全参考型图像质量评价方法102.2.2 部分参考型图像质量评价方法112.2.3 无参考型图像质量评价方法122.3 基于机器学习的图像质量评价方法132.3.1 预处理与局部特征提取142.3.2 特征计算与融合142.3.3 回归学习与预测172.4 本章小结17第三章通用型无参考图像质量评价学习框架183.1 基于显著性的局部特征提取183.1
16、.1 视觉显著性概述183.1.2 图像显著性对质量综合评价的意义193.1.3 图像显著性检测方法213.1.4 局部特征提取方法3iii3.2 基于视觉词袋模型的特征计算与融合243.2.1 视觉词袋模型概述243.2.2 视觉字典的构建253.2.3 特征计算与融合273.3 基于 SVM 的回归学习与预测283.3.1 基于 SVM 的回归模型283.3.2 SVM 训练模块的设计293.4 本章小结30第四章算法评估与综合实验结果314.1 算法评价指标314.1.1 Pearson 线性相关系数(LCC)314.1.2 Spearman 等级相关系数(SROCC)324.2 特征提
17、取实验结果334.2.1 局部特征提取结果334.2.2 视觉字典构建354.3 算法参数讨论364.3.1 视觉字典的大小364.3.2 SVM 参数确定374.4 图像质量评价实验结果374.4.1 与主观评价一致性384.4.2 与其他评价算法的比较384.4.3 算法的计算效率414.4 本章小结42第五章 总结和展望435.1 总结435.2 展望44参考文献45攻读硕士学位期间取得的学术成果51致谢52图目录图 1 应用于图像处理的机器学习框架流程图13图 2 图像质量评价系统两阶段框架14图 3 通用型无参考图像质量评价学习框架18图 4 图像显著性对全局质量评价的影响20图 5
18、 区域失真对视觉评价的影响20图 6 K-means 聚类算法的基本步骤25图 7 视觉字典构建流程图26图 8 视觉字典中随机抽取部分单词示例27图 9 基于 SVM 的回归与预测模型29图 10 质量模型预测的准确性32图 11 质量模型预测的单调性33图 12 图像局部特征提取结果34图 13 不同失真类型局部特征提取结果34图 14 单类型失真图像 K-means 聚类结果35图 15 视觉字典单词数对评价效果的影响36图 16 (a )径向基函数参数选择流程图 (b)平均偏差曲线图37图 17 图像质量评价预测结果分布图38v表目录表 1 DSIS 的 5 分制失真测度8表 2 经过
19、迭代计算的 Pear son 相关系数(LIVE 数据库)39表 3 经过迭代计算的 Spear man 相关系数(L IVE 数据库)39表 4 不同区域失真图像评价结果对比40表 5 特征提取时间消耗(100 幅图像)41北京航空航天大学硕士学位论文第一章绪论1 .1 研 究 背 景 与 意 义随着个人计算机,数字通讯,多媒体和网络技术的迅猛发展,人们所接触的信息量, 比如声音、文字、图像等,远大于其它任何时代,其中视觉信息占所有感知信息的 80%。 图像是人们获取视觉信息的重要载体,它更为直观和高效。随着生活质量的提高,人们 对图片的质量要求也越来越高。在数字图像的获取、编码、加密(数字
20、水印)、存储、传 输、重构、显示以及各种处理(如增强,融合)等的过程中,受到不同种类的降质,都会 产生失真。一幅图像的质量如何,是否提供了我们所希望得到的信息或者是否满足我们 的视觉需求就成了亟待回答的问题。因此:图像质量评价的研究至少应解决以下两个方面的问题: (1)用于评判图像质量和进行图像质量估计的算法优劣的标准。针对某一算法,可以根据结果的质量评价来改进算法的步骤选择、参数设置等; (2)用于对图像传输或显示系统进行检测和参数调整。可以对监视控制系统的视频或者图像进行质量计算,根据计算出的图像质量评估系统的工作状态,自动调整系统参数 到最佳性能状态,或者从庞大的监控系统中将质量极差的图
21、像检测出并给出报警以便人 工及时修复。当前图像质量评价主要分为主观评价和客观评价两大类。主观评价方法是根据观测 者对图像质量进行主观打分评价,而客观评价方法则是采用算法对图像质量进行自动评 价。在实际应用中,我们希望图像质量评价算法是自动的、实时的、在某些应用中甚至 希望是可嵌入的。要达到这些要求,就需要研究符合要求的、不需要人工干预的客观评 价算法。根据是否需要参考图像的先验信息,客观质量评价又可分为以下三种类型:1)全参 考方法(Full Reference,FR);2)半参考方法(Reduced Reference,RR);3)无参考方法(No Reference,NR)。前两者都需要原
22、始无失真图像的全部或部分参考信息来进行评价,无 参考图像质量评价方法 NR-IQA(No Reference Image Quality Assessment)则不需要任何参 考图象信息,又被称为盲评价。作为当前互联网技术热点之一,视频监控系统和网络视 频应用需要对采集到的图像进行质量评价从而进行系统参数的更新、图像效果的美化以 及系统运行效率的提升等。这一类实时应用对数据率要求极为苛刻,而且很多时候无法9获得原始图像信息,因此,无参考质量评价方法对于实时的与图像处理相关的互联网应 用系统有着重要意义,在实际生产应用中有更广泛的适用性,因而成为了当今研究的热 点。现有的关于无参考图像质量评价方
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 机器 学习 通用型 参考 图像 质量 评价 方法 研究
