1、中 图 分 类 号 : TP391.4论 文 编 号 : 10006SY 0915102硕士学位论文基于机器学习的通用型无参考图像质量评价方法研究作 者 姓 名封刃学 科 专 业控 制 科 学 与 工 程指 导 教 师张弘教 授培 养 院 系宇 航 学 院The R esearch of No-reference Image Quality Assessment On Gener a l Use Based on M achine L ear ningA Dissertation Submitted for the Degree of MasterC andidate: FENG R enSu
2、per visor : Prof. ZHANG HongSchool of AstronauticsBeihang University, Beijing, China中 图 分 类 号 : TP391.4论 文 编 号 : 10006SY 0915102硕士学位论文基于机器学习的通用型 无参考图像质量评价方法研究作者姓名封 刃申请学位级别工学硕士指导教师姓名张 弘职称教授学科专业控制科学与工程研究方向模式识别与智能系统 学习时间自2011 年 9 月 12 日起至2013 年 12 月 30 日止论文提交日期2013 年 11 月 25 日论文答辩日期 2013 年 12 月 12 日 学位
3、授予单位北京航空航天大学学位授予日期年月日关于学位论文的独创性声明本人郑重声明:所呈交的论文是本人在指导教师指导下独立进行研究工作所取得 的成果,论文中有关资料和数据是实事求是的。尽我所知,除文中已经加以标注和致 谢外,本论文不包含其他人已经发表或撰写的研究成果,也不包含本人或他人为获得 北京航空航天大学或其它教育机构的学位或学历证书而使用过的材料。与我一同工作 的同志对研究所做的任何贡献均已在论文中作出了明确的说明。若有不实之处,本人愿意承担相关法律责任。学位论文作者签名: 日期:年月日学位论文使用授权书本人完全同意北京航空航天大学有权使用本学位论文(包括但不限于其印刷版和 电子版),使用方
4、式包括但不限于:保留学位论文,按规定向国家有关部门(机构) 送交学位论文,以学术交流为目的赠送和交换学位论文,允许学位论文被查阅、借阅 和复印,将学位论文的全部或部分内容编入有关数据库进行检索,采用影印、缩印或 其他复制手段保存学位论文。保密学位论文在解密后的使用授权同上。学 位 论 文 作 者 签 名 : 日 期 :年月日指 导 教 师 签 名 : 日 期 :年月日摘 要数字图像、视频日益成为人们日常生活中离不开的媒体信息。在数字图像的获取、 处理、编码、存储、传输和重建的每一个步骤中,通常都会对图像的质量产生影响。因 此,图像质量评价算法的研究既有重要的理论意义,同时具有广泛的应用背景,已
5、经成 为图像处理领域重要的基础研究课题之一。图像质量的客观评价算法根据是否需要参考 图像的信息分为三类:全参考、半参考和无参考评价方法。其中无参考评价方法又可分 为针对特定失真类型和应用场合的专用型方法和对任何失真及场合均有效的通用性方 法。在很多实际应用中,不仅无法获得原始图像作为参考源,常常也没有图像失真类型 等先验知识。因此,本文致力于不需要先验知识和参考图像的通用型无参考图像质量评 价方法研究。由于目前人类对自身视觉机理认识的局限性,现在还难以建立详细描述视觉评价机 制的模型。然而利用机器学习的方法可以忽略内部评价机理简化模型,获得与人眼评价 结果较高的一致性。本文重点研究了用于图像客
6、观质量评价的局部特征提取及融合方法, 提出了一种用于通用型无参考图像质量评价的学习框架。框架中采用了基于图像显著性 的特征提取方法和基于视觉词袋模型的编码计算方法,获得了更加符合人眼视觉特性的 全局特征。最后以该全局特征向量作为输入构建了机器学习框架,以主观评价分值作为 训练目标进行回归学习,用对图像主观评价分值进行预测的方式实现了无参考图像质量 的客观评价。实验结果表明,本文提出的方法对各种失真类型,包括混合失真类型的图像,与主 观质量评价结果保持了良好的一致性,而且具有极快的运算速度。 关键字:无参考图像质量评价,机器学习,特征提取,显著性iAbstr actDigital images
7、and videos are becoming inseparable medial information of peoples daily life. In most cases, every step of image acquisition, processing, coding, storing, transmission and restoring can affect the quality of image. Therefore, the research on image quality assessment(IQA) method has become one of the
8、 most important basic research topics in the field of image processing. Based on whether the reference image information is needed, objective image quality assessment methods can be classified into three categories: full-reference, semi-reference and no-reference, among which the no-reference method
9、 can be subdivided into dedicated methods for specific distortion types and occasions, as well as general methods for any distortion types and occasions. In most practical applications, the original image is usually not available for reference, and the prior knowledge on image distortion type is usu
10、ally lacking. Therefore, the present study focuses on the general NR-IQA method that need neither the prior knowledge nor the reference image.Since the current understanding in Human Vision System(HVS) is limited, establishing a model that can describe the visual assessment mechanism in details is c
11、hallenging. However, with machine learning, we can skip the simplified internal assessment mechanism model, and achieve an assessment result that is highly consistent with that of the human eyes. Focusing on the methods used in objective image quality assessment to extracting and fusing the local fe
12、atures, the current article proposes a learning framework for general no-reference image quality assessment. In this framework, we extracted features based on image salience and computed the code based on the bag of visual words, resulting in a global feature that is more consistent with human eyesv
13、isual characteristics. By input this global feature as a vector to establish a machine-learning framework, we used objective scores as targets for regression learning, and achieved a subjective no-reference image quality assessment by predicting the objective assessment scores of the image.Experimen
14、tal results show that our method provides consistent and reliable performance in quality estimation.Keywor ds: no-reference image quality assessment, machine learning, feature extraction, saliency目录第一章绪论11.1 研究背景与意义11.2 国内外研究进展与现状21.2.1 无参考图像质量评价方法的研究现状21.2.2 基于机器学习图像质量评价方法的研究现状31.3 论文内容与结构安排41.3.1
15、研究目标41.3.2 论文工作的主要内容51.3.3 论文的结构安排5第二章图像质量评价方法72.1 主观质量评价72.1.1 常用方法72.1.2 评分标准82.1.3 评价数据处理82.1.4 主观评价的缺点92.2 客观质量评价92.2.1 全参考型图像质量评价方法102.2.2 部分参考型图像质量评价方法112.2.3 无参考型图像质量评价方法122.3 基于机器学习的图像质量评价方法132.3.1 预处理与局部特征提取142.3.2 特征计算与融合142.3.3 回归学习与预测172.4 本章小结17第三章通用型无参考图像质量评价学习框架183.1 基于显著性的局部特征提取183.1
16、.1 视觉显著性概述183.1.2 图像显著性对质量综合评价的意义193.1.3 图像显著性检测方法213.1.4 局部特征提取方法3iii3.2 基于视觉词袋模型的特征计算与融合243.2.1 视觉词袋模型概述243.2.2 视觉字典的构建253.2.3 特征计算与融合273.3 基于 SVM 的回归学习与预测283.3.1 基于 SVM 的回归模型283.3.2 SVM 训练模块的设计293.4 本章小结30第四章算法评估与综合实验结果314.1 算法评价指标314.1.1 Pearson 线性相关系数(LCC)314.1.2 Spearman 等级相关系数(SROCC)324.2 特征提
17、取实验结果334.2.1 局部特征提取结果334.2.2 视觉字典构建354.3 算法参数讨论364.3.1 视觉字典的大小364.3.2 SVM 参数确定374.4 图像质量评价实验结果374.4.1 与主观评价一致性384.4.2 与其他评价算法的比较384.4.3 算法的计算效率414.4 本章小结42第五章 总结和展望435.1 总结435.2 展望44参考文献45攻读硕士学位期间取得的学术成果51致谢52图目录图 1 应用于图像处理的机器学习框架流程图13图 2 图像质量评价系统两阶段框架14图 3 通用型无参考图像质量评价学习框架18图 4 图像显著性对全局质量评价的影响20图 5
18、 区域失真对视觉评价的影响20图 6 K-means 聚类算法的基本步骤25图 7 视觉字典构建流程图26图 8 视觉字典中随机抽取部分单词示例27图 9 基于 SVM 的回归与预测模型29图 10 质量模型预测的准确性32图 11 质量模型预测的单调性33图 12 图像局部特征提取结果34图 13 不同失真类型局部特征提取结果34图 14 单类型失真图像 K-means 聚类结果35图 15 视觉字典单词数对评价效果的影响36图 16 (a )径向基函数参数选择流程图 (b)平均偏差曲线图37图 17 图像质量评价预测结果分布图38v表目录表 1 DSIS 的 5 分制失真测度8表 2 经过
19、迭代计算的 Pear son 相关系数(LIVE 数据库)39表 3 经过迭代计算的 Spear man 相关系数(L IVE 数据库)39表 4 不同区域失真图像评价结果对比40表 5 特征提取时间消耗(100 幅图像)41北京航空航天大学硕士学位论文第一章绪论1 .1 研 究 背 景 与 意 义随着个人计算机,数字通讯,多媒体和网络技术的迅猛发展,人们所接触的信息量, 比如声音、文字、图像等,远大于其它任何时代,其中视觉信息占所有感知信息的 80%。 图像是人们获取视觉信息的重要载体,它更为直观和高效。随着生活质量的提高,人们 对图片的质量要求也越来越高。在数字图像的获取、编码、加密(数字
20、水印)、存储、传 输、重构、显示以及各种处理(如增强,融合)等的过程中,受到不同种类的降质,都会 产生失真。一幅图像的质量如何,是否提供了我们所希望得到的信息或者是否满足我们 的视觉需求就成了亟待回答的问题。因此:图像质量评价的研究至少应解决以下两个方面的问题: (1)用于评判图像质量和进行图像质量估计的算法优劣的标准。针对某一算法,可以根据结果的质量评价来改进算法的步骤选择、参数设置等; (2)用于对图像传输或显示系统进行检测和参数调整。可以对监视控制系统的视频或者图像进行质量计算,根据计算出的图像质量评估系统的工作状态,自动调整系统参数 到最佳性能状态,或者从庞大的监控系统中将质量极差的图
21、像检测出并给出报警以便人 工及时修复。当前图像质量评价主要分为主观评价和客观评价两大类。主观评价方法是根据观测 者对图像质量进行主观打分评价,而客观评价方法则是采用算法对图像质量进行自动评 价。在实际应用中,我们希望图像质量评价算法是自动的、实时的、在某些应用中甚至 希望是可嵌入的。要达到这些要求,就需要研究符合要求的、不需要人工干预的客观评 价算法。根据是否需要参考图像的先验信息,客观质量评价又可分为以下三种类型:1)全参 考方法(Full Reference,FR);2)半参考方法(Reduced Reference,RR);3)无参考方法(No Reference,NR)。前两者都需要原
22、始无失真图像的全部或部分参考信息来进行评价,无 参考图像质量评价方法 NR-IQA(No Reference Image Quality Assessment)则不需要任何参 考图象信息,又被称为盲评价。作为当前互联网技术热点之一,视频监控系统和网络视 频应用需要对采集到的图像进行质量评价从而进行系统参数的更新、图像效果的美化以 及系统运行效率的提升等。这一类实时应用对数据率要求极为苛刻,而且很多时候无法9获得原始图像信息,因此,无参考质量评价方法对于实时的与图像处理相关的互联网应 用系统有着重要意义,在实际生产应用中有更广泛的适用性,因而成为了当今研究的热 点。现有的关于无参考图像质量评价方
23、法的优秀研究工作极为有限,评价效果较全参考 型方法而言也有待改进提高,而且大多是针对某一类型失真或特定应用进行设计的“专 用型”方法,这类方法需要事先知道图像的失真类型,推广和应用受到了限制。当前, 对于多种失真都有效的“通用型”方法极少,而且评价效果与主观评价结果之间的一致 性较差,无法满足生产或研究的需要,因此也成为了研究的主要方向。1 .2 国 内 外 研 究 进 展 与 现 状1.2.1 无参考图像质量评价方法的研究现状 无参考图像质量评价在很多图像处理场合发挥着重要作用。一方面,在相当一部分图像处理系统中提取原始图像的信息是很困难的,甚至是不可能的,如视频采集装置等;另一方面,无参考
24、图像质量评价可以通过评价结果掌握实时图像处理系统的运行状况。 NR-IQA 虽然有其特有的优点,但是在不依靠任何原始图像信息的情况下进行图像质量 评价是具有相当难度的,原因如下:( 1)图像理解水平仍然比较低,要做到图像内容的复杂程度与图像质量好坏无关, 利用图像的统计信息获取相应的模型和知识表示是一个关键,做到这一点十分困难。( 2) 在无参考图像质量评价过程中,相当一部于非量化因素会使评价难度大大提 高,比如人的思想观念、喜好品味、所处环境等人为因素都是与特定的观察者相关联的。 这些因素很难用计算机语言规范或描述,因而无法保证无参考型的评价结果与人眼视觉 感受相一致。虽然无参考图像质量评价
25、方法的设计方法难度很大,但是随着研究人员的不懈努力 和算法性能的不断提升,研究成果越来越多。根据失真类型进行无参考图像质量评价是 开战研究工作比较多的一类无参考型评价方法。图像具有空域特征,如块效应、平均亮 度等信息,通过分析失真图像特点,提取失真特征,然后以这些特征为基础来对图像质 量进行评价是非常有效的方法。近几年,随着机器学习理论的成熟,针对机器学习或者 两种思路结合的无参考质量评价算法逐渐盛行。这类算法的特点是可以在脱离原始信息 的情况下对图像质量进行评价。图像质量评价方法的未来研究将呈现出以下两方面的趋势:(1) 无参考的图像质量评价算法的研究代表未来图像质量评价发展的方向; 尽管当
26、前该算法的研究还处于起步阶段,但是它不需要原始理想图像作为参考,这对无法获取原始理想图像的场合,比如成像系统和视频监控系统等具有重要的实用价值。 (2) 有效地融入人视觉系统特征是无参考图像质量评价研究发展的必然趋势; 图像质量评价的目的就是设计出与人的主观评价值相一致的算法的评价值。无参考图像质量评价方法由于没有原始图像作为参考,只能够从图像的本质特征出发来进行评 价,同时又要最大限度的避开图像内容的影响。符合人眼视觉习惯是这些图像本质特征 中最重要的方面,并且已有研究工作证实将人眼视觉系统特征融入评价算法可以显著的 改善图像质量的评价效果 1 。现在的许多图像质量评价算法都在不同程度上融合
27、了人类 视觉系统特征:有的是从图像中提取出人眼感兴趣的图像边缘和颜色等图像的结构信息 2 , 3 ,有的干脆把人类视觉特性作为一个“黑箱”,以主观评价值为目标,采用智能学习算法从样本图像中提取出这些特征,将这些特征直接作为评价图像质量的依据 4 。 综上所述,融入人眼视觉系统特征的无参考图像质量评价方法的研究将是未来该领域研究的热点。同时,由于人眼视觉系统特征的复杂性,可以采用智能学习算法领域的 先进成果,帮助“学习”这些抽象的复杂特征。所以结合学习算法来提高评价效果,是 未来提高无参考图像质量评价性能的有效手段之一。1.2.2 基于机器学习图像质量评价方法的研究现状 基于机器学习的图像质量评
28、价方法是通过提取图像信息的特征结合机器学习模型评价图像的质量。随着机器学习方法在各个领域的广泛应用,许多学者开始将图像质量评价方法与机器学习框架进行结合。这类算法异于其他无参考图像质量评价方法,不需 要把失真程度作为衡量质量的标准,也不需要定义特征量来表示失真的程度,而是将学 习到的特征直接作为机器学习模型的输入,以主观评价分值作为目标进行学习训练,从 而得到质量评价模型。机器学习的模型主要有神经网络模型和支持向量机(SVM)模型。 文献 5 采用循环逆向传播(CBP)神经网络模型进行特征提取和图像质量评价; TongHangHang等在文献 6 中通过 MMD 提取特征向量,在估计类条件概率
29、密度函数时 使用了MDH(Multi Dimensional Histogram)方法,接着使用了贝叶斯(Bay es)分类器对图像 质量进行评价。这类算法的优点在于其运用了机器学习领域内的最新研究成果,相对于 传统图像质量评价方法,算法性能得到提升。但由于目前算法所提取的图像特征不能恰如其分反映图像的主观感受质量情况,在性能上有待进一步优化。 通过分析不难发现,基于机器学习的图像质量评价方法的关键在于找到适合的图像质量特征向量作为学习机的输入进行训练和预测。所谓“适合”的特征应需要满足两个 条件:(1) 选取特征值与图像失真程度需要具有良好的线性关系,能够反映人眼视觉系统 对于图像质量的评价
30、测度。归根到底,机器学习不断优化的本质就是寻找和训练特征输 入,特征输入与目标的线性关系越好,学习预测的结果越准确。有些图像评价指标有天 然对应的线性特征值,例如我们用灰度值度量亮度,用色相值区分颜色等,然而对于图 像质量的评价,或者说图像的受损程度,我们并没有一个直接的特征可以用于准确表述 它,必须对图像失真模型和人眼视觉系统进行分析研究,通过提取计算的方法获得可以 表征图像受损程度的特征向量。(2) 针对通用型无参考图像质量评价的情况,还需要满足不同类型的失真所对应的 特征量偏移程度反应到输出结果上也有相同或相似的变化幅值。否则,就会造成分类器 对不同类型失真的“敏感”程度不同,即使对单一
31、失真的线性相关度好,但是不同类型 之间的评价结果差异却可能很大,对于同等程度的不同类型失真产生截然不同的预测结 果,与实际应用需求不符。由此可见,利用机器学习进行图像质量评价可以忽略人类视觉系统内部机制,简化 模型,并且取得较好的效果,因此已经成为了研究热点,如何找到适合的特征向量是解 决该问题的重点和难点。此外,训练学习需要大量的样本以及时间,视频质量评价的实 时性限制了在线学习方法的使用,如何简化学习过程,采用无监督离线学习的方法取得 较好的训练结果也是主要的研究方向。1 .3 论 文 内 容 与 结 构 安 排1.3.1 研究目标本文针对不区别失真类型的通用型无参考灰度图像质量评价问题,
32、提出了一种基于 机器学习的训练框架。除了提高评价准确性和计算效率,使其更符合实际应用的需求, 本文还力求解决无参考质量评价方法的通用性问题,使之可以在不需要失真类型等先验 知识的条件下,对不同类型失真包括混合类型失真都能取得与较好的评价一致性。此外, 研究更加适合的特征融合方法,解决图像局部失真程度不同造成全局评价结果不准确的问题。1.3.2 论文工作的主要内容 论文工作的内容分为基于图像显著性的原始图像特征提取方法,基于视觉词袋模型的图像特征计算方法,以及通用型无参考图像质量评价学习框架的搭建三个大部分。(1)基于图像显著性的原始图像特征提取方法。首先介绍了人眼视觉显著性原理,分 析了图像显
33、著性分析对于客观质量综合评价的意义。接着介绍了图像显著度理论以及图 像显著度图谱的计算方法,综合分析了各类图像显著性检测方法的优缺点,选择最适合 图像质量评价应用的检测方法。最后提出了基于图像显著度的图像特征提取方法。给出 实验结果,从实验结果可以看出该方法选择提取的区域特征符合人眼视觉注意特性。(2)基于视觉词袋模型的图像特征计算方法。阐述了视觉词袋模型理论的提出以及应 用与图像质量评价方法的优缺点,介绍了应用于本文方法的视觉词汇本的构建方法。然 后提出了基于词袋模型的图像特征编码计算方法和利用已有局部特征的显著度为加权 信息的特征融合方法,由此可以获得关于输入图像失真程度的归一化特征向量。
34、(3)通用型无参考图像质量评价学习框架。通过前两部分介绍方法提取计算获得了输 入图像的用于质量评价的特征向量,将该向量作为分类器的输入,以此提出了基于 SVM 线性回归分类器的完整机器学习框架。给出了实验结果,根据实验结果从评价一致性和 计算复杂度等方面综合分析比较该方法的评价效果。最终分析证明对于各种类型失真图 像,包括混合失真类型的图像,本文方法都能够获得与主观评价结果很好的一致性,符 合人类主观视觉感受结果。1.3.3 论文的结构安排 本论文供分为五个章节,各章的大致内容安排如下:第一章 绪论。主要介绍图像质量评价的应用背景和意义,国内外研究现状和发展趋势,说明了本研究的实际应用价值,阐
35、述了本文的研究目标,概述了论文的工作内容 和结构安排。第二章 图像质量评价方法综述。从参考源可用性角度分类介绍图像质量主、客观 评价技术的发展与近况,按照对参考图像的依赖介绍了全参考、部分参考以及无参考三 种客观评价方法,其中重点介绍了无参考质量评价技术的研究现状和技术难点。最后介 绍了采用机器学习方法进行图象处理应用的一般流程步骤。第三章 通用型无参考图像质量评价学习框架。根据机器学习的框架结构,从局部特征提取,特征计算与融合,回归学习与预测三个阶段分别详细介绍了本文所设计的方 法。第四章 算法评估与综合实验结果。对本文所设计方法的进行了实验,通过详细的 实验过程和丰富的实验数据对本文方法做
36、了对比分析,综合得出了算法的有效性。第五章 总结与展望。对全文工作内容进行总结,概括了本文模型的成果与不足, 为今后的进一步研究提出指导建议。第二章图像质量评价方法图像质量评价(Image Quality Assessment, IQA)就是对图像的质量进行评价,给出图 像的评分结果或者质量等级。近些年来,图像质量评价的研究已成为图像处理领域的热 点研究方向之一,也取得了显著的成果。目前的评价方法,主要可分为两大类:主观质 量评价方法(Subjective Quality Assessment)和客观质量评价方法(Objective Quality Assessment)。主观评价方法根据度量
37、尺度的不同,可以分为绝对评价和相对评价两类。 客观评价方法是当前研究的重点和核心,根据度量时是否存在标准图像,又可将客观评 价方法分为三类:全参考图像评价、部分参考图像评价和无参考图像评价。2 .1 主 观 质 量 评 价人为图像质量的最终评定者,人眼是最终接受系统。但实际操作中,因为每个测试 者的个体情况不同、具体观测环境也会给主观评价带来影响,同时主观评价需要大量打 分者而影响了主观评价的实现难度。针对这些情况,国际电信同盟(International Telecommunications Union,ITU)给出了相应的主观评分标准ITU-RBT.5006 7 ,其中包括 双刺激连续质量
38、分级(Double Stimulus Continuous Quality Scale,DS CQS)和单刺激连续质 量评价法(Single Stimulus Continuous Quality Evaluation,SSCQE)等。主观评价的流程为:设计实验,选择一定人数的观测者,在实验设定的环境中让观 测者连续观看一系列的测试序列(图像或视频),然后采用相应方法让观测者对观看到的 图像进行质量评分,最后所有评分求取平均,即 MOS(Mean Opinion Score)分值,一般 持续大约 10 至 30 分钟的时间。测试之后所得到得数据要进行分析。测试中,环境的受 控因素一般包括:观看
39、距离、屏幕大小、测试序列的选择、序列显示时间间隔、外界光 线等。在图像/视频主观评价中,需要考虑到的因素包括:亮度(Brightness,积极的),对 比度(Contrast,积极的),颜色重现(Color reproduction,积极的),轮廓清晰度 (Outline definition,积极的),背景稳定性(Background stability,积极的),图像重建速度(Speedin image reassembling,积极的),运动不平稳(Jerkiness,消极的),“拖尾”效应“(Smearing”effects,消极的),“蚊子”效应“(Mosquito”效应,消极的),
40、重像/影(Double images/shadows,消极的),光晕效应(Halo,消极的)等。下面对主观评价的几个方面进行简单阐述。 2.1.1 常用方法主观评价的最常用方法是双刺激连续质量分级(DSCQS)和单刺激连续质量评价法北京航空航天大学硕士学位论文(SSCQE)。DSCQS 一般常用于评价图像的相对失真程度,或者称为图像的信息保真度, 即测试失真图像相对于参考图像(原始图像)的质量失真程度;S SCQE 只对单幅图像进行 质量评价。这两种方法在相关标准中都有较为明确的规定。根据其设计的思路,DS CQS 多用于容易获得参考图像的场合,此类方法也因为有参考图像作为参照而评价较为稳定
41、和准确,诸如压缩失真、融合失真等场合使用此方法。在获取参考图像代价太大或者无 法获得参考图像的情况下,单刺激的方法较为适用。DS CQS :观测者观看多个参考图像 和失真图像组成的“图像对”,观看顺序为先观看原始参考图像,后观看失真图像。观 测者通过对图像的整体印象来打分,打分的标准事先已经给出。测试有两种形式:参考、 测试图像只显示一次,参考、测试图像重复显示两次。重复显示的方式花费时间较多, 但对失真较小的图像评分更准确。SSCQE:多幅测试图像随机显示,并且显示的顺序根据不同的观测者而不相同。观 测者观看测试图像后,对其质量进行打分。具体实现方式有两种:第一种方法是单刺激 方法(Sing
42、le-Stimulus,SS),即测试图像只显示一次,不重复显示;另外一种是多次重复 单刺激方法(Single Stimulus with Multiple Repetition,S SMR),即测试图像多次重复显示。2.1.2 评分标准在实际应用中,人眼是图像质量的最终评定者,人的主观评价是唯一“正确”的视 觉图像质量评估。但每个人的评价标准不同,这就需要对相同数据集设定相应的评价标 准,以统一观测者的打分。最常用的质量评分测度是5分制,其他诸如9分制和11分制可以看做是5分制的扩展, 但它们的评分精度比5分制高。如5分制的评定依据如表 1所示:表 1 DS IS 的 5 分 制 失 真 测
43、 度图像等级主观评价干扰描述5优察觉不到4良好能察觉,但不讨厌3可以能明显察觉,但可以容忍2差明显察觉,令人讨厌1很差极其明显,很讨厌2.1.3 评价数据处理在主观评价的实验中,由于受个人情绪、环境、动机、知识背景等因素影响,不同观测者对相同质量给出的评价值会有变化,甚至可能会给出相差极大的结果,从而使评 价结果变得不准确。为使评价结果的有效性、合理性,应对数据进行分析,以获得受个 人影响少的评价结果。针对确定的评价实验,在给出评价的DMOS分值、95%置信区间和 方差等数据的同时,还需要将实验相关的细节一起给出。另外,也需要对数据进行必要 的筛选,筛选所使用的方法也要注明。2.1.4 主观评
44、价的缺点 主观评价方法作为图像质量的最直接、最可靠的评价方法,却因为具有诸多缺点而无法直接应用在图像处理系统上:( 1) 需要一定群体的观测者,对每一个观测者都需要经过培训,以使打分具有准确 性,这样需要的人力和物力就比较大,进行的时间也较长;( 2) 图像内容与个体情况千变万化,观测者受个人爱好、情绪、经验、知识、测试 环境的影响,易于发生主观上的判断偏差,从而使MOS分发生偏差;( 3) 无法进行实时评价;( 4) 仅仅只有平均分,如果评测分数低,无法确切定位问题出在哪里。 主观评价方法存在的种种不可回避的缺点,就促使人们寻找高效、便捷、准确的客观评价算法。由于主观评价结果的唯一“正确”性
45、,它也是用来评价客观评价算法优劣的最终标 准,因此主观评价方法在构建测试数据集时始终是必不可少的关键方法。此外,在用机 器学习方法进行客观质量评价的过程中,也需要主观评价结果作为训练学习的目标,而 训练所得分类器实际上也是通过对图像主观评价分值的预测来实现客观评价的。2 .2 客 观 质 量 评 价客观评价方法是通过建立数学模型,设计算法对图像质量进行自动评价,以达到预 测人眼主观评价结果的目的。图像质量评价主要包括两个方面:图像的逼真度和图像的 可理解度,图像的逼真度是描述被评价图像与标准图像的偏离程度,图像的可理解度则是 表示图像能向人或计算机提供信息的能力。图像质量客观评价可根据对标准图像的依赖 程度被分为三大类:一类是全参考图像质量评价(Full Reference Image Quality Assessment, FR-IQA),主要描述图像的逼真度,通常这类方法需要无失真的参考图像;另一类是部 分参考图像质量评价(Reduced Reference Image Quality Assessment, RR-IQA),这类算法主要是计