PCA人脸特征提取技术研究.doc
《PCA人脸特征提取技术研究.doc》由会员分享,可在线阅读,更多相关《PCA人脸特征提取技术研究.doc(40页珍藏版)》请在沃文网上搜索。
1、摘要摘 要人脸识别是生物特征识别中一个活跃的研究领域,与利用指纹、虹膜等其他生物特征识别相比,人脸识别具有直接、友好、方便的特点,是进行身份确认的最自然直接的手段。因此,人脸识别在信息安全、刑事侦破、出入口控制等领域具有广泛的应用前景。人脸识别的一般步骤是图像预处理,特征提取,分类识别。其中特征提取直接决定分类结果的好坏,在人脸识别中占有重要地位。一个好的特征提取方法具有算法简单和速度快等特点,本文主要研究一种经典的特征提取方法主成分分析法(PCA),其基本思想是降维。主要的工作如下:挑选人脸库,建立训练集和测试集;对训练集和测试集中的图像进行PCA处理,即进行特征提取,求出人脸图像在特征脸空
2、间中的坐标系数,以此来作为人脸图像的特征;选用最近邻分类器实现人脸识别和分类,从识别效果来说明PCA的优缺点。关键词: 人脸识别 特征提取 主成分分析法 ABSTRACTABSTRACTFace recognition is an active research area of biometric identification. Compared to the use of fingerprints, iris and other biometric identification ,face recognition is more direct, friendly and convenient
3、.It is the most natural and direct means for identification.Therefore, face recognition has a wide range of applications in the information security ,criminal detection and Access Control area.Face recognition generally has three steps:image pre-processing, feature extraction, classification and ide
4、ntification. Feathure extraction is important,which directly determines the quality of classification results. A good method for feature extraction should has simple and fast algorithms. This paper mainly researches on a classical method for feature extraction Principal Component Analysis(PCA)with t
5、he basic idea of dimensionality reduction.The main work is as follows:Select a face database,create the training set and test set;Feature extraction for the images of the training set and test set,which are the coordinates coefficients in the Eigenface space;Classification and identification using M
6、inimum Distance Classifier,describe the advantages and disadvantages of PCA.Keywords: face recognition feature extraction PCA 目录目 录第一章 绪论11.1 特征提取的研究背景和意义11.1.1 研究背景和意义11.2 人脸特征提取的研究现状及存在问题31.2.1 人脸图像可以提取的特征31.2.2 人脸特征提取方法31.2.3 特征提取时存在的问题61.3 本文主要研究内容及各章安排81.3.1 本文主要研究内容81.3.2 本文各章安排8第二章 人脸特征提取主成分分
7、析法92.1 概述92.2 K-L变换102.2.1 K-L变换基本原理102.2.2 特征压缩122.3 基于PCA算法的人脸特征提取122.3.1 总体散布矩阵的形成132.3.2 维数问题142.3.3 变换矩阵的求解及变换的实现142.3.4 特征脸152.3.5 PCA算法162.4 人脸识别的分类准则182.4.1 相似性测度182.4.2 分类器182.5 PCA的特点及存在问题202.5.1 特点202.5.2 存在问题20第三章 本文方法的实现及结果233.1 人脸库的选取233.2 识别过程233.3结果分析243.3.1 基于PCA的人脸识别243.3.2 低通滤波处理和
8、边缘提取25第四章 总结与展望294.1 全文工作总结294.2 未来工作展望29致 谢31参考文献33第一章 绪论7第一章 绪论1.1 特征提取的研究背景和意义1.1.1 研究背景和意义在科学研究的众多应用领域中,一个普遍存在的问题是如何从采集的数据中获取有用的信息。随着科技的高速发展,大量数据的测量及存储己经不再成为问题,但是获取数据本身显然是不够的,提取产生这些数据的系统本身信息才是根本目的所在。而且,通常所获得的原始数据的数据量相当大,且样本常处于一个高维空间中,如果直接用原始数据进行分类器设计的话,无论从计算的复杂程度还是分类器性能来看都是不适宜的。为了有效地实现分类识别,就要把原始
9、数据映射(或变换)到低维空间,得到最能反映应样本内在本质的特征,以便能更有效的进行分类,这个过程就叫做特征提取或者数据降维1。映射后的特征叫做二次特征,它们是原始特征的某种组合(线性组合或非线性组合)。特征提取或者数据降维的基本任务是如何从许多特征中找出那些最有效的特征,特征的提取强烈影响到分类器的设计及性能,因此,特征提取是模式识别中的一个关键问题,在数据聚类,模式识别等领域有着广泛的应用。从广义上说,特征提取就是指一种变换。若X是测量空间,Y是特征空间,则变换A:XY就叫做特征提取器。为了使问题尽可能的简单化以及考虑计算的复杂性,通常对原始数据进行线性变换,因为这会给特征提取的后继分析带来
10、极大的方便。为了便于研究,通常把采集得到的数据看成多维随机变量的一系列样本值,以便于将随机变量的数值统计方法应用到源数据。对于多维信号在时刻t的采样,可看作是M维随机变量的某一观测样本矢量,其中xi(t),i=1,2,M为各个分量。按照某种准则对其施加一个线性变换,记为f(RMRN): (1-1)为变换的结果,假设这个的f是一个线性变换,于是有y(t)中的每个分量都是原始所有分量的线性组合: (1-2)其中,。对于每个的一组系数,称为一个基向量。式(1-2) 可以简单的写作矩阵形式: (1-3)其实,多维数据的线性变换及降维过程简单地说就是按照一定的准则去找一系列的加权系数组成线性变换矩阵中的
11、每个基向量,而这N个基向量就是一个新的坐标系。将原数据在这样一个坐标系上展开,得到的每个分量便是变换的结果。要求变换后的数据y在最大程度上体现原始数据间的实质结构。并且y的各个分量能够尽可能地代表产生源数据的系统本身的物理机制。基于多维随机变量统计分析的框架,变换矩阵的寻找方法通常是建立在一个体现输出结果y的统计特性的目标函数g(y)。而这种统计特性因算法的基本准准则不同而不同,可能是一,二阶的,如相关系数,协方差等,也可能是高阶的,如互信息,非高斯性等。如主成分分析方法的基本准则是当用新分量对原始数据进行重构时,在最小均方差意义下逼近效果最佳,而线性判别方法的基本准则是使不同类别的样本尽量分
12、开,即选择使得样本类间离散度和样本类内离散度的比值最大。线性变换是历史悠久的重要降维方法,目前在各个领域都得到了广泛应用,也相对比较成熟。该方法利用如上提到的类似线性变换将原数据向量从高维空间映射到低维空间中,通过保留最重要的或者最能体现个体差异性的成分,使得降维后的数据能够最大程度的保留原高维向量的特征或某一个方面的特性。依据线性降维所采用的具体方式不同,又可以分为:主成分分析 (PrincipalComPonent Analysis,PCA)2,奇异值分解(singular Value Decomposition,SVD)3,线性判别分析4,独立成分分析5,局部特征分析6,多维尺度分析7等
13、数十种主要算法。非线性降维是近年来逐渐发展起来的方法,还比较年轻,各种新的算法也在不断涌现和发展。它与前面所述方法的主要不同在于降维过程中运用的是非线性变换。目前提出的非线性变换方法大体上有两大类:基于核函数的算法8(包括KemelPcA,KemelLDA,KemelIcA等)以及基于流形学习的方法(包括Isom9,局部线性嵌入10,拉普拉斯映射方法11等)。上述各种降维方法已经广泛的应用于信号处理的各个领域:机器学习,数据压缩,可视化,模式识别等。1.2 人脸特征提取的研究现状及存在问题1.2.1 人脸图像可以提取的特征特征提取是模式识别研究的基本问题之一。对于人脸图像识别而言,抽取有效的图
14、像特征是完成图像识别的关键任务。目前用于图像识别的特征可分为如下几种:1、直观性特征。如图像的边缘,轮廓,纹理或区域等。在人脸识别中用得最多的直观性特征是几何特征,即人脸的五官尺寸及相对位置。这类特征虽然具有维数低的特点,但对于同一个人因表情及光照条件变化往往会导致其尺寸及相对位置发生较大的变化,因此识别效果并不令人满意。2、灰度的统计特征。如直方图特征,将图像看作一个二维随机过程,可以引入统计上的各阶矩作为特征来描述和分析图像,他们能够在保留主要分类信息的基础上大大降低特征的维数。3、变换系数特征。对图像作各种数学变换,可以将变换的系数作为图像的一种特征,例如Fisher变换,Hough变换
15、和小波变换等在图像特征抽取方面均有广泛应用。这类方法的优点是计算比较方便,但是去相关能力不强。系数特征的维数仍然比较大。4、代数特征。它反映图像的一种内在属性。将图像看作矩阵对待,可对其进行各种代数变换,或进行各种矩阵分解。由于矩阵的特征向量反映了矩阵的一种代数属性,并具有不变性,因此可用来作为图像特征。在人脸识别中,用来抽取图像的代数特征的典型方法是PCA变换和矩阵的奇异值分解。1.2.2 人特征提取方法人脸识别本质上是三维塑性物体二维投影图像的匹配问题,它的困难体现在:人脸塑性变形(如表情等)的不确定性;人脸模式的多样性(如胡须,发型,眼镜,化妆等);图像获取过程中的不确定性(如光照的强度
16、,光源方向等)。在对人脸图像进行特征提取之前一般需要做几何归一化和灰度归一化。几何归一化是指根据人脸定位结果将图像中人脸变换到同一位置和同样大小,灰度归一化是指对图像进行光照补偿等处理,光照补偿能够一定程度地克服光照变换的影响而提高识别率12。特征提取是人脸识别的基础,对训练集和待识别的人脸图像采用相同的特征提取方法,然后对待识别的人脸图像进行分类。所以,特征提取作为人脸识别的重要组成部分,对人脸识别进行研究,也就要对特征提取方法进行不断研究探索和实验。随着人脸识别的发展,各种各样的特征提取方法也开始被应用起来。基于几何特征的方法:人脸由眼睛、鼻子、嘴、下巴等部件构成,对这些部件和结构关系的几
17、何描述,可作为识别人脸的重要特征。Kanade用几何量作为人脸的特征,这些几何量包括眼角、嘴角、鼻孔、下巴这些点之间的距离以及所成的角。Buhr用图表示法和描述树法给出了人脸的33个主要特征与12个次要特征,其主要特征包括了24个基于眼睛、人脸中心、嘴的量测。Yuille提出了包括头发、鼻子、嘴并用弹簧连接边缘的全局人脸模板以抽取出眼睛与嘴。Craw提出了更复杂的人脸模板,包含了头发线条、眼睛、眉毛、鼻子、嘴和面颊。最近,Lee等抽取人脸的5个距离量度作为人脸识别特征口侧。人脸的几何特征比较稳定,受人脸的姿态变化与光照条件等因素的影响小,但弱点是不容易抽取,而且量测精度不高。基于特征脸的方法:
18、线性判别分析(Linear Discriminant Analysis)是统计模式识别的基本方法之一。应用统计方法解决人脸识别问题时,经常碰到的问题之一就是被称之为“维数灾难”的问题。在低维空间里解析上或计算上可行的办法,在高维空间里可能变得毫无实际意义。因此,降低维数就成为处理实际问题的关键并发展了许多压缩特征空间维数的方法。我们希望通过寻求一种线性变换,可以使人脸图像从高维的图像空间映射到低维的特征空间,而不降低人脸的识别能力。特征脸方法是基于线性映射,使人脸图像从图像空间投影到特征空间的方法。采用PCA进行降维,寻求使所有的图像样本的总体散布最大的投影方向。Turk和Pentland提出
19、特征脸的方法,它根据一组人脸训练图像构造主元子空间,由于主元具有脸的形状,也称为特征脸。识别时将测试图像投影到主元子空间上,得到一组投影系数,和各个己知人的人脸图像进行比较进行识别。在12,13中Pentland等报告了相当好的结果,在200个人的3000幅图像中得到95%的正确识别率,在FERET数据库上对150幅正面人脸像只有一个误识别。但系统在进行特征脸方法之前需要作大量预处理工作如归一化等。在传统特征脸的基础上,研究者注意到特征值大的特征向量(即特征脸) 并不一定是分类性能好的方向,据此发展了多种特征(子空间)选择方法,如Peng的双子空间方法,Weng的线性歧义分析方法15,Belh
20、umeur的FisherFace方法等。事实上,特征脸方法是一种显示主元分析人脸建模,一些线性自联想,线性压缩型BP网络则为隐式的主元分析方法,它们都是把人脸表示为一些向量的加权和,这些向量是训练集叉积阵的主特征向量,Valentin对此作了详细讨论。总之,特征脸方法是一种简单,快速,实用的基于变换系数特征的算法,但由于它本质上依赖于训练集和测试集图像的灰度相关性,而且要求测试图像与训练集比较像。神经网络方法:前神经网络方法在人脸识别中的研究方兴未艾Valentin提出一种方法,首先提取人脸的50个主元,然后用相关神经网络将它映射到5维空间中,再用一个普通的多层感知器进行判别,对一些简单的测试
21、图像效果较好16;Intrator等提出了一种混合型神经网络来进行人脸识别,其中非监督神经网络用于特征提取,而监督神经网络用于分类。Lee等将人脸的特点用六条规则描述,然后根据这六条规则进行五官的定位,将五官之间的几何距离输入模糊神经网络进行识别,效果较一般的基于欧氏距离的方法有较大改善。Laurence等利用卷积神经网络方法进行人脸识别,由于卷积神经网络中集成了相邻象素之间的相关性知识,从而在一定程度上获得了对图像平移,旋转和局部变形的不变性,因此得到了非常理想的识别效果。Lin等提出了基于概率决策的神经网络方法(PDBNN),其主要思想是采用虚拟(正反例)样本进行强化和反强化学习,从而得到
22、较为理想的概率估计结果,并采用模块化的网络结构(OCON)加快网络的学习。这种方法在人脸检测,人脸定位和人脸识别的各个步骤上都得到了较好的应用17;其它研究还有:Dai等提出用Hopfield网络进行低分辨率人脸联想与识别;Gutta等提出将RBF与树型分类器结合起来进行人脸识别的混合分类器模型;Philips等人将Matching Pursuit滤波器用于人脸识别;还有则采用统计学习理论中的支持向量机进行人脸分类。神经网络方法在人脸识别上的应用比起前述几类方法来有一定的优势,因为对人脸识别的许多规律或规则进行显性的描述还是相当困难的,而神经网络方法则可以通过学习的过程获得对这些规律和规则的隐
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
10 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- PCA 特征 提取 技术研究