基于压缩感知视频编解码的论文.docx
《基于压缩感知视频编解码的论文.docx》由会员分享,可在线阅读,更多相关《基于压缩感知视频编解码的论文.docx(44页珍藏版)》请在沃文网上搜索。
1、AbstractThis work aims to based on compressed sensing theory analysis, implementation of distributed video coding. According to the requirements of distributed coding complexity, combined with compressed sensing theory and the traditional video coding and decoding technology, is put forward based on
2、 compressed sensing of distributed video coding: Encoding process that high dimensional signal be projected to a lower dimensional space; decoding project is no longer under the traditional manner of coding inverse process, but through the establishment of joint sparse model, solving the underdeterm
3、ined equations. The codec is relatively simple structure, not only the desired image fewer samples, the number of samples may be different according to the coding mode is selected, and can obtain higher compression ratio and better the quality of the reconstructed image. The experiment result shows
4、that, by introducing adaptive coding mechanism, not only can optimize the performance of RD, and without feedback channel is achieved close to the traditional inter-frame coding properties of reconstruction.Keywords: CS; Distributed decoding algorithm; Encoder; Decoder目录1.绪论61.1引言61.2研究背景及发展现状71.2.1
5、压缩感知71.2.2压缩感知技术在分布式编解码内71.2.3分布式视频编解码81.3论文的主要内容和组织结构92压缩感知理论极其研究进展92.1奈奎斯特(Nyquist)采样定理92.2压缩感知理论框架及其主要进展102.2.1问题描述102.2.2信号的稀疏表示122.2.3观察矩阵的设计142.2.4信号重构162.3压缩感知理论的推广及应用222.3.1信号在冗余字典上的压缩感知理论222.3.2压缩感知理论初步应用223基于压缩感知的分布式视频编解码243.1基于压缩感知的视频编解码研究243.1.1传统的视频编解码核心技术243.1.2基于压缩感知理论的编解码器253.2帧内与帧间采
6、样率273.3分布式压缩感知研究273.4分布式视频编码(DVC)283.5分布式压缩感知编解码293.6梯度投影稀疏重建(GPSR)303.7结构化相似度(SSIM)304实验介绍324.1系统模型324.1.1压缩感知初步算法324.1.2视频模型324.2内部视频编码帧的传输335实验仿真数据375.1视频解码实验375.2无线视频传输实验375.3实验结果数据396 总结与展望431 绪论1.1 引言 随着通信技术的不断发展,在通信网络中传输视频业务变得越来越重要。而众所周知,诗篇业务的特点是本身具备很大的数据量,从而在传输过程中需要很大的带宽。与此同时,由于视频业务本身具有相当大的冗
7、余性,人们设计出各种各样的压缩办法,在视频传输之前进行大规模的压缩,现有的方法是采用MPEG系列或者H.26x系列压缩方案,将视频的序列采用预测编码和变换编码的方法进行压缩,然后将其进行信道编码而发送。这类方法在现有一些传输条件较好的网络中取得了巨大的成功。但是这种类似MPEG和H.26x方案在无线网络中传输效果并不好,究其原因,根本上是因为无线信道本身的高误码率以及误码的随机性,带宽有限等特点决定了上述编码方案并不符合无线信道本身的特性,具体来说可以分为以下两个方面:首先预测编码和变换编码的方案使得编码出来的视频帧之间具有很大的依赖性,具体来说就是假设有一关键帧在传输过程中丢失,那么后续以前
8、一帧为参考的帧都无法正确解码,这样的话会造成严重的乱码效应。其次,在视频编码工程中,编码出来的数据它们代表的意义是不一样的,也就是有一部分数据的重要性要比另一部分高很多,例如运动矢量数据就比纹理数据重要的多,当在无线信道上随机丢包的环境下,如果恰好丢的是运动矢量数据,那么在恢复的时候就难恢复出可以辨别的一帧图像出来。而当丢失的使纹理数据时,可以通过一定的算法来弥补这种丢失带来的影响。随着人们对于视频在无线信道上传输问题的不断深入,各种各样的方法也被不断地提出,其中比较典型的有以下几种:一种是编码端的改进方案,表现为在视频编码的过程中加入固定的刷新帧,以及将编码出来的码流再进行多描述编码等方案。
9、还有一种方案是解码段的差多掩盖技术,它试图利用压缩后的视频数据之间的相关性来进行高难度的恢复。从上述方案可以看出,这些方案从某种程度上改善一些视频传输的效果,但是它们并不能从源头上解决了视频在无线环境中传输所存在的硬伤,即由于视频本身所采用的压缩方案的限制。这促使我们从源头上来寻找针对于视频在无线环境中所需的编解码方法。压缩感知是近几年信号处理理论的重大突破,它打破了传统的奈奎斯特采样定理对于采样点数的限制,采用一种数字投影的方法对信号进行整体的测量,从而能够达到以较少的采样值来进行原始信号的恢复的效果,目前这一理论已经大量的用于信号处理与通信的实践中,对于视频信号,由于本身的特点,本文将压缩
10、感知的方法融入进现有的视频编解码框架。1.2 研究背景及发展现状1.2.1 压缩感知传统方式下的信号处理,依照Shannon/Nyquist采样理论采样会产生大量的采样数据,需要先获取整个信号再进行压缩,即采样后大部分采样数据被抛弃,这就极大地增加了储存和传输的代价。由于带宽的限制,许多信号只包含少量的重要频率的信息,所以大部分信号时稀疏的可压缩的,对于这种类型的信号,我们知道,传统方式采样后的大部分冗余信息都会被抛弃,那么为什么还要获取全部数据呢?难道不能直接获取已压缩数据而不需要抛弃任何数据?于是由Cands和Donoho等人于2004年提出压缩感知理论。该理论可以理解为将模拟数据节约地转
11、换成压缩数字形式,避免了资源浪费。即,在采样信号的同时就对数据进行适当的压缩,相当于在采样过程中寻找最少的系数来表示信号,并能用适当的重构算法从压缩数据中恢复出原始信号。压缩感知的主要目标是从少量的非适应线性测量中精确有效地重建信号。核心概念在于试图从原理上降低一个信号进行测量的成本。压缩感知包含了许多重要的数学理论,具有广泛的应用前景,最近几年引起广泛关注。1.2.2 在分布式编解码内的压缩感知技术现有的视频压缩编码标准是基于传统的香农采样定理。在该定理要求下,信号的采样率必须大于信号带宽的2倍才能实现信号的准确重。因此,要实现视频图像的准确重构所需要的样本数较多。此外,视频编码过程中图像变
12、换后大部分的系数被舍弃造成了数据和系统资源的浪费近年来出现的压缩感知(Compressive Sencing,CS)理论指出在已知信号具有稀疏性或可压缩性的前提下,用于重构的样本数可以远远低于传统的香农采样定理下的样本数1。由于视频图像通常在某些变换域上具有可压缩性,而且视频残差图像具有较强的稀疏性,所以CS理论在视频编码中有着良好的应用前景。1.2.3 分布式视频编解码国际标准化组织(ISO/IEC)和国际电信联盟(ITU-T)这两个标准化组织分别领导和制定了两个视频压缩编码的系列国际标准:MPEG系列和H.26系列,它们被广泛应用于视频压缩各个领域。这些视频编码技术基于混合编码框架,编码运
13、用运动估计,充分挖掘视频信号的冗余信息,通常情况下,编码复杂度是解码复杂度的5-10倍,非常适合于视频信号的一次(一个)编码而多次(多个)解码的应用场合如:视频广播、视频点播、视频光盘存储等。然而一些视频应用场合恰恰相反,它们需要低复杂度的编码器,在解码端可以具有较高复杂度的解码器,比如计算能力、内存容量、耗电量都受限的无线视频终端:无线视频监控、无线PC相机、移动视频电话等。尤其是在无线传感网络中,视频传感节点(VSN:videa sensor node)有两个基本要求:(1)要求编码器功耗低、复杂度低:(2)由于速率限制,要求编码器具有较高的压缩效率。传统的视频编码技术不再适用于上述应用场
14、合,必须寻找新的视频压缩技术。针对这些情况,一种新的视频编码框架分布式视频编码(DVC:Distributed Video Coding)开始受到关注,这种视频编码具有编码简单,解码较复杂并且能够实现较为搞笑的压缩,抗误码特性好的特点。分布式视频编码的实现算法从2002年开始有学者进行相关领域的研究,并逐渐引起关注的。目前国内很少有分布式视频编解码的相关文献。1.3 论文的主要内容和组织结构第一章为绪论,相关内容上面已经提及。第二章为压缩感知理论及其研究进展。主要包括压缩感知理论的发展过程中产生的相关理论。第三章主要讲解基于压缩感知的分布式视频编解码,主要谈论分布式编解码的模型,原理及重构算法
15、。第四章主要内容是对整个实验的一个概括介绍,包括模型机制,算法等。第五章主要对实验结果数据的分析。第六章为总结和展望,提出待解决的问题,分析理论的发展前景。2 压缩感知理论极其研究进展2.1 奈奎斯特(Nyquist)采样定理在进行模拟/数字信号的转换过程中,当采样频率fs.max大于信号中最高频率fmax的2倍时(fs.max2fmax),采样之后的数字信号完整地保留了原始信号中的信息,一般实际应用中保证采样频率为信号最高频率的510倍;采样定理又称奈奎斯特采样定律。1924年奈奎斯特(Nyquist)就推导出在理想低通信道的最高码元传输速率的公式:理想低通信道的最高码元传输速率W=2B B
16、aud(其中W是理想)理想信道的极限信息速率(信道容量)C=B*log2 N (bps)。采样过程所应遵循的规律,又称取样定理、抽样定理。采样定理说明采样频率与信号频谱之间的关系,是连续信号离散化的基本依据。采样定理是1928年由美国电信工程师H.奈奎斯特首先提出来的,因此称为奈奎斯特采样定理。1933年由苏联工程师科捷利尼科夫首次用公式严格地表述这一定理,因此在苏联文献中称为科捷利尼科夫采样定理。1948年信息论的创始人C.E.香农对这一定理加以明确地说明并正式作为定理引用,因此在许多文献中又称为香农采样定理。采样定理有许多表述形式,但最基本的表述方式是时域采样定理和频域采样定理。采样定理在
17、数字式遥测系统、时分制遥测系统、信息处理、数字通信和采样控制理论等领域得到广泛的应用。2.2 压缩感知理论框架及其主要进展2.2.1 问题描述考虑一个实值的有限长一维离散时间信号X,可以看作为一个RN空间N1的维的列向量,元素Xn,n=1,2,N.RN空间的任何信号都可以用N1维的基向量的线性组合表示。为简化问题,假定这些基是规范正交的。把向量作为列向量形成NN的基矩阵:=1,2,N,于是任意信号X都可以表示为: or (1)其中,是投影系数=i=构成的N1的列向量。显然,X和是同一个信号的等价表示,X是信号在时域的表示,则是信号在域的表示。如果的非零个数比N少很多,则表明该信号是可压缩的。一
18、般而言,可压缩信号是指K个大系数很好地逼近的信号,即它在某个正交基下的展开的系数按一定量级呈现指数衰减,具有非常少的大系数和许多小系数。这种通过变换实现压缩的方法称为变换编码。变换编码在数据采样系统中,比如数码相机,发挥了重要作用。在这些系统中,采样速率高但信号时可压缩的,采样得到N点采样信号X;通过=TX变换后计算出完整的变换系数集合i;确定K个大系数位置,然后扔掉N-K个小系数;对K个大系数的值和位置进行编码,从而达到压缩的目的。图2.1 传统方法压缩过程显然,这种传统的以奈奎斯特采样定理为准则的高速采样后再压缩的过程浪费了大量的采样资源。例如数码相机具有千万像素的图像传感器,最后却只使用
19、到对图像进行变换压缩后的几Mbyte的数据5。近几年兴起的压缩感知理论表明,可以在不丢失逼近原信号所需信息的情况下,用最少的观测次数来采样信号,实现信号的降维处理,即直接对信号进行较少采样得到信号的压缩表示,且不经过进行N次采样的中间阶段,从而在节约采样和传输成本的情况下,达到了在采样的同时进行压缩的目的。压缩感知理论首先由Cands、Romberg、Tao进而Donoho等人在2004年提出,文献直到2006年才发表。Cands证明了只要信号在某一正交空间具有稀疏性,能以较低的频率(MN)信号,而且可以以高概率重构该信号。目前国内已经有科研单位的学者对其展开研究,如西安电子科技大学课题组基于
20、该理论提出采用超低速率采样检测超宽带回波信号。压缩感知理论指出,设长度为N的信号X在某组正交基或紧框架上的变换系数是稀疏的,如果我们用一个与变换基不相关的观测基: MN(MN)对系数向量进行线性变换,并得到观测集合Y: M1. 那么就可以利用优化求解方法从观测集合中精确或离概率地重构原始信号X。压缩感知理论是一种新的在采样的同时实现压缩目的的理论框架,其压缩采样过程如图2所示。首先,如果信号XRN在某个正交基或紧框架上是可压缩的,求出变换系数 =TX,是的等价或逼近的稀疏表示;第二步,设计一个平稳的、与变换基不相关的MN维的观测矩阵,对进行观测得到观测集合Y= = TX,该过程也可以表示为信号
21、X通过矩阵ACS进行非自适应观测:Y= ACSX(其中ACS= T),ACS称为CS信息算子;最后,利用0-范数意义下的优化问题求解X的精确或近似逼近: (2)求得的向量在基上的表示最稀疏。压缩感知理论主要涉及以下几个方面的内容: 1) 对于信号XRN,如何找到某个正交基或紧框架,使其在上的表示是稀疏的, 即信号的稀疏表示问题。2) 如何设计一个平稳的、与变换基不相关的MN维的观测矩阵, 保证稀疏向量从N维降维到M维时重要信息不遭破坏,即信号低速采样问题。3) 如何设计快速重构算法,从线性观测Y= ACSX中恢复信号,即信号重构问题。下面将从这三个方面介绍压缩感知理论的最新发展。图2.2 压缩
22、感知理论框架2.2.2 信号的稀疏表示从傅立叶变换到小波变换再到后来兴起的多尺度几何分析(Ridgelet6,Curvelet7,Bandelet8,Contourlet9),科学家们的研究目的均是为了研究如何在不同的函数空间为信号提供一种更加简洁、直接的分析方式,所有这些变换都旨在发掘信号的特征并稀疏表示它,或者说旨在提高信号的非线性函数逼近能力,进一步研究用某空间的一组基表示信号的稀疏程度或分解系数的能量集中程度。文献给出稀疏的数学定义:信号X在正交基下的变换系数向量为=TX,假如对于0p0,这些系数满足: (3)则说明系数向量在某种意义下是稀疏的。文献给出另一种定义:如果变换系数i=的支
23、撑域i:i0的势小于等于K,则可以说信号X是K-项稀疏。如何找到信号最佳的稀疏域?这是压缩感知理论应用的基础和前提,只有选择合适的基表示信号才能保证信号的稀疏度,从而保证信号的恢复精度。在研究信号的稀疏表示时,可以通过变换系数衰减速度来衡量变换基的稀疏表示能力。Cands和Tao研究表明,满足具有幂次(power-law)速度衰减的信号,可利用压缩感知理论得到恢复,并且重构误差满足: (4)其中r=1/p-1/2,0p1。文献指出光滑信号的Fourier系数、小波系数、有界变差函数的全变差范数、振荡信号的Gabor系数及具有不连续边缘的图像信号的Curvelet系数等都具有足够的稀疏性,可以通
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 压缩 感知 视频 解码 论文
