多媒体虚拟现实及人工智能.ppt
《多媒体虚拟现实及人工智能.ppt》由会员分享,可在线阅读,更多相关《多媒体虚拟现实及人工智能.ppt(97页珍藏版)》请在沃文网上搜索。
1、3.3 3.3 网络多媒体技术及应用网络多媒体技术及应用计算机网络与多媒体技术计算机网络与多媒体技术网络多媒体技术及应用网络多媒体技术及应用多媒体关键技术多媒体关键技术1流媒体技术技术流媒体技术技术2多媒体关键技术多媒体关键技术数据压缩概述数据压缩概述1音频数据的压缩音频数据的压缩2静态图像的数据压缩静态图像的数据压缩3运动图像的数据压缩运动图像的数据压缩41 数据压缩概述数据压缩概述由于多媒体数据量非常大,造成计算机的存储和网络传输负担若帧速率为25帧秒,则1s的数据量大约为25MB,一个640MB的光盘只能存放大约25s的动态图像一幅640480分辨率的24位真彩色图像的数据量约为900K
2、B;一个100MB的硬盘只能存储约100幅静止图像画面解决办法之一就是进行数据压缩,压缩后再进行存储和传输,到需要时再解压、还原。以目前常用的位图格式的图像存储方式为例,像素与像素之间无论是在行方向还是在列方向都具有很大的相关性,因而整体上数据的冗余度很大,在允许一定限度失真的前提下,能够对图像数据进行很大程度的压缩。数据压缩方法无损压缩:无损压缩:利用数据的统计冗余进行压缩,可完全恢复原始数据而利用数据的统计冗余进行压缩,可完全恢复原始数据而不引入任何失真,但压缩率受到统计冗余度理论限制,不引入任何失真,但压缩率受到统计冗余度理论限制,一般为一般为2:1到到5:1。无损压缩所使用的编码技术常
3、使用熵编码,它把已压缩无损压缩所使用的编码技术常使用熵编码,它把已压缩的数据流看做是简单的数字序列,而忽略该数据的语义,的数据流看做是简单的数字序列,而忽略该数据的语义,适用于不必考虑其自身具体特点的媒体。适用于不必考虑其自身具体特点的媒体。常用工具:常用工具:WinRar、WinZip、ARC等等 1 数据压缩概述数据压缩概述行程编码行程编码多数无损压缩采用行程编码。行程编码又称“运行长度编码”或“游程编码”,是一种统计编码,该编码属于无损压缩编码。行程编码的基本原理是:用一个符号值或串长代替具有相同值的连续符号算法。连续符号构成了一段连续的连续符号构成了一段连续的“行程行程”。行程编码因此
4、而得名,使符号长度少于原始数据。行程编码因此而得名,使符号长度少于原始数据的长度。的长度。例如:例如:5555557777733322221llllll行程编码为:行程编码为:(5,6)()(7,5)()(3,3)()(2,4)()(l,7)。可见,)。可见,行程编码的位数远远少于原始字符串的位数。行程编码的位数远远少于原始字符串的位数。1 数据压缩概述数据压缩概述数据压缩方法有损压缩:有损压缩:利用了人类视觉和听觉器官对图像或声音中的某些频率利用了人类视觉和听觉器官对图像或声音中的某些频率成分不敏感的特性,允许在压缩过程中损失一定的信息;成分不敏感的特性,允许在压缩过程中损失一定的信息;虽然
5、不能完全恢复原始数据,但是所损失的部分对理解虽然不能完全恢复原始数据,但是所损失的部分对理解原始图像或声音的影响较小,却换来了大得多的压缩比。原始图像或声音的影响较小,却换来了大得多的压缩比。有损压缩广泛应用于语音、图像和视频数据的压缩。有损压缩广泛应用于语音、图像和视频数据的压缩。常用的有损压缩编码技术为源编码(考虑原始数据的语常用的有损压缩编码技术为源编码(考虑原始数据的语义)和混合编码(熵编码和源编码技术)。义)和混合编码(熵编码和源编码技术)。常用工具:常用工具:JPEG、MPEG等等 1 数据压缩概述数据压缩概述衡量一种数据压缩技术的好坏有三个重要的指标指标压缩比压缩比图像质量或音质
6、图像质量或音质压缩和解压的速度压缩和解压的速度数据压缩原理原始的多媒体信源数据原始的多媒体信源数据存在着客观上的大量冗余。存在着客观上的大量冗余。信信息理论认为:若信源编码的熵大于信源的实际熵,该息理论认为:若信源编码的熵大于信源的实际熵,该信源中一定存在冗余度。去掉冗余不会减少信息量,信源中一定存在冗余度。去掉冗余不会减少信息量,仍可原样恢复数据;但若减少了熵,数据则不能完全仍可原样恢复数据;但若减少了熵,数据则不能完全恢复。不过在允许的范围内损失一定的熵,数据仍然恢复。不过在允许的范围内损失一定的熵,数据仍然可以近似恢复。可以近似恢复。1 数据压缩概述数据压缩概述数据压缩原理因为人的感觉的
7、某些不敏感性,多媒体数据中还存因为人的感觉的某些不敏感性,多媒体数据中还存在着在着从主观感受角度从主观感受角度看去的大量冗余,即:看去的大量冗余,即:在人眼在人眼允许的误差范围之内,压缩前后的图像如果不做非允许的误差范围之内,压缩前后的图像如果不做非常细致的对比是很难觉察出两者的差别的。常细致的对比是很难觉察出两者的差别的。1 数据压缩概述数据压缩概述数据压缩技术标准H.261:是为在综合业务数字网(:是为在综合业务数字网(ISDN)上开展双)上开展双向声像业务(可视电话、视频会议)而制定的,速向声像业务(可视电话、视频会议)而制定的,速率为率为64kb/s的整数倍。它使用两种类型的压缩:一的
8、整数倍。它使用两种类型的压缩:一帧中的有损压缩和帧间压缩的无损编码,并在此基帧中的有损压缩和帧间压缩的无损编码,并在此基础上使编码器采用带有运动估计的础上使编码器采用带有运动估计的DCT和和DPCM(差分脉冲编码调制)的混合方式,(差分脉冲编码调制)的混合方式,H.261是最早是最早的运动图像压缩标准。的运动图像压缩标准。音频信号压缩编码的主要依据是人耳的听音频信号压缩编码的主要依据是人耳的听觉特性,主要有两点:觉特性,主要有两点:1.1.人的听觉系统中存在一个人的听觉系统中存在一个听觉阈值电平听觉阈值电平,低,低于这个电平的声音信号人耳听不到于这个电平的声音信号人耳听不到 .次声、可听声和超
9、次声、可听声和超声声 2.2.人的听觉存在人的听觉存在屏蔽效应屏蔽效应。当几个强弱不同的。当几个强弱不同的声音同时存在时,强声使弱声难以听到,并且声音同时存在时,强声使弱声难以听到,并且两者之间的关系与其相对频率的大小有关两者之间的关系与其相对频率的大小有关 .声音编码算法就是通过这些特性来声音编码算法就是通过这些特性来去掉更去掉更多的冗余数据多的冗余数据,来达到压缩数据的目的。,来达到压缩数据的目的。2 音频数据的压缩音频数据的压缩在多媒体中,音频有很多压缩编码标准:在多媒体中,音频有很多压缩编码标准:(1 1)MP3MP3音频音频 MP3MP3的全名是的全名是MPEG Audio Laye
10、r-3MPEG Audio Layer-3,简单地,简单地说就是一种声音文件的压缩格式。是目前最普说就是一种声音文件的压缩格式。是目前最普及的音频压缩格式,是典型的有损压缩。及的音频压缩格式,是典型的有损压缩。MPEG-1MPEG-1音频压缩标准里包括了三个使用高性音频压缩标准里包括了三个使用高性能音频数据压缩方法的感知编码方案能音频数据压缩方法的感知编码方案 ,按照压,按照压缩质量缩质量(每每BitBit的声音效果的声音效果)和编码方案的复杂程和编码方案的复杂程度分别是度分别是Layer1Layer1、Layer2Layer2、Layer3Layer3。2 音频数据的压缩音频数据的压缩MPE
11、G-1音频的层次与压缩比率Layer1(相当于相当于384kbps立体声信号立体声信号)4:1Layer2(相当于相当于192256kbps立体声信号立体声信号)6:18:1Layer3(相当于相当于112154kbps立体声信号立体声信号)10:112:1 MP3MP3是利用是利用 MPEG Audio Layer 3 MPEG Audio Layer 3 的技术,将的技术,将音乐以音乐以1:10 1:10 甚至甚至 1:12 1:12 的压缩率,压缩成容量的压缩率,压缩成容量较小的文件,能够在音质丢失很小的情况下把较小的文件,能够在音质丢失很小的情况下把文件压缩到更小的程度。文件压缩到更小
12、的程度。每分钟音乐的每分钟音乐的MP3格式只有格式只有1MB左右大小,这样每首歌的大小只有左右大小,这样每首歌的大小只有3-4兆字节。兆字节。而且还非常好的保持了原来的音质。使用而且还非常好的保持了原来的音质。使用MP3MP3播播放器对放器对MP3MP3文件进行实时的解压缩文件进行实时的解压缩(解码解码),这样,这样,高品质的高品质的MP3MP3音乐就播放出来了。音乐就播放出来了。MP3MP3音频音频 (2 2)MP3PROMP3PRO MP3PROMP3PRO,它是,它是 Thomson MultimediaThomson Multimedia多媒体多媒体公司推出的一个公司推出的一个MP3M
13、P3格式的升级版本,格式的升级版本,MP3PROMP3PRO可可以把声音文件压缩到原有以把声音文件压缩到原有MP3MP3格式的一半大小,格式的一半大小,但却可以保持相同的音质。但却可以保持相同的音质。2 音频数据的压缩音频数据的压缩 2.MP3PRO2.MP3PROMP3PROMP3PRO文件在播放上完全与文件在播放上完全与MP3MP3兼容,兼容,经经过过mp3Promp3Pro压缩的文件,扩展名仍旧是压缩的文件,扩展名仍旧是.mp3.mp3 也就是说,老的也就是说,老的MP3MP3文件可以在新的文件可以在新的MP3PROMP3PRO播放播放器上进行播放,同时,新的器上进行播放,同时,新的MP
14、3PROMP3PRO可以在标准可以在标准的的MP3MP3软件和设备上播放,但效果可能较差,因软件和设备上播放,但效果可能较差,因为两者录制方式不同。为两者录制方式不同。mp3promp3pro在相应的播放软件中才能达到最高音质,在相应的播放软件中才能达到最高音质,而且而且mp3promp3pro的制作比较麻烦,目前还没有批量的制作比较麻烦,目前还没有批量压制的好方法。压制的好方法。2 音频数据的压缩音频数据的压缩音频数据的压缩音频数据的压缩mp3PROAudioPlayermp3PRO音乐文件的播放、制作功能 3.WMA 3.WMA WMA(Windows WMA(Windows MediaA
15、udioMediaAudio)格式是来自于微格式是来自于微软的重量级选手,后台强硬,音质要强于软的重量级选手,后台强硬,音质要强于MP3MP3格格式,更远胜于式,更远胜于RARA格式,它是以减少数据流量但格式,它是以减少数据流量但保持音质的方法来达到比保持音质的方法来达到比MP3MP3压缩率更高的目的,压缩率更高的目的,WMAWMA的压缩率一般都可以达到的压缩率一般都可以达到1 1:1818左右左右.2 音频数据的压缩音频数据的压缩 4.WMA 4.WMA WMAWMA还支持音频流技术,适合在网络上在线还支持音频流技术,适合在网络上在线播放,更方便的是不用象播放,更方便的是不用象MP3MP3那
16、样需要安装额外那样需要安装额外的播放器,而的播放器,而WindowsWindows操作系统和操作系统和WindowsMediaPlayerWindowsMediaPlayer的无缝捆绑让你只要安装的无缝捆绑让你只要安装了了windowswindows操作系统就可以直接播放操作系统就可以直接播放WMAWMA音乐,音乐,新版本的新版本的WindowsMediaPlayer7.0WindowsMediaPlayer7.0更是增加了直更是增加了直接把接把CDCD光盘转换为光盘转换为WMAWMA声音格式的功能,在新出声音格式的功能,在新出品的操作系统品的操作系统WindowsXPWindowsXP中,中
17、,WMAWMA是默认的编码是默认的编码格式格式.音质好的可与音质好的可与CDCD媲美,压缩率较高媲美,压缩率较高,可用于网可用于网络广播。络广播。2 音频数据的压缩音频数据的压缩5.5.WAVE WAV格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被Windows平台及其应用程序广泛支持。WAV格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1kHz的采样频率,16位量化位数,因此WAV的音质与CD相差无几,但WAV格式对存储空间需求太大不便于交流和传播 2 音频数据的压缩音频数据的压缩3 静态图像的数据压缩静态图像的数据压缩 静态图像压缩技术
18、主要是对空间信息进行压缩,静态图像压缩技术主要是对空间信息进行压缩,目的是在满足一定图像质量的条件下,缩小图像文件目的是在满足一定图像质量的条件下,缩小图像文件所占用的存储空间,从而减小存储容量和占用尽量小所占用的存储空间,从而减小存储容量和占用尽量小的网络带宽。的网络带宽。JPEGJPEG标准标准 国国际标准化组织际标准化组织(ISO)(ISO)和国际电报电话咨和国际电报电话咨询委员会询委员会(CCITT)(CCITT)联合成立的联合成立的“联合图像专家联合图像专家组组”JPEG(JointJPEG(Joint Photograph coding Experts Photograph cod
19、ing Experts Group)Group)于于19911991年提出的年提出的“多灰度静止图像的数多灰度静止图像的数字压缩编码字压缩编码”(简称简称JPEGJPEG标准标准)。这是一个适应于彩色和单色多灰度或连续这是一个适应于彩色和单色多灰度或连续色调静止数字图像的压缩标准,是最常用的图色调静止数字图像的压缩标准,是最常用的图像文件格式,是一种有损压缩,压缩比很大。像文件格式,是一种有损压缩,压缩比很大。3 静态图像的数据压缩静态图像的数据压缩4 运动图像的数据压缩运动图像的数据压缩 视频视频:运动图像即静止图像的连续播放状态压缩目标压缩目标:尽可能保证视觉效果的前提下减少视频数据率。压
20、缩比压缩比:压缩后的数据量与压缩前的数据量之比。运动图像的数据压缩方法运动图像的数据压缩方法 有损和无损压缩有损和无损压缩 帧内和帧间压缩帧内和帧间压缩 对称和不对称压缩对称和不对称压缩MPEG(运动图像专家组Moving Pictures Experts Group)标准是一系列视频、音频、数据的压缩标准。分成MPEG视频、MPEG音频和MPEG系统三大部分。MPEG算法除了对单幅图像进行编码外(帧内编码),还利用图像序列的相关特性去除帧间图像冗余,大大提高了视频图像的压缩比。4 运动图像的数据压缩运动图像的数据压缩4 运动图像的数据压缩运动图像的数据压缩压缩的基本方法:在单位时间内采集并保
21、存第一帧压缩的基本方法:在单位时间内采集并保存第一帧信息,然后就只存储其余帧相对第一帧发生变化的部信息,然后就只存储其余帧相对第一帧发生变化的部分,以达到压缩的目的。分,以达到压缩的目的。MPEG压缩标准可实现帧之压缩标准可实现帧之间的压缩。间的压缩。压缩比可达到压缩比可达到50:1,同时图像和音频的质量也非常,同时图像和音频的质量也非常高。高。最初最初MPEGMPEG专家组的工作项目是专家组的工作项目是3 3个,即在个,即在1.5Mbps1.5Mbps,l0Mbpsl0Mbps,40Mbps40Mbps传输速率下对图像编码,传输速率下对图像编码,分别命名为分别命名为MPEG-1MPEG-1,
22、MPEG-2MPEG-2,MPEG-3MPEG-3。l992l992年,年,MPEG-2MPEG-2适用范围扩大到适用范围扩大到HDTVHDTV(高清晰数字电视输(高清晰数字电视输出技术出技术),能支持),能支持MPEG-3MPEG-3的所有功能,因而的所有功能,因而MFEG-3MFEG-3被被取消。取消。主要有:主要有:MPEG-1MPEG-1、MPEG-2MPEG-2、MPEG-4MPEG-4、MPEG-7MPEG-7、MPEG-21MPEG-214 运动图像的数据压缩运动图像的数据压缩MPEG-1 MPEG-1 标准标准MPEG-1即“用于数字存储媒体运动图像及其伴音速率为1.5Mbps
23、的压缩编码”,于1992年正式出版。MPEG-1MPEG-1提供提供每秒30帧352*240分辨率的图像,MPEG-1 是VCD视频的压缩标准。MPEG-1的任务主要是,将视频信号及其伴音以可接收的重建质量压缩到约1.5Mbps的码率,并复合成一个单一的MPEG位流,同时保证视频和音频的同步。4 运动图像的数据压缩运动图像的数据压缩 MPEG-2 MPEG-2标准标准 MPEG-2 MPEG-2标准于标准于19941994年公布,包括系统部分、视频部分、音年公布,包括系统部分、视频部分、音频部分及符合性测试部分。频部分及符合性测试部分。MPEG-2MPEG-2编码标准希望囊括数字电视、图象通信
24、各领域的编编码标准希望囊括数字电视、图象通信各领域的编码标准,码标准,MPEG-2MPEG-2按压缩比大小的不同分成五个档次按压缩比大小的不同分成五个档次(profile)(profile),每一个档次又按图象清晰度的不同分成四种图象格式,或,每一个档次又按图象清晰度的不同分成四种图象格式,或称为级别称为级别(level)(level)。五个档次四种级别共有。五个档次四种级别共有2020种组合,但实际种组合,但实际应用中有些组合不太可能出现,较常用的是应用中有些组合不太可能出现,较常用的是1111种组合。种组合。MPEG-2 MPEG-2 是是DVDDVD视频的压缩标准。视频的压缩标准。每秒3
25、0帧704*480的分辨率4 运动图像的数据压缩运动图像的数据压缩 MPEG-4 标准 MPEG-MPEG-4 4标准于标准于1991998 8年公布,是为了播放流式媒体的年公布,是为了播放流式媒体的高质量视频而专门设计的,它可利用很窄的带度,采高质量视频而专门设计的,它可利用很窄的带度,采用了全新的压缩理念,通过帧重建技术,压缩和传输用了全新的压缩理念,通过帧重建技术,压缩和传输数据,以求使用最少的数据获得最佳的图像质量,并数据,以求使用最少的数据获得最佳的图像质量,并将之作为将之作为网络上传送网络上传送之用。之用。MPEG-4 MPEG-4 可把可把DVDDVD内内MPEG-2MPEG-2
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 多媒体 虚拟现实 人工智能