首先,传输数字图像所需的带宽远窄于未压缩图像。例如,NTSC图像以大约640 x 480的分辨率,24bits/象素,每秒30帧的质量传输时,其数据率达28M字节/秒或221M位/秒。此外,NTSC声音信号还要使未压缩图像的比特率再增加一些。然而单速CD-ROM(1x)驱动器只能以1.2M位/秒的速率传输数据。
第二个原因是以28M字节/秒的速率,15秒的未压缩图像将占用420M字节的内存空间,这对于大多数只能处理小图像片断的台式计算机来说都是不可接受的。
当今把图像加入电子信号的关键问题是压缩方式。有几种不同的压缩方式,但MPEG是最有市场潜力的压缩方式
MPEG沿革
MPEG(即Moving Picture Experts Group运动图像专家小组)是个国际标准,即所谓ISO11172。它的两个标准─MPEG-1和MPEG-2特别重要。MPEG-1于1991年引入,用于加速CD-ROM中图像的传输。它的目的是把221Mbit/秒的NTSC图像压缩到1.2Mbit/秒,压缩率为200:1。这是图像压缩的工业认可标准。
MPEG-2用于宽带传输的图像,图像质量达到电视广播甚至HDTV的标准。和MPEG-1相比,MPEG-2支持更广的分辨率和比特率范围,将成为数字图像盘(DVD)和数字广播电视的压缩方式。这些市场将和计算机市场交织在一起,从而使MPEG-2成为计算机的一种重要的图像压缩标准。这一点非常重要,因为将MPEG-1的比特流解压缩时需要用到MPEG-2的解压缩器。另一标准MPEG-4正在发展中,它将支持非常低的比特率的数据流的应用,如电视电话,视频邮件和电子报刊等。
对MPEG的广泛接受意味着对它的使用者的投资保护。许多零售商出售MPEG的软件或硬件播放器,这种竞争造成了价格的下降和质量的上升。MPEG-1可以和MPEG-2兼容,因此它是一种尚有发展余地的标准。
MPEG如何工作
MPEG-1的特点是它是一种有损的,非平衡编码。有损意味着为达到低比特率,一些图像和伴音信息将丢失。通常这些信息是人眼和人耳最不敏感的信息,因此即使以1x CD-ROM的速率压缩也能达到VHS的图像质量和高保真立体声的效果。MPEG采用非平衡编码意味着压缩一幅图像比解压缩慢的多。
MPEG-1的数据流包含3种成分:图像流,伴音流和系统流。图像流仅仅包含画面信息,伴音流包含声音信息,系统流实现图像和伴音的同步。所有播放MPEG图像和伴音数据所需的时钟信息都包含在系统流中。
MPEG用复杂的数学和心理学技术达到它的压缩结果。MPEG伴音压缩编码利用了人耳灵敏度的研究结果,图像编码利用人眼对亮度,颜色,运动的灵敏度的一些有利结果。
MPEG伴音
CD伴音两个通道共包含1.4Mbit/秒的数据流。听觉心理学研究表明,采用适当的压缩技术,此数据流可以压缩到256Kbit/秒而不会感觉到任何失真。MPEG伴音利用这个结果,尽管一些MPEG压缩器不支持高质量图像。
MPEG伴音编码可以实现3种压缩等级。等级I是简单压缩,它是一种听觉心理学模型下的亚抽样编码。等级II加入了更高的精度,等级III加入了非线性量化,Huffman编码和其他实现低速率高保真图像的先进技术。依次下去的等级提供了高质量和越来越高的压缩率,但要求计算机有越来越强的压缩能力。MPEG等级II可以把一个1.4Mbit/秒的立体声数据流压缩到32Kbit/秒-384Kbit/秒而保持高保真的声音。典型数据为,等级I的目标是每个通道192Kbit/秒,等级II的目标是每个通道128Kbit/秒,等级III的目标是每个通道64Kbit/秒。目标II要达到64Kbit/通道时不如等级III效果好,而在128Kbit/通道,等级II和等级III的效果一样,而且都比等级I效果好。正如上面所说的,每通道128Kbit/秒或者说两通道256Kbit/秒可以达到很好的保真度。因此,等级II对于高保真立体声音响是必要的,但也已足够了。
MPEG-1支持设置为单声道,双声道,立体声或联合立体声的两个声音通道,等级II的联合立体声把声音信号的高频部分(高于2KHz)结合起来,立体图像整个保存下来,但仅传输瞬时包络。等级I不支持两和立体声。有些MPEG压缩器不能产生等时II的伴音流,从而声音保真度较低而且没有联合立体声功能。
MPEG图像
MPEG图像编码包含3个成分:I帧,P帧和B帧。MPEG编码过程中,一些图像压缩成I帧,一些压缩成P帧,另一些压缩成B帧。I帧压缩可以得到6;1的压缩比而不产生任何可觉察的模糊现象。I帧压缩的同时使用P帧压缩,可以达到更高的压缩比而无可觉察的模糊现象。B帧压缩可以达到200:1的压缩比,其文件尺寸一般为I帧压缩尺寸的15%,不到P帧压缩尺寸的一半。I帧压缩去掉图像的空间冗余度,P帧和B帧去掉时间冗余度,下文将进一步解释。
I帧压缩采用基准帧模式,只提供帧内压缩,即把帧图像压缩到I帧时,仅仅考虑了帧内的图像。I帧压缩不能除去帧间冗余度。帧内压缩基于离散余弦变换(DCT),类似于JPEG和H.261图像中使用DCT的压缩标准。
P帧采用预测编码,利用相邻帧的一般统计信息进行预测。也就是说,它考虑运动特性,提供帧间编码。P帧预测当前帧与前面最近的I帧或P帧的差别。
B帧为双向帧间编码。它从前面和后面的I帧或P帧中提取数据。B帧基于当前帧与前一帧和后一帧图像之间的差别进行压缩。
MEPG数据流开始时对CCIR-601规定的SIF分辨率的未压缩数字图像进行抽样。SIF分辨率,对于NTSC制,就是亮度信号为352 x 240各像素,每个色度信号都为176 x 120个象素。各信号都是每秒30帧。MPEG压缩器决定了当前帧以I帧,P帧还是B帧。帧确定之后就采用DCT变换,对结果进行量化,舍入,行程编码即变长编码。编码后的典型图像帧序为:IBBPBBPBBPBBIBBPBBPBBPBBI…
B帧和P帧要求计算机有更强的功能。有些压缩器不能产生B帧或者连P帧也不能产生,则图像的压缩结果将有很明显的间断。