加入收藏
 免费注册
 用户登陆
首页 展示 供求 职场 技术 智造 职业 活动 视点 品牌 镨社区
今天是:2024年5月16日 星期四   您现在位于: 首页 →  技术 → 家庭电子(技术聚焦)
MPEG全景图
2007/7/9 16:11:34    产通学院,365PR NET

MPEG是Motion Picture Experts Group的缩写,中文名称为“运动图像专家组”,是世界著名的数字视频和音频压缩的标准化组织。MPEG组织制定了可用于数字存储介质上的视频、音频的国际标准,简称MPEG系列标准,具体应用涵盖传统存储设备、CD-ROM、DVD、数字音频磁带(DAT)、磁带设备、硬盘、可写光盘、以及电信通道如综合服务网(IDSN)和局域网等。MPEG组织制定的这些标准,如MPEG-2、MPEG-4、MPEG-7和MPEG-21,对视频和音频技术的发展产生了深远的影响。

近几年来,为了摆脱专利技术受制于人的被动局面,以信息产业部科学技术司为主导的中国数字音视频产业于2002年6月开始筹备“数字音视频编解码标准工作组”,制订了一套拥有自主知识产权的“信息技术先进音视频编码”系列标准(AVS),并得到了主流厂商的认可。本文主要介绍了MPEG-1(ISO/IEC-11172)、MPEG-2(ISO/IEC-13818)、MPEG-4(ISO/IEC-14496)、MPEG-7、MPEG-21以及AVS标准的技术特点及应用趋势。


MPEG-1

MPEG-1是最早的多媒体运动图像和伴音的数据压缩编码标准。MPEG-1实际上包括三个部分:MPEG-1视频、MPEG-1音频和MPEG-1系统。MPEG-1标准是大家接触得最多的标准之一,具有以下特点:随机访问;灵活的帧率;可变的图像尺寸;定义了I-帧、P-帧和B-帧;运动补偿可跨越多个帧;半像素精度的运动向量;量化矩阵;GOF结构;slice结构等。

MPEG-1是现在的VideoCD和MP3的基础,可以将移动图像和相关的声音压缩成数字存储文件,文件处理速度可以达1.5Mbps以上,广泛应用在VCD制作和一些视频片段下载的网络应用中。可以毫不夸张的说,99%的VCD都是用MPEG-1格式压缩的。值得注意的是,VCD2.0并不是说明VCD是用MPEG-2压缩的。使用MPEG-1压缩算法,可以把一部120分钟长的电影压缩到1.2 GB左右大小。但是,MPEG-1算法理论虽然已经非常成熟,技术上却很难克服噪声、雪花和“鬼影”对压缩图像质量的影响,对于劣质的视频信号源,MPEG-1算法会将噪声和缺陷放大,使图形图像进一步恶化,这就使得MPEG-1压缩方法对视频节目源有一定的要求。

由于VCD采用MPEG-1算法对视频图像进行压缩,因此其图像质量将主要取决于节目源的质量,在制作VCD节目时最好使用高质量的视频节目源,并尽量使用源带,因为录像带每复制一次就增加一次背景噪声,噪声会大大增加每帧数据量而影响压缩图像的质量。


MPEG-2

MPEG-2于1994年由MPEG工作组发布的视频和音频压缩国际标准。MPEG-2通常用来为广播信号提供视频和音频编码,包括数字卫星电视、有线电视等。经过少量修改后,MPEG-2也成为DVD产品的核心技术。使用MPEG-2压缩算法,可以将一部120分钟长的电影(未视频文件)压缩到4~8GB的大小。

MPEG-2技术是一种高质量视频压缩标准,最显著的特征之一是通用性,即不依赖于特定的应用。MPEG-2由9部分组成,见图3。其中,第一部分即系统描述部分定义了传输流,它采用一套在非可靠介质上传输数字视频信号和音频信号的机制,主要用在广播电视领域。

MPEG-2的第二部分即视频部分和MPEG-1类似,但是它提供对隔行扫描视频显示模式的支持(隔行扫描广泛应用在广播电视领域)。MPEG-2视频并没有对低比特率(小于1Mbps)进行优化,在3Mbit/s及以上比特率情况下,MPEG-2明显优于MPEG-1。MPEG-2向后兼容,也即是说,所有符合标准的MPEG-2解码器也能够正常播放MPEG-1视频流。MPEG-2技术也应用在了HDTV传输系统中。

MPEG-2的第三部分定义了音频压缩标准。该部分改进了MPEG-1的音频压缩,支持两通道以上的音频。MPEG-2音频压缩部分也保持了向后兼容的特点。

MPEG-2的第七部分定义了不能向后兼容的音频压缩。该部分提供了更强的音频功能。通常我们所说的MPEG-2AAC指的就是这一部分。

MPEG-2核心技术大约涉及640个专利,这些专利主要集中在20间公司和一间大学,如Alcatel、佳能、哥伦比亚大学、法国电信(CNET)、富士通、General Electric Capital Corporation、General Instrument Corp.、GE Technology Development, Inc.、日立、KDDI、朗讯科技、LG电子、Matsushita、三菱、日本电信电话(NTT)、Philips、Robert Bosch GmbH、三星、三洋电气、Scientific Atlanta、夏普、索尼、Thomson Licensing S.A.、东芝、JVC等。


MPEG-4

早在1993年,MPEG组织就开始制定MPEG-4,直到1998年10月方才定案,并于1999年2月正式公布了为国际标准的MPEG-4(ISO/IEC14496)第一版本,同年年底MPEG-4第二版亦告底定,且于2000年年初正式成为国际标准。

MPEG-4是一种新的压缩算法,主要用途在于网上(串流媒体)及光盘分发,语音传送(视像电话),以及电视广播。使用这种算法的ASF格式可以把一部120分钟长的电影(未视频文件)压缩到300M左右的视频流,可供在网上观看。MPEG-4已经不再是个单纯的视频音频编解码标准,它更多定义的是一种格式和框架,而不是具体的算法,从而为多媒体数据压缩提供了一个更广泛的平台,能满足三种族群的需求—多媒体内容创作者、网络服务供货商和终端消费者。

(1)MPEG-4的组成

MPEG-4由一系列的子标准组成,被称为部,包括下面的部分:
第一部 (ISO/IEC 14496-1):系统,描述视频和音频的同步,以及复用方式(multiplexing)。
第二部 (ISO/IEC 14496-2):视频,定义了一个对各种视觉信息(包括视频、静止纹理、计算机合成图形等等)的编解码器。对视频部分来说,众多“Profiles”中很常用的一种是Advanced Simple Profile (ASP)。
第三部 (ISO/IEC 14496-3):音频,定义了一个对各种音频信号进行编码的编解码器的集合。包括高级音频编码(AAC for Advanced Audio Coding)的若干变形和其他一些音频/语音编码工具。
第四部 (ISO/IEC 14496-4):一致性,定义了对本标准其他的部分进行一致性测试的程序。
第五部 (ISO/IEC 14496-5):参考软件,提供了用于演示功能和说明本标准其他部分功能的软件。
第六部 (ISO/IEC 14496-6):多媒体传输集成框架(DMIF for Delivery Multimedia Integration Framework)。
第七部 (ISO/IEC 14496-7):优化的参考软件,提供了对实现进行优化的例子。(这里的实现指的是第五部分)。
第八部 (ISO/IEC 14496-8):在IP网络上传输,定义了在IP网络上传输MPEG-4内容的方式。
第九部 (ISO/IEC 14496-9):参考硬件,提供了用于演示怎样在硬件上实现本标准其他部分功能的硬件设计方案。
第十部 (ISO/IEC 14496-10):先进视频编码(AVC for Advanced Video Coding),定义了一个被称为AVC的视频编解码器,有时被称为MPEG-4 AVC。从技术上讲,MPEG-4 AVC和ITU-T H.264标准是一致的。
第十二部 (ISO/IEC 14496-12):基于ISO的媒体文件格式,定义了一个存储媒体内容的文件格式。
第十三部 (ISO/IEC 14496-13):知识产权管理和保护(IPMP for Intellectual Property Management and Protection)拓展。
第十四部 (ISO/IEC 14496-14):MPEG-4文件格式,定义了基于第十二部分的用于存储MPEG-4内容的容器文件格式。
第十五部 (ISO/IEC 14496-15):AVC文件格式,定义了基于第十二部分的用于存储第十部分的视频内容的文件格式。
第十六部 (ISO/IEC 14496-16):动画框架扩展(AFX for Animation Framework eXtension)。
第十七部 (ISO/IEC 14496-17):同步文本字幕格式 (尚未完成,2005年1月达成“最终委员会草案(FCD for Final Committee Draft)”。
第十八部 (ISO/IEC 14496-18):字体压缩和流式传输(针对公开字体格式)。
第十九部 (ISO/IEC 14496-19):综合用材质流(Synthesized Texture Stream)。
第二十部 (ISO/IEC 14496-20):简单场景表示(LASeR for Lightweight Scene Representation)(尚未完成,2005年1月达成“最终委员会草案(FCD for Final Committee Draft)”。
第二十一部 (ISO/IEC 14496-21):用于描绘(Rendering)的MPEG-J拓展(尚未完成,2005年1月达成“委员会草案(CD for Committee Draft)”。

(2)MPEG-4的市场应用

对多媒体内容创作者而言,MPEG-4使多媒体内容更多元化、更具有弹性,且多媒体组件更容易被再利用。它能将现今各自发展的技术及应用,如互联网、动画、视频、音频、交互电视等,整合至单一架构之下,进而提供更佳的资源管理方法和保护著作权的机能。MPEG-4标准前进之脚步并未因第二版的出现而暂缓,不断有新的增加及修改,进一步扩展此标准所涵盖范畴及应用领域。例如,2001年初于修订三中加入了Studio Profile。Studio Profile将比特率进一步提升至1.2Gb/s,而分辨率则可达到4000×2000像素,如此使得MPEG-4标准得以延伸至电视电影专业影片制作领域。
 
对网络服务供货商而言,MPEG-4是透明度很高的信息传递工具。它可以藉由与其它国际标准的兼容相通而存在于各种形式网络上,如宽带电信网络、有线电视网络以及无线传输等。尤其在单纯以视频音频传输为主的应用中,尽管位速率约为MPEG-2视带大小的十分之一,但是播放的质量几乎没有改变。这表示MPEG-4比MPEG-2有更高的带宽使用效率,在终端处可增加同时播放用户之数量而视频效果仍可保持。
 
对终端消费者而言,MPEG-4能让消费者在原创作者限定的操作功能范围之内,与节目内容中之对象交互,体会前所未有的娱乐效果。而且在低传输率、移动式的网络中,MPEG-4能使多媒体应用得以发挥。这包括了交互式多媒体广播和移动通讯等。

所以,与MPEG-1和MPEG-2视频标准的功能相较之下,除了传统的数字视频编译码的功能之外,MPEG-4更具备了许多引人注目的功能,包括有以对象内容为基础的视频对象存取、以场景内容为基础的可升级性、视频存取、纠错能力等等。MPEG-4视频标准不仅可以提供一个更具压缩效率的新多媒体信息传输标准,同时也可以达成更好的交互性、全方位存取以及强劲的纠错能力。

(3)MPEG-4 AVC及其应用

H.264有时称为MPEG-4 AVC,实际上是MPEG-4的第十部分,是由ITU-T视频编码专家组(VCEG)和ISO/IEC运动图像专家组(MPEG)联合组成的联合视频组(Joint Video Team,JVT)提出的高度压缩数字视频编解码器标准。ITU-T的H.264标准和ISO/IECMPEG-4第10部分(正式名称是ISO/IEC 14496-10)在编解码技术上是相同的,这种编解码技术也被称为AVC,即高级视频编码(Advanced Video Coding)。该标准第一版的最终草案(FD)已于2003年5月完成。

和MPEG的其它视频标准一样,H.264/AVC也提供了一个参考软件,并可以免费下载。它的主要目的是提供一个演示H.264/AVC各种功能的演示平台,而不是作为一个直接的应用平台(在後面的链接部分可以找到下载的地址)。目前在MPEG也同时在进行一些硬件参考设计的实现。

目前,MPEG-4的技术授权费让许多运营商难以认同,不光是费用问题,就连计费方式也遭到强烈质疑,在最初的授权预案中,如果电视内容的营运商要以MPEG-4格式来播放节目,则每分钟要支付0.000333美元,或者是以每年每个收视用户收取0.25美元。同样,DVD在发表之初的数年几乎是难以推广,主要原因也一样归咎于授权或专利费用。经过几年后,DVD的授权与专利有了进一步的妥协,DVD才有今日的普及,所以从这个角度看MPEG-4授权实已成为一种“欧美常态”,只不过运营商不再愿意等待了,部分已经开始采用其它标准,如中国的AVS等。


MPEG-7

国际标准化组织(ISO)在制定MPEG-1、MPEG-2及MPEG-4的标准基础上,推出了新的标准MPEG-7,该标准的正式名称为“多媒体内容描述接口”(Multimedia Content Description Interface), 其目标就是产生一种描述多媒体内容数据的标准,满足实时、非实时以及推-拉应用的需求,它既不同于基于波形和基于压缩的表示方式如MPEG-1和MPEG-2,又不同于基于对象的表示方式如MPEG-4,而是将对各种不同类型的多媒体信息进行标准化描述,并将该描述与所描述的内容相联系,以实现快速有效的搜索。

(1)MPEG-7的主要元素

MPEG-7描述了包括自由文本、n维时空结构、统计信息、客观属性、主观属性、生产属性和组合信息。对于视觉信息,描述可能包括颜色、视觉对象、纹理、草图、形状、体积、空间关系、运动及变形等。对于音频信息,描述可能包括音调、调式、音速、音速变化等。它根据信息的抽象层次,提供一种描述多媒体材料的方法以便表示不同层次的用户对信息的需求,并支持数据管理的灵活性、数据资源的全球化和互操作性。MPEG-7的主要元素包括以下几种:
(1)描述工具,包括一组描述符D(Descriptor )和描述方案DS(Description Schemes )。描述符是指用来定义和表达实体某一方面特征的句法或语法。表达实体是由特征标识符(如颜色)和数据类型(如字符串)等构成的。数据类型可以是“复合”的,既可以由几个数据类型的组合来构成,也可以由数个D来“描述”一个特征。描述方案是由一个或多个D和DS构成,DS规定了它们相互关系的结构和语法。
(2)描述定义语言DDL(Description Definition Language),用来指定描述方案的一种语言。它是一种模式化语言,是对音视频数据建模结果的一种表征。DDL规定了MPEG的描述工具,包括描述符和描述方案,并提供了把描述符构建为描述方案的规则。DDL同时也允许定义特殊应用中的扩展DS. 描述工具通过DDL被实例化,并以文本格式(XML)被描述。
(3)用来支持多路描述、同步问题、传输机理、文件格式等的系统工具。

(2)MPEG-7的主要应用

MPEG-7的主要应用包括“Pull”(拉)和“Push”(推)。这两类应用与社会的政治和经济有着密切的联系,在教育、影视等专业领域和消费应用的不同场合都是必不可少的。

(1)Pull类应用:MPEG-7标准产生的目的是要定义一种规范,使对AV资料的查询变得和现在的文本查询一样方便。尽管其公认的多媒体内容描述的应用远不止“获取”这一种,但它还是作为许多原始的MPEG-7应用而保留下来。这些“获取”,即“Pull”类型的应用涉及到数据库、多媒体信息档案以及基于网络的Intenet模型(用户向服务器索取资料)。MPEG-7的Pull类应用包括:商业音乐类应用(卡拉OK和音乐销售)、声音效果库、历史数据库、通过可回忆的听觉事件进行电影场景“搜索”。

(2)Push型应用:

“Push”与“Pull”类型的应用是相反的,“Push”类型应用更像是广播方式,以及刚出现的网络广播。“Pull”模型是从索引到“搜索”,“Push”模型是从选择到“过滤”。这两类应用有着完全不同的要求,通常“Pull”处理的是存储在数据库里的静态信息“描述”,而“Push”处理的是变化的动态信息“描述”。“Push”,即“过滤”的要求是提供用户只想收看或收听到的多媒体信息。

如在数字系统中(包括数据广播),MPEG-7描述可以帮助用户选择节目和各类数据广播信息,用于当时或以后观看,以及记录、存贮。在个性化广播系统的环境中,提供给用户的数据可以按照各自的类型从数据广播中“过滤”出来,而类型的生成可以是自动的(如根据地点、年龄、性别、或以前的选择行为等),也可以是半自动的(如根据预设的兴趣等)。


MPEG-21

随着越来越多数字化媒体的出现,拥有一个先进的多媒体解决方案就变得至关重要了。这不仅是技术上的考虑,同时也是个人应用的需要。所有“内容提供商(content creator)”都有共同的关注目标:内容的管理、版权的保护、对非授权接入和修改防范以及对于提供商和使用者隐私的保护。所有这些需求激发了MPEG-21 Multimedia Framework的出现和发展,该标准正是致力于在大范围的网络上实现透明的传输和对多媒体资源的充分利用。

MPEG-21基于两个基本概念:分布和处理基本单元DI(the Digital Item)以及DI与用户间的互操作。MPEG-21也可表述为:以一种高效、透明和具有互操作性的方式支持用户交换、接入、使用甚至操作DI的技术。

MPEG首先制定了一个技术报告(MPEG-21第一部分)。接着,在MPEG-21的标准化进程中,MPEG不断考虑使协议基于需求之上,形成了MPEG-21标准的不同组成部分(如ISO/IEC 21000-N)。现在,MPEG的第二和第三部分主要是针对DI的声明和定义,而第四、五和第六部分主要针对IPMP等相关问题。第七部分,DIA(Digital Item Adaptation)与UMA(universal multimedia access)相关。

其中,第一部分“前景、技术和策略(Vision,Technologies,and Strategy)”在2001年9月正式被批准。它主要提供了框架的定义并介绍了用户和DI的概念,用于反映该技术标准的根本目的。MPEG-21的第一部分主要包括:为多媒体框架定义“前景”,使得在大范围内针对不同的终端和网络实现透明传输和对多媒体资源更充分的利用,以满足所有用户的要求;实现器件和标准间的集成,以达到DI的产生、管理、传输、控制、分布和使用技术之间的协调一致;制定一个策略,通过定义好的规范和标准,满足不同用户的需求。

第二部分DID(Digital Item Declaration)包括视频、音频、文本和图形等媒体源。对于所有MPEG-21系统来说,DI的确切含义都是很重要的。但要想为DI定义一个精确的定义,同时满足如此众多的文件格式的要求,将是十分困难的。

第三部分DII(Digital Item Identification)以标准化的形式来描述特定地点中与之相关的DI、容器、器件和片断等。在MPEG-21的框架中DI通过将统一的源标识符(URI-Uniform Resource Identifiers)压缩成标识元素来进行区分。
 
第四部分IPMP(Intellectual Property Management and Protection)定义了一个互操作的框架。此部分包括从远程位置重新获得IPMP工具以及在IPMP工具之间、IPMP和终端之间交换信息的标准方法。它提出了IPMP工具的认证,同时实现了权力数据字典(Rights Data Dictionary)和权力表达语言(Rights Expression Language)二者的集成。

第五部分REL(Rights Expression Language)是一种机器解释语言,可以提供灵活互操作的机制。它同时支持接入的规范和对数字内容的使用控制。REL也为个人数据提供灵活的互操作机制,满足个人的要求,保证个人的权益。
 
第六部分RDD(Rights Data Dictionary)是一个关键术语的字典,其中存放了描述那些控制DI的用户的不同权力。它包含一系列清晰、连贯、结构化和集成的术语,用来支持MPEG-21的REL。RDD规定了字典的结构和核心,同时也规定了如何在注册授权的管理之下进一步定义术语。为了能在REL中使用,RDD提供了术语的定义;同时,RDD系统支持元数据从一个命名空间到另一个命名空间的映射和转换,这种变换是基于自动或部分自动方式的,而且语义集成的不确定性和损耗最小。

MPEG-21致力于为多媒体传输和使用定义一个标准化的开放框架。这种框架将在开放的市场中为内容提供商和业务提供商创造同等的机会。同时,这将在一种互操作的模式下为用户提供更丰富的信息,用户将因此而受益。MPEG-21应用前景可以总结为:一个多媒体框架,如内容管理、版权保护、对非授权接入和修改防范以及对于提供商和使用者隐私的保护。

→ 『关闭窗口』
 dav
 [ → 我要发表 ]
上篇文章:增强型EDID 本地化字符串扩展(LS-EXT)标准Release A
下篇文章:新型背投灯泡中的金属灯杯
→ 主题所属分类:  家庭电子 → 技术聚焦
 热门文章
 如何申请EtherCAT技术协会(ETG)会员资格 (167029)
 台北国际计算机展(COMPUTEX 2015)参展商名… (104325)
 上海市集成电路行业协会(SICA) (90733)
 USB-IF Members Company List (82657)
 第十七届中国专利优秀奖项目名单(507项) (74301)
 台北国际计算机展(COMPUTEX 2015)参展商名… (67891)
 苹果授权MFi制造商名单-Authorized MFi Lic… (67219)
 中国130家太阳能光伏组件企业介绍(3) (55226)
 PLC论坛 (52159)
 中国130家太阳能光伏组件企业介绍(2) (48504)
 最近更新
 英特尔用于下一代先进封装的玻璃基板(Glass Subs… (4月29日)
 EUV光刻技术回眸:Trumpf、Zeiss和ASML的… (4月3日)
 为Al设计的NPU与其他处理器共同加速生成式AI体验 (3月9日)
 英特尔为未来数据中心开发的处理器芯片新技术 (2月23日)
 压电技术使手机屏幕直接变成高质量话筒 (2月14日)
 PCB基础知识及设计软件概述 (2月2日)
 国家文化和科技融合示范基地名单(含第五批) (1月24日)
 国家文化和科技融合示范基地认定管理办法(试行) (1月24日)
 隐身衣逐步走进现实:光学隐身衣、电磁波隐身衣 (10月30日)
 电子电路常用电子元件名称缩写及中英文对照 (10月17日)
 文章搜索
搜索选项:            
  → 评论内容 (点击查看)
您是否还没有 注册 或还没有 登陆 本站?!
关于我们 ┋ 免责声明 ┋ 产品与服务 ┋ 联系我们 ┋ About 365PR ┋ Join 365PR
Copyright @ 2005-2008 365pr.net Ltd. All Rights Reserved. 深圳市产通互联网有限公司 版权所有
E-mail:postmaster@365pr.net 不良信息举报 备案号:粤ICP备06070889号