?? 視頻編碼新標(biāo)準(zhǔn)h.264的技術(shù)亮點(diǎn).txt
字號(hào):
摘要:
面向?qū)嶋H應(yīng)用,由ISO/IEC和ITU-T兩大國(guó)際標(biāo)準(zhǔn)化組織共同制定的H.264建議是
視頻編碼技術(shù)的新發(fā)展。它在多模式運(yùn)動(dòng)估計(jì)、整數(shù)變換、統(tǒng)一VLC符號(hào)編碼、分層
編碼語(yǔ)法等方面都有它的獨(dú)到之處。因此H.264算法具有很高的編碼效率,其應(yīng)用前
景應(yīng)是不言而喻的。
關(guān)鍵詞:視頻編碼 圖像通信 JVT
上個(gè)世紀(jì)80年代以來(lái),ISO/IEC制定的MPEG-x和ITU-T制定的H.26x兩大系列視頻
編碼國(guó)際標(biāo)準(zhǔn)的推出,開(kāi)創(chuàng)了視頻通信和存儲(chǔ)應(yīng)用的新紀(jì)元。從H.261視頻編碼建議
,到H.262/3、MPEG-1/2/4等都有一個(gè)共同的不斷追求的目標(biāo),即在盡可能低的碼率
(或存儲(chǔ)容量)下獲得盡可能好的圖像質(zhì)量。而且,隨著市場(chǎng)對(duì)圖像傳輸需求的增
加,如何適應(yīng)不同信道傳輸特性的問(wèn)題也日益顯現(xiàn)出來(lái)。這就是IEO/IEC和ITU-T兩
大國(guó)際標(biāo)準(zhǔn)化組織聯(lián)手制定的視頻新標(biāo)準(zhǔn)H.264所要解決的問(wèn)題。
H.261是最早出現(xiàn)的視頻編碼建議,目的是規(guī)范ISDN網(wǎng)上的會(huì)議電視和可視電話
應(yīng)用中的視頻編碼技術(shù)。它采用的算法結(jié)合了可減少時(shí)間冗余的幀間預(yù)測(cè)和可減少
空間冗余的DCT變換的混合編碼方法。和ISDN信道相匹配,其輸出碼率是p×64kbit
/s。p取值較小時(shí),只能傳清晰度不太高的圖像,適合于面對(duì)面的電視電話;p取值
較大時(shí)(如 p>6),可以傳輸清晰度較好的會(huì)議電視圖像。H.263 建議的是低碼率
圖像壓縮標(biāo)準(zhǔn),在技術(shù)上是H.261的改進(jìn)和擴(kuò)充,支持碼率小于64kbit/s的應(yīng)用。但
實(shí)質(zhì)上H.263以及后來(lái)的H.263+和H.263++已發(fā)展成支持全碼率應(yīng)用的建議,從它支
持眾多的圖像格式這一點(diǎn)就可看出,如Sub-QCIF、QCIF、CIF、4CIF甚至16CIF等格
式。
MPEG-1標(biāo)準(zhǔn)的碼率為1.2Mbit/s左右,可提供30幀CIF(352×288)質(zhì)量的圖像
,是為CD-ROM光盤(pán)的視頻存儲(chǔ)和播放所制定的。MPEG-l標(biāo)準(zhǔn)視頻編碼部分的基本算
法與H.261/H.263相似,也采用運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測(cè)、二維DCT、VLC游程編碼等措施
。此外還引入了幀內(nèi)幀(I)、預(yù)測(cè)幀(P)、雙向預(yù)測(cè)幀(B)和直流幀(D)等概
念,進(jìn)一步提高了編碼效率。在MPEG-1的基礎(chǔ)上,MPEG-2標(biāo)準(zhǔn)在提高圖像分辨率、
兼容數(shù)字電視等方面做了一些改進(jìn),例如它的運(yùn)動(dòng)矢量的精度為半像素;在編碼運(yùn)
算中(如運(yùn)動(dòng)估計(jì)和DCT)區(qū)分“幀”和“場(chǎng)”;引入了編碼的可分級(jí)性技術(shù),如空
間可分級(jí)性、時(shí)間可分級(jí)性和信噪比可分級(jí)性等。近年推出的MPEG-4標(biāo)準(zhǔn)引入了基
于視聽(tīng)對(duì)象(AVO:Audio-Visual Object)的編碼,大大提高了視頻通信的交互能
力和編碼效率。MPEG-4中還采用了一些新的技術(shù),如形狀編碼、自適應(yīng)DCT、任意形
狀視頻對(duì)象編碼等。但是MPEG-4的基本視頻編碼器還是屬于和H.263相似的一類(lèi)混合
編碼器。
總之,H.261建議是視頻編碼的經(jīng)典之作,H.263是其發(fā)展,并將逐步在實(shí)際上
取而代之,主要應(yīng)用于通信方面,但H.263眾多的選項(xiàng)往往令使用者無(wú)所適從。MPE
G系列標(biāo)準(zhǔn)從針對(duì)存儲(chǔ)媒體的應(yīng)用發(fā)展到適應(yīng)傳輸媒體的應(yīng)用,其核心視頻編碼的基
本框架是和H.261一致的,其中引人注目的MPEG-4的“基于對(duì)象的編碼”部分由于尚
有技術(shù)障礙,目前還難以普遍應(yīng)用。因此,在此基礎(chǔ)上發(fā)展起來(lái)的新的視頻編碼建
議H.264克服了兩者的弱點(diǎn),在混合編碼的框架下引入了新的編碼方式,提高了編碼
效率,面向?qū)嶋H應(yīng)用。同時(shí),它是兩大國(guó)際標(biāo)準(zhǔn)化組織的共同制定的,其應(yīng)用前景
應(yīng)是不言而喻的。
一、JVT的H.264
H.264是ITU-T的VCEG(視頻編碼專家組)和ISO/IEC的MPEG(活動(dòng)圖像編碼專家
組)的聯(lián)合視頻組(JVT:joint video team)開(kāi)發(fā)的一個(gè)新的數(shù)字視頻編碼標(biāo)準(zhǔn),
它既是ITU-T的H.264,又是ISO/IEC的MPEG-4的第10 部分。1998年1月份開(kāi)始草案征
集,1999年9月,完成第一個(gè)草案,2001年5月制定了其測(cè)試模式TML-8,2002年6月
的 JVT第5次會(huì)議通過(guò)了H.264的FCD板。目前該標(biāo)準(zhǔn)還在開(kāi)發(fā)之中,預(yù)計(jì)明年上半年
可正式通過(guò)。
H.264和以前的標(biāo)準(zhǔn)一樣,也是DPCM加變換編碼的混合編碼模式。但它采用“回
歸基本”的簡(jiǎn)潔設(shè)計(jì),不用眾多的選項(xiàng),獲得比H.263++好得多的壓縮性能;加強(qiáng)了
對(duì)各種信道的適應(yīng)能力,采用“網(wǎng)絡(luò)友好”的結(jié)構(gòu)和語(yǔ)法,有利于對(duì)誤碼和丟包的
處理;應(yīng)用目標(biāo)范圍較寬,以滿足不同速率、不同解析度以及不同傳輸(存儲(chǔ))場(chǎng)
合的需求;它的基本系統(tǒng)是開(kāi)放的,使用無(wú)需版權(quán)。
在技術(shù)上,H.264標(biāo)準(zhǔn)中有多個(gè)閃光之處,如統(tǒng)一的VLC符號(hào)編碼,高精度、多
模式的位移估計(jì),基于4×4塊的整數(shù)變換、分層的編碼語(yǔ)法等。這些措施使得H.26
4算法具有很的高編碼效率,在相同的重建圖像質(zhì)量下,能夠比H.263節(jié)約50%左右
的碼率。H.264的碼流結(jié)構(gòu)網(wǎng)絡(luò)適應(yīng)性強(qiáng),增加了差錯(cuò)恢復(fù)能力,能夠很好地適應(yīng)I
P和無(wú)線網(wǎng)絡(luò)的應(yīng)用。
二、H264的技術(shù)亮點(diǎn)
分層設(shè)計(jì)
H.264的算法在概念上可以分為兩層:視頻編碼層(VCL:Video Coding Layer
)負(fù)責(zé)高效的視頻內(nèi)容表示,網(wǎng)絡(luò)提取層(NAL:Network Abstraction Layer)負(fù)
責(zé)以網(wǎng)絡(luò)所要求的恰當(dāng)?shù)姆绞綄?duì)數(shù)據(jù)進(jìn)行打包和傳送。H.264編碼器分層結(jié)構(gòu)如圖1
所示。在VCL和NAL之間定義了一個(gè)基于分組方式的接口,打包和相應(yīng)的信令屬于NA
L的一部分。這樣,高編碼效率和網(wǎng)絡(luò)友好性的任務(wù)分別由VCL和NAL來(lái)完成。
VCL層包括基于塊的運(yùn)動(dòng)補(bǔ)償混合編碼和一些新特性。與前面的視頻編碼標(biāo)準(zhǔn)一
樣,H.264沒(méi)有把前處理和后處理等功能包括在草案中,這樣可以增加標(biāo)準(zhǔn)的靈活性
。
NAL負(fù)責(zé)使用下層網(wǎng)絡(luò)的分段格式來(lái)封裝數(shù)據(jù),包括組幀、邏輯信道的信令、定
時(shí)信息的利用或序列結(jié)束信號(hào)等。例如,NAL支持視頻在電路交換信道上的傳輸格式
,支持視頻在Internet上利用 RTP/UDP/IP傳輸?shù)母袷健AL包括自己的頭
部信息、段結(jié)構(gòu)信息和實(shí)際載荷信息,即上層的VCL數(shù)據(jù)。(如果采用數(shù)據(jù)分割技術(shù)
,數(shù)據(jù)可能由幾個(gè)部分組成)。
高精度、多模式運(yùn)動(dòng)估計(jì)
H.264支持1/4或1/8像素精度的運(yùn)動(dòng)矢量。在1/4像素精度時(shí)可使用6抽頭濾波器
來(lái)減少高頻噪聲,對(duì)于1/8像素精度的運(yùn)動(dòng)矢量,可使用更為復(fù)雜的8抽頭的濾波器
。在進(jìn)行運(yùn)動(dòng)估計(jì)時(shí),編碼器還可選擇“增強(qiáng)”內(nèi)插濾波器來(lái)提高預(yù)測(cè)的效果。
在H.264的運(yùn)動(dòng)預(yù)測(cè)中,一個(gè)宏塊(MB)可以按圖2被分為不同的子塊,形成7種
不同模式的塊尺寸。這種多模式的靈活和細(xì)致的劃分,更切合圖像中實(shí)際運(yùn)動(dòng)物體
的形狀,大大提高了運(yùn)動(dòng)估計(jì)的精確程度。在這種方式下,在每個(gè)宏塊中可以包含
有1、2、4、8或16個(gè)運(yùn)動(dòng)矢量。
在H.264中,允許編碼器使用多于一幀的先前幀用于運(yùn)動(dòng)估計(jì),這就是所謂的多
幀參考技術(shù)。例如2幀或3幀剛剛編碼好的參考幀,編碼器將選擇對(duì)每個(gè)目標(biāo)宏塊能
給出更好的預(yù)測(cè)幀,并為每一宏塊指示是哪一幀被用于預(yù)測(cè)。
4×4塊的整數(shù)變換
H.264與先前的標(biāo)準(zhǔn)相似,對(duì)殘差采用基于塊的變換編碼,但變換是整數(shù)操作而
不是實(shí)數(shù)運(yùn)算,其過(guò)程和DCT基本相似。這種方法的優(yōu)點(diǎn)在于:在編碼器中和解碼器
中允許精度相同的變換和反變換,便于使用簡(jiǎn)單的定點(diǎn)運(yùn)算方式。也就是說(shuō),這里
?? 快捷鍵說(shuō)明
復(fù)制代碼
Ctrl + C
搜索代碼
Ctrl + F
全屏模式
F11
切換主題
Ctrl + Shift + D
顯示快捷鍵
?
增大字號(hào)
Ctrl + =
減小字號(hào)
Ctrl + -