第4章 限失真信源編碼_第1頁(yè)
已閱讀1頁(yè),還剩148頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第4章 限失真信源編碼,4.1 連續(xù)信源的熵和互信息 4.2 信息率失真理論 4.3 標(biāo)量量化編碼 4.4 矢量量化編碼 4.5 語(yǔ)音壓縮編碼 4.6 圖像壓縮編碼,4.1 連續(xù)信源的熵和互信息,前面研究的信源都是取值為有限或可數(shù)的離散信源,這些信源輸出的消息屬于時(shí)間離散、取值有限或可數(shù)的隨機(jī)序列,其統(tǒng)計(jì)特性可以用聯(lián)合概率分布來(lái)描述。而實(shí)際某些信源的輸出常常是時(shí)間和取值都連續(xù)的消息。例如,語(yǔ)音信號(hào)、電視信號(hào)等都是時(shí)間的連續(xù)

2、波形,而且,在某一固定時(shí)刻,它們的可能取值也是連續(xù)的,這樣的信源稱(chēng)為隨機(jī)波形信源。,隨機(jī)波形信源輸出的消息是隨機(jī)的,因此,可用隨機(jī)過(guò)程來(lái)描述。用隨機(jī)過(guò)程描述其輸出消息的信源稱(chēng)為隨機(jī)波形信源。若信源輸出用平穩(wěn)連續(xù)型隨機(jī)序列來(lái)描述,則此信源稱(chēng)為連續(xù)平穩(wěn)信源。連續(xù)平穩(wěn)信源也可分為連續(xù)平穩(wěn)無(wú)記憶信源和連續(xù)平穩(wěn)有記憶信源。平穩(wěn)連續(xù)型隨機(jī)序列中每個(gè)自由度上的變量是連續(xù)隨機(jī)變量。用連續(xù)隨機(jī)變量描述其輸出消息的信源稱(chēng)為連續(xù)信源。下面討論它們的信息測(cè)度。

3、,連續(xù)信源基本的數(shù)學(xué)模型為,其中 R是全實(shí)數(shù)集,是連續(xù)變量X的取值范圍,p(x)為x的概率密度。 定義連續(xù)信源的熵(差熵)為,(4―1),式(4―1)定義的連續(xù)信源的熵并不是實(shí)際信源輸出的絕對(duì)熵,連續(xù)信源的絕對(duì)熵應(yīng)該再加上一項(xiàng)無(wú)限大的常數(shù)項(xiàng)。因?yàn)檫B續(xù)信源的可能取值有無(wú)限多個(gè),若其取值是等概率分布的,那么,信源不確定性為無(wú)限大。當(dāng)確知輸出為某值后,所獲得的信息量也將為無(wú)限大??梢?jiàn),h(X)已不能代表信源的平均不確定性

4、大小,也不能代表連續(xù)信源輸出的信息量。,同理,可定義兩個(gè)連續(xù)變量X,Y的聯(lián)合熵和條件熵:,(4―2),(4―3),(4―4),這樣定義的差熵具有可加性、凸?fàn)钚院蜆O值性,不存在非負(fù)性和變換不變性等。 設(shè)基本連續(xù)信道如圖4―1所示。其輸入和輸出都是單個(gè)連續(xù)型隨機(jī)變量的信道??捎媚P蛖X,p(y|x),Y}來(lái)描述單符號(hào)連續(xù)信道。X是輸入連續(xù)型隨機(jī)變量,X取值區(qū)間為[a,b]或?qū)崝?shù)域 R;Y是信道輸出連續(xù)型隨機(jī)變量,取

5、值區(qū)間為[a′,b′]或?qū)崝?shù)域 R;信道的傳遞概率密度函數(shù)為p(y|x),并滿(mǎn)足:,(4―5),信道輸入X滿(mǎn)足:,(4―6),(4―7),信宿接收Y滿(mǎn)足:,定義X和Y之間的平均互信息量為,(4―8),(4―9),(4―10),連續(xù)信道的平均互信息量和離散信道下平均互信息量的關(guān)系式完全類(lèi)似,且保留了離散信道平均互信息量的所有含義和性質(zhì)??梢?jiàn),將差熵定義為連續(xù)信源的熵是有重要實(shí)際意義的。 單符號(hào)連續(xù)信道的信息傳輸率

6、: R=I(X;Y), 比特/自由度 (4―11) 多維連續(xù)信道平均互信息等相關(guān)內(nèi)容可參見(jiàn)有關(guān)文獻(xiàn)。,4.2 信息率失真理論,4.2.1 失真函數(shù) 由于只涉及信源編碼問(wèn)題,所以可以將信道編碼和譯碼看成是信道的一部分。這樣信宿收到消息的失真(或誤差)只是由信源編碼帶來(lái)的。從直觀感覺(jué)可知,若允許失真越大,信息傳輸率可越小;若允許失真越小,信息傳輸率需越大。所以信息傳輸

7、率與信源編碼所引起的失真(或誤差)是有關(guān)的。,為了定量地描述信息傳輸率和失真的關(guān)系,可以略去廣義的無(wú)擾信道,所謂廣義無(wú)擾信道,是指把信道編碼、信道、信道譯碼這三部分看成一個(gè)沒(méi)有任何干擾的廣義信道。另一方面用虛擬手法拿信道來(lái)表示失真信源編碼的作用,把信源編碼和信源譯碼等價(jià)成一個(gè)信道,由于是失真編碼,所以信道不是一一對(duì)應(yīng)的,用信道傳遞概率描述編、譯碼前后關(guān)系,這樣通信系統(tǒng)可簡(jiǎn)化為如圖4―2所示。,圖 4―2,設(shè)離散無(wú)記憶信源:,信源符號(hào)通過(guò)

8、信道傳輸?shù)浇邮斩?,則接收端接收變量為,對(duì)應(yīng)于一對(duì)(u,v),定義一個(gè)非負(fù)函數(shù):d(ui,vj)≥0, i=1,2,…,n;j=1,2,…,m (4―12) 稱(chēng)此函數(shù)為失真函數(shù)(或稱(chēng)單個(gè)符號(hào)失真度)。它用來(lái)測(cè)度信源發(fā)出一個(gè)符號(hào)ui,而接收端收到一個(gè)符號(hào)vj時(shí)所引起的誤差或失真。,由于信源U有n個(gè)符號(hào),而接收變量V有m個(gè)符號(hào),所以d(ui,vj)就有n×m個(gè),這n×m個(gè)非負(fù)的函數(shù)可以排成矩陣形式

9、,即:,(4―13),稱(chēng)它為失真矩陣D,它是n×m階矩陣。,失真函數(shù)可有多種形式,但應(yīng)盡可能符合信宿的主觀特性,即主觀上的失真感覺(jué)應(yīng)與d(ui,vj)的值相對(duì)應(yīng)。D越大,所感覺(jué)到的失真也越大,而且最好成正比。當(dāng)ui=vj時(shí),d應(yīng)等于零,表示沒(méi)有失真,當(dāng)ui≠vj時(shí),d為正值。常用失真函數(shù)有: 均方失真:,絕對(duì)失真:,相對(duì)失真:,(4―14),(4―15),(4―16),誤碼失真:,(4―17),式中:

10、x——信源輸出消息; y——信宿收到消息。,均方失真和絕對(duì)失真只與(x-y)有關(guān),而不是分別與x及y有關(guān),在數(shù)學(xué)處理上比較方便;相對(duì)失真與主觀特性比較匹配,因?yàn)橹饔^感覺(jué)往往與客觀量的對(duì)數(shù)成正比,但其數(shù)學(xué)處理困難得多。其實(shí)選擇一個(gè)與主觀特性完全匹配的失真函數(shù)已非常困難了,更不用說(shuō)還要便于數(shù)學(xué)處理了。前三種失真函數(shù)適用于連續(xù)信源,最后一種失真函數(shù)適用于離散信源。誤碼失真函數(shù)表明,當(dāng)接收符號(hào)與發(fā)送符號(hào)相同時(shí),就不存在

11、失真和錯(cuò)誤,即失真度為零;當(dāng)接收符號(hào)與發(fā)送符號(hào)不同時(shí),就存在失真。,而且認(rèn)為只要發(fā)送符號(hào)與接收符號(hào)不同,由此引起的失真都相同,即失真度為常數(shù)。如果常數(shù)值為1,則稱(chēng)為漢明失真。離散對(duì)稱(chēng)信源的漢明失真矩陣 D為一方陣,且對(duì)角線上的元素為零:,(4―18),【例4―1】 二元對(duì)稱(chēng)信源,信源U={0,1},接收變量V={0,1},在漢明失真定義下,失真函數(shù)為: d(0,0)=d(1,1)=0, d(0,1)=d (1,

12、0)=1 它表示當(dāng)信源發(fā)送符號(hào)0(或符號(hào)1)而信宿接收到符號(hào)0(或符號(hào)1)時(shí),則認(rèn)為無(wú)失真或無(wú)錯(cuò)誤存在;反之,若發(fā)送信源符號(hào)0(或符號(hào)1)而信宿接收符號(hào)1(或符號(hào)0)時(shí),則認(rèn)為有錯(cuò)誤,并認(rèn)為這兩種錯(cuò)誤的后果是等同的。其失真矩陣為,【例4―2】 設(shè)信源U={0,1},接收變量V={0,1,2},定義失真函數(shù)為d(0,0)=d(1,1)=0,d(0,1)=d(1,0)=1,d(0,2)=d(1,2)=0.5,則失真矩陣 D為,

13、【例4―3】 信源U={0,1,2},接收變量V={0,1,2},失真函數(shù)為d(ui,vj)=(ui-vj) 2,求失真矩陣。由失真定義得: d(0,0)=d(1,1)=d(2,2)=0 d(0,1)=d(1,0)=d(1,2)=d(2,1)=1 d(0,2)=d(2,0)=4 所以失真矩陣 D為,4.2.2 平

14、均失真 因?yàn)樾旁碪和信宿接收量V都是隨機(jī)變量,因此單個(gè)符號(hào)失真度d(ui,vj)也是隨機(jī)變量。定義傳輸一個(gè)符號(hào)引起的失真為平均失真,即信源平均失真:,(4―19),式中: ui——信源輸出符號(hào),i=1,2,…,n; p(ui)——信源輸出符號(hào)ui的概率; vj——信宿接收符號(hào),j=1,2,…,m; p(vj|ui)——廣義無(wú)擾信道傳遞概率。,單個(gè)符號(hào)

15、的失真度d(ui,vj)描述了某個(gè)信源符號(hào)通過(guò)傳輸后失真的大小。對(duì)于不同的信源符號(hào)和不同的接收符號(hào),其值是不同的。但平均失真度已對(duì)信源和信道進(jìn)行了統(tǒng)計(jì)平均,所以此值是描述某一信源在某一廣義無(wú)擾信道(或稱(chēng)為試驗(yàn)信道)傳輸下的失真大小,是從總體上描述整個(gè)系統(tǒng)失真情況的。從單個(gè)符號(hào)失真度出發(fā),可以定義長(zhǎng)度為K的信源序列的失真函數(shù)和平均失真度。信源序列失真度(失真函數(shù)):,(4―20),式中: S——信源的一個(gè)輸出序列;

16、 Y——信宿的一個(gè)接收序列; sl——信源輸出序列中的一個(gè)符號(hào); yl——信宿接收序列中的一個(gè)符號(hào)。,式(4―20)表明,信源序列的失真度等于序列中對(duì)應(yīng)單個(gè)信源符號(hào)失真度之和。N維信源符號(hào)序列的平均失真度:,(4―21),則單個(gè)信源符號(hào)平均失真度:,(4―22),當(dāng)信源與信道都是無(wú)記憶時(shí),N維信源序列平均失真度為,(4―23),式中

17、: ——信源序列中第l個(gè)分量平均失真度。 此時(shí)單個(gè)信源符號(hào)平均失真度:,(4―24),若平均失真度 不大于所允許的失真D,即:,(4―25),稱(chēng)式(4―25)為保真度準(zhǔn)則。 N維信源序列的保真度準(zhǔn)則是:平均失真度 不大于允許失真ND,即:,(4―26),1.離散信源的信息率失真函數(shù) 在信源給定,又定義了失真函數(shù)以后,總希望在滿(mǎn)足一定失真的情況

18、下,使信源傳輸給信宿的信息傳輸率R盡可能地小。或者說(shuō),在滿(mǎn)足保真度準(zhǔn)則下,尋找信源必須傳輸給信宿的信息率R的下限值,這個(gè)下限值與D有關(guān)。從接收端來(lái)看,就是在滿(mǎn)足保真度準(zhǔn)則下,尋找再現(xiàn)信源消息所必須獲得的最低平均信息量。而接收端獲得的平均信息量可用平均互信息量I(U;V)來(lái)表示,這就變成了在滿(mǎn)足保真度準(zhǔn)則的條件下 ,,尋找平均互信息量I(U;V)的最小值。BD是所有滿(mǎn)足保真度準(zhǔn)則的試驗(yàn)信道集合,可以在D失真許可的試

19、驗(yàn)信道集合BD中尋找某一個(gè)信道p(vj|ui),使I(U;V)取最小值。由于平均互信息量I(u;v)是p(vj|ui)的U型凸函數(shù),所以在BD集合中,極小值存在。這個(gè)最小值就是在 條件下,信源必須傳輸?shù)淖钚∑骄畔⒘俊<?(4―27),式中:BD——所有滿(mǎn)足保真度準(zhǔn)則的試驗(yàn)信道的集合。,稱(chēng)R(D)為信息率失真函數(shù)(或率失真函數(shù)),其單位為奈特/信源符號(hào)或比特/信源符號(hào)。

20、 N維信源符號(hào)序列的信息率失真函數(shù)RN(D):,(4―28),式中: x——信源的一個(gè)輸出序列; y——信宿的一個(gè)接收序列; ——N維信源符號(hào)序列的平均失真度。,2.連續(xù)信源的信息率失真函數(shù) 定義連續(xù)信源平均失真度為,(4―29),式中: d(u,v)——連續(xù)信源失真函數(shù); p(u)——連續(xù)信源u的概率密度;

21、 p(v|u)——信道傳遞概率密度。,根據(jù)連續(xù)信源平均失真度的定義,可求得平均互信息I(U;V)=h(V)-h(huán)(V|U),則連續(xù)信源的信息率失真函數(shù):,(4―30),式中: BD——滿(mǎn)足 ≤D的所有廣義無(wú)擾信道集合; inf——指下確界。,3.保真度準(zhǔn)則下的信源編碼定理 定理4―1 (限失真信源編碼定理) 設(shè)R(D)為離散無(wú)記憶信源X的信息率失真函數(shù),

22、R為信宿傳輸率,則當(dāng)信息率R>R(D),只要信源序列長(zhǎng)度L足夠長(zhǎng),一定存在一種編碼方法,其譯碼失真小于或等于D+ε,ε為任意小的正數(shù);反之,若R0,每一個(gè)信源符號(hào)的平均碼長(zhǎng)滿(mǎn)足如下公式:,(4―31),該定理指出,在失真限度內(nèi)使信息率任意接近R(D)的編碼方法存在,然而,若信息率小于R(D),平均失真一定會(huì)超過(guò)失真限度D。 對(duì)于連續(xù)平穩(wěn)無(wú)記憶信源,雖然無(wú)法進(jìn)行無(wú)失真編碼,但在限失真情況下,有與該定理一樣

23、的編碼定理。該定理說(shuō)明最佳編碼是存在的,但對(duì)于如何進(jìn)行編碼卻一無(wú)所知,因而就不能像無(wú)損編碼那樣從證明過(guò)程中引出概率匹配的編碼方法,一般只能從優(yōu)化的思路去求最佳編碼。,這個(gè)定理證明了允許失真D確定后,總存在一種編碼方法,使信息傳輸率R大于R(D)且可任意接近R(D),而平均失真小于允許失真D。反之,若R<R(D),那么該編碼的平均失真將大于D。如果用二進(jìn)制符號(hào)進(jìn)行編碼的話,在允許一定失真D的情況下,平均每個(gè)信源符號(hào)所需的二元碼符號(hào)

24、的下限值就是 R(D)。由此可見(jiàn),信息率失真函數(shù)R(D)確實(shí)是在允許失真度為D的情況下信源信息壓縮的下限值。當(dāng)信源給定后,無(wú)失真信源壓縮的極限值是信源熵H(U);有失真信源壓縮的極限值是信息率失真函數(shù)H(D)。,在給定某D后,一般R(D)<H(U)。 同樣,該定理只是一個(gè)存在定理。至于如何尋找最佳壓縮編碼方法,定理中并沒(méi)有給出。在實(shí)際應(yīng)用中,該定理主要存在以下兩大類(lèi)問(wèn)題。

25、 第一類(lèi)問(wèn)題是,符合實(shí)際信源的R(D)函數(shù)的計(jì)算相當(dāng)困難。首先,需要對(duì)實(shí)際信源的統(tǒng)計(jì)特性有確切的數(shù)學(xué)描述。其次,需要對(duì)符合主客觀實(shí)際的失真給予正確的度量,否則不能求得符合主客觀實(shí)際的R(D)函數(shù)。 ,例如,通常采用均方誤差來(lái)表示信源的平均失真度。但對(duì)于圖像信源來(lái)說(shuō),均方誤差較小的編碼方法,人們視覺(jué)感到失真較大。所以,人們?nèi)圆捎弥饔^觀察來(lái)評(píng)價(jià)編碼方法的好壞。因此,如何定義符合主客觀實(shí)際情況的失真測(cè)度就是件較困難的事。第三,即便對(duì)實(shí)際信

26、源有了確切的數(shù)學(xué)描述,又有符合主客觀實(shí)際情況的失真測(cè)度,而信息率失真函數(shù)R(D)的計(jì)算還是比較困難的。,第二類(lèi)問(wèn)題是,即便求得了符合實(shí)際的信息率失真函數(shù),還需研究采用何種實(shí)用的最佳編碼方法才能達(dá)到R(D)。 目前,這兩方面工作都有進(jìn)展。尤其是對(duì)實(shí)際信源的各種壓縮方法,如對(duì)語(yǔ)音信號(hào)、電視信號(hào)和遙感圖像等信源的各種壓縮方法有了較大進(jìn)展。相信隨著數(shù)據(jù)壓縮技術(shù)的發(fā)展,限失真編碼理論中存在的問(wèn)題將會(huì)得到解決。,4.

27、3 標(biāo)量量化編碼,連續(xù)信源限失真編碼的主要方法是量化,就是把連續(xù)的樣值離散化為某些量化級(jí)數(shù),所以量化也可稱(chēng)為數(shù)字化。量化后的信號(hào)也可稱(chēng)為數(shù)字信號(hào),這種轉(zhuǎn)換必將引入失真,量化時(shí)必須使這些失真最小。常用的量化方法有標(biāo)量量化和矢量量化兩種,所謂標(biāo)量量化是指每次只量化一個(gè)模擬樣本值,故又叫做零記憶量化。,4.3.1 均勻量化 標(biāo)量量化中最簡(jiǎn)單的方法是均勻量化,也叫做線性量化。設(shè)量化器輸入為x,對(duì)應(yīng)實(shí)數(shù)值域空間為R

28、,量化器輸出為y,對(duì)應(yīng)的實(shí)數(shù)值域空間為Rc,x和y的關(guān)系為 y=Q(x) (4―32),設(shè)Rc對(duì)應(yīng)取值范圍[a0,an],a0可為負(fù)無(wú)限。an可為正無(wú)限。所謂均勻量化就是將區(qū)間[a0,an]分割為n個(gè)相等距離且互不重疊的子區(qū)間[ai,ai+1],取每個(gè)小區(qū)間的中點(diǎn)值作為量化值yi,即ai≤x≤ai+1時(shí),yi=(ai+1+ai)/2,若x的概率分布函

29、數(shù)為p(x),則:,均勻量化的量化誤差:,(4―33),(4―34),量化器均方誤差:,量化器輸入方差:,(4―35),(4―36),量化器的信噪比SNR(Signal Noise Rate):,量化器的工作區(qū)域有三個(gè)。,1.正常量化區(qū) 當(dāng)輸入x∈[a0,an]時(shí),量化器能得到正常的量化輸出。 2.限幅區(qū) 當(dāng)xan時(shí),量化器分別輸出常量a0+

30、Δ/2和an-Δ/2。量化器此時(shí)處于限幅或過(guò)載工作狀態(tài),將會(huì)產(chǎn)生較大的失真。,3.空載區(qū) 當(dāng)-Δ/2<x-ai<Δ/2時(shí),將有兩種情況: (1)當(dāng)輸入x=ai時(shí),由于某種因素,使得x稍高于ai,則量化器輸出上一級(jí)量化值yi+1;當(dāng)輸入x稍低于ai時(shí);則輸出下一級(jí)量化值yi-1,這時(shí)的誤差為±Δ,量化器輸出在兩個(gè)量化級(jí)間往返跳動(dòng),形成一個(gè)矩形波輸出,結(jié)果將產(chǎn)生點(diǎn)狀噪聲

31、。 (2)輸入x在ai之上或之下,量化輸出分別為恒定值yi=ai+Δ/2或yi-1=ai-Δ/2。,4.3.2 最優(yōu)量化 將樣本值量化總要帶來(lái)誤差,因此,人們?cè)谠O(shè)計(jì)量化器時(shí),總希望其誤差越小越好,即尋求最優(yōu)量化誤差。所謂最優(yōu)量化就是使量化器的均方誤差σ2e最小或信噪比SNR最大的量化。根據(jù)信息熵的理論可以推斷,量化誤差最小的最優(yōu)量化器,對(duì)量化器輸入?yún)^(qū)間的分割應(yīng)該是非均勻的。由于最優(yōu)量化

32、與p(x)有關(guān),因而區(qū)間分割也與p(x)有關(guān),尤其當(dāng)N足夠大時(shí),可以近似認(rèn)為在各個(gè)子區(qū)間[ai,ai+1]上的概率分布p(x)為一常數(shù),也就是說(shuō),在各子區(qū)間上可被視為均勻分布,即:,p(x)≈p(yi),x∈[ai,ai+1] (4―37) 因此,如果輸入x的概率分布在 R上是均勻分布,其量化和最優(yōu)量化是比較容易實(shí)現(xiàn)和討論的,但對(duì)于一般標(biāo)量量化的最優(yōu)設(shè)計(jì)就不這樣容易了。下面介紹MaxLivod兩人提出的標(biāo)量量化器的設(shè)計(jì)算法。

33、,最優(yōu)量化就是使量化器的均方誤差σ2e為最小,將式(4―35)分別對(duì)ai和yi求導(dǎo),并令其為零,即,(4―38),(4―39),則,(4―40),(4―41),這里求出的ai和yi的值,就是最優(yōu)量化時(shí)的值。可見(jiàn)ai的最佳位置是輸出yi-1和yi的中點(diǎn),yi最佳位置在ai和ai+1區(qū)間的概率中心。一般情況下,ai和yi是互相制約、相互依賴(lài)的,不容易求出解析解,所以只能用遞推公式獲得近似解。MaxLivod采用的迭代方法如下:

34、 (1)任取y0; (2)由,計(jì)算a1;,(3)根據(jù)公式(4―40)計(jì)算y1; (4)重復(fù)步驟(2)、(3),分別計(jì)算出a2,y2,a3,y3,…,直至最后求得yn-1; (5)檢驗(yàn)yn是否為[an-1,an]的概率中心,即式   是否成立,或在允許的一定誤差范圍內(nèi)成立;  (6)若步驟(5)滿(mǎn)

35、足,則過(guò)程結(jié)束,否則,重新選y0,重復(fù)上述操作步驟。,4.4 矢量量化編碼,要想得到性能好的編碼,僅采用標(biāo)量量化是不可能的。在最佳編碼中,如將離散信源的多個(gè)符號(hào)進(jìn)行聯(lián)合編碼可提高效率,這對(duì)連續(xù)信源也是如此。當(dāng)把多個(gè)信源符號(hào)聯(lián)合起來(lái)形成多維矢量,再對(duì)矢量進(jìn)行標(biāo)量量化時(shí),自由度將更大,同樣的失真下,量化級(jí)數(shù)可進(jìn)一步減少,碼率可進(jìn)一步壓縮。這種量化叫做矢量量化。,實(shí)驗(yàn)證明,即使各信源符號(hào)相互獨(dú)立,多維量化通常也可壓縮信息率。因而矢量量化

36、引起人們的興趣而成為當(dāng)前連續(xù)信源編碼的一個(gè)熱點(diǎn)??墒钱?dāng)維數(shù)較大時(shí),矢量量化尚無(wú)解析方法,只能求助于數(shù)值計(jì)算;而且聯(lián)合概率密度也不易測(cè)定,還需采用諸如訓(xùn)練序列的方法。一般來(lái)說(shuō),高維矢量的聯(lián)合是很復(fù)雜的,雖已有不少方法,但其實(shí)現(xiàn)尚有不少困難,有待進(jìn)一步研究。,設(shè)矢量量化器輸入集為 X={X1,X2,…,XN},Xj∈X,Xj=(xj1,xj2,…,xjk), X∈R k(k維歐幾里德空間),把R k劃分成J=2 n個(gè)互不相交的子空間R1,

37、R2,…,RJ,求出每個(gè)子空間的質(zhì)心Yi,所有的 Yi構(gòu)成 Y={Y1,Y2,…,YJ},Y為量化器的輸出空間,也叫碼書(shū)(或碼本),Yi叫碼字或碼矢,J叫碼書(shū)的長(zhǎng)度。,對(duì)J階K維的矢量量化,實(shí)質(zhì)上是判斷輸入Xj∈ Rk屬于哪個(gè)子空間Ri,然后輸出該子空間代表碼字 Yi,即:  Yi=Q(Xj), 1≤i≤J,1≤j≤N (4―42) 這里 Yi就是Xj的編碼。,實(shí)際編碼時(shí),在發(fā)送端只需記錄代表碼字Yi的

38、下標(biāo)i,所以編碼過(guò)程是把X映射到I={1,2,…,J};而譯碼過(guò)程是在接收端依據(jù)收到的I代碼,查找碼書(shū)Y,獲得碼字Yi,用來(lái)代替Xj。由于總的碼字個(gè)數(shù)J一般遠(yuǎn)小于總的輸入信號(hào)N×K,所以矢量量化的壓縮能力非常大。,傳輸或存儲(chǔ)一個(gè)矢量所需比特為lbJ(一般 J=2n),它是一個(gè)K維矢量,就是K個(gè)輸入信號(hào),所以每個(gè)輸入信號(hào)的平均比特只有l(wèi)bJ/K,稱(chēng)之為壓縮比。適當(dāng)選取碼書(shū)長(zhǎng)度J和碼字維數(shù)K,可以獲得很大壓縮比。矢量量

39、化中碼書(shū)的碼字越多,維數(shù)越大,失真就越小。只要適當(dāng)?shù)剡x擇碼字?jǐn)?shù)量,就能控制失真量不超過(guò)某一給定值,因此碼書(shū)控制著矢量的大小。矢量量化時(shí)每輸入一個(gè) Xj,都要和J個(gè)碼字 Yi逐一比較,搜索與其最接近的碼字 Yi。由于兩者均為K維矢量,所以工作量很大。矢量量化是定長(zhǎng)碼,容易處理。,矢量量化由碼書(shū) Y和劃分Ri的條件惟一確定。當(dāng)碼書(shū)確定后,通過(guò)最近鄰域準(zhǔn)則可以惟一確定區(qū)域分割。因此,最佳量化器的設(shè)計(jì)也就是最佳碼書(shū)Y的設(shè)計(jì)。前面,在討論一維標(biāo)量

40、的最佳設(shè)計(jì)時(shí),引入了MaxLivod的迭代算法,1980年Linde、Buzo和Gray將此算法推廣到了多維空間,稱(chēng)作LBG算法。因LBG算法由于理論上的嚴(yán)密性和實(shí)現(xiàn)的簡(jiǎn)便性以及較好的設(shè)計(jì)效果而得到了廣泛的應(yīng)用,并成為各種改進(jìn)算法的基礎(chǔ)。有關(guān)LBG算法等知識(shí)請(qǐng)參閱有關(guān)文獻(xiàn)。,4.5 語(yǔ)音壓縮編碼,對(duì)語(yǔ)音信號(hào)的壓縮,人們有較強(qiáng)的興趣,因?yàn)殡娫掃€是當(dāng)前主要的通信手段之一,業(yè)務(wù)量也很大,尤其在移動(dòng)通信中,由于無(wú)線頻帶有限,更需以低比

41、特率傳送。眾所周知,語(yǔ)音壓縮編碼可劃分為波形編碼、參量編碼和混合編碼三大類(lèi)型。波形編碼的目的是在接收端恢復(fù)發(fā)端原語(yǔ)音的波形,并以波形的保真度即自然度為主要度量指標(biāo)。參量編碼不同于波形編碼,它主要跟蹤波形產(chǎn)生的過(guò)程,,并且僅傳送反映波形變化的主要參量,在接收端根據(jù)語(yǔ)音產(chǎn)生過(guò)程,利用這些參量恢復(fù)語(yǔ)音。它又稱(chēng)為聲碼器,其主要度量指標(biāo)是可懂度。混合編碼則介于波形編碼與參量編碼之間,即在參量編碼的基礎(chǔ)上,引入了波形編碼的特征,以達(dá)到改善自然度的目

42、的,因此,它一般也稱(chēng)混合編碼為軟聲碼器。由于語(yǔ)音信源是屬于連續(xù)的限失真信源,可以根據(jù)R(D)函數(shù)理論探討波形編碼的理論壓縮極限。,由信息論可知,若要語(yǔ)音基本達(dá)到公用網(wǎng)入網(wǎng)信噪比標(biāo)準(zhǔn),且大于26dB,那么理論壓縮倍數(shù)大約為3.4,若進(jìn)一步考慮到實(shí)際語(yǔ)音分布和主觀因素影響后,大約為4倍左右。對(duì)于參量編碼,度量其質(zhì)量的指標(biāo)不再是保真度,而是可懂度。若不考慮講話人音質(zhì)和情緒等因素,僅從可懂度出發(fā),在理論上,語(yǔ)音最低信息率大約為70~80 b/s

43、。它與目前常用的PCM語(yǔ)音64 kb/s相比,理論壓縮比大約為800~900倍。限于篇幅本節(jié)只討論語(yǔ)音壓縮編碼的基本原理。,4.5.1 波形編碼基本原理 自適應(yīng)差分脈碼調(diào)制(ADPCM)是在差分脈碼調(diào)制(DPCM)的基礎(chǔ)上發(fā)展起來(lái)的。DPCM根據(jù)信號(hào)的過(guò)去樣值預(yù)測(cè)下一個(gè)樣值,并將預(yù)測(cè)誤差加以量化、編碼,而后進(jìn)行傳輸,由于預(yù)測(cè)誤差的幅度變化范圍小于原信號(hào)的幅度變化范圍,因此在相同量化噪聲條件下,DPCM的量化

44、比特?cái)?shù)小于PCM,從而達(dá)到語(yǔ)音壓縮編碼的目的。ADPCM與DPCM比較,兩者主要區(qū)別在于ADPCM中的量化器和預(yù)測(cè)器采用了自適應(yīng)控制。同時(shí),在譯碼器中多了一個(gè)同步編碼調(diào)整,其作用是為了在同步級(jí)連時(shí)不產(chǎn)生誤差積累。,20世紀(jì)80年代以來(lái),32kb/sADPCM技術(shù)已日趨成熟,并接近PCM的質(zhì)量,但卻節(jié)省一半的信道容量,因而受到重視。1984年CCITT提出G721建議,采用動(dòng)態(tài)鎖定量化器,這是一種具有自適應(yīng)速度控制32kb/s的自適應(yīng)量化

45、器,并將它作為國(guó)際標(biāo)準(zhǔn)化的語(yǔ)音編碼方法。1986年又對(duì)G721建議進(jìn)行了修正,稱(chēng)G726建議,詳細(xì)內(nèi)容請(qǐng)參見(jiàn)相關(guān)的文獻(xiàn)。,4.5.2 參量編碼 參量編碼的出發(fā)點(diǎn)在于跟蹤波形的產(chǎn)生過(guò)程,而不是傳輸波形本身。它傳遞的是反映這一變化過(guò)程的參量。根據(jù)線性預(yù)測(cè)原理,語(yǔ)音信號(hào)可用一系列預(yù)測(cè)變化的參量和其他與變化有關(guān)的參量來(lái)表征。在接收端,收到的這些語(yǔ)音參量通過(guò)一個(gè)時(shí)變數(shù)字濾波器,它根據(jù)發(fā)聲原理合成原來(lái)的語(yǔ)音。稱(chēng)實(shí)現(xiàn)參量編

46、碼的編碼器為語(yǔ)音編碼器或聲碼器。所謂聲碼器,就是在充分研究音發(fā)音系統(tǒng)特點(diǎn)的基礎(chǔ)上,設(shè)法提取語(yǔ)音信號(hào)的要素。,這樣就可以只傳送這些要素而不再傳送語(yǔ)音信號(hào)的波形。在接收端利用這些要素重建語(yǔ)音信號(hào),稱(chēng)為合成語(yǔ)音。只要這些要素選擇得恰當(dāng),所需碼率就可很小而仍能保持良好的語(yǔ)音質(zhì)量?,F(xiàn)在簡(jiǎn)要地說(shuō)明人的發(fā)音過(guò)程。當(dāng)人發(fā)聲時(shí),空氣由肺部排出,在聲帶間受壓而使聲帶振動(dòng),振動(dòng)頻率由聲帶的張力和聲帶的厚度等因素所決定,因而因人、內(nèi)容而異。壓出的氣流強(qiáng)弱決定聲

47、音的強(qiáng)度。該氣流經(jīng)過(guò)由口腔等組成的聲道時(shí)而被調(diào)制,形成不同的音色。聲道包括口腔中的舌、齒、唇等,發(fā)鼻音時(shí)還要利用鼻腔。,以上均指發(fā)濁音和母音的情況。當(dāng)發(fā)清音時(shí),聲帶只有收縮和放開(kāi),不作周期性振動(dòng);發(fā)爆破音時(shí),主要靠唇部動(dòng)作,也屬于清音類(lèi)型。 實(shí)際發(fā)聲過(guò)程當(dāng)然要比上述過(guò)程復(fù)雜得多,最常用的簡(jiǎn)化原理圖如圖4―3所示。,圖4―3 語(yǔ)音產(chǎn)生模型,圖4―3中,u(n)是波形產(chǎn)生的激勵(lì)參量,c(n)是輸出的語(yǔ)音。激勵(lì)分

48、為兩種:A路是發(fā)濁音或母音時(shí)的情況,可用周期性信號(hào)來(lái)代表,其周期大小和強(qiáng)度可隨時(shí)調(diào)整;B路是發(fā)清音時(shí)的情況,可用近似于白噪聲的隨機(jī)信號(hào)來(lái)代表。圖中的雙擲開(kāi)關(guān)表示發(fā)音不同時(shí)可上、下轉(zhuǎn)換。濾波部分一般用線性濾波器來(lái)近似地代表聲音在聲道中被調(diào)制的過(guò)程。而線性時(shí)變?yōu)V波器的系數(shù)可以通過(guò)線性預(yù)測(cè)等技術(shù)獲得。在一般情況下需要有12個(gè)系數(shù){ai}(i=1,2,…,12)。,此外,還有三個(gè)重要參量即音調(diào)(基音)周期P、清濁音判決u/v和代表語(yǔ)音強(qiáng)弱的增益

49、參量G??梢?jiàn),語(yǔ)音信號(hào)中所包含的主要信息就由這15個(gè)參量所決定。通過(guò)對(duì)每幀語(yǔ)音進(jìn)行分析求出這15個(gè)參量,然后將它們量化、編碼傳送給收端。接收端用收到的這15個(gè)參量和發(fā)聲模型,綜合、復(fù)制出語(yǔ)音信號(hào)。這里線性時(shí)變?yōu)V波器的系數(shù)由收到的12個(gè)參量{ai},i=1,2,…,12控制,激勵(lì)器幅度受到增益G的控制。具體采用哪一類(lèi)信號(hào)源則由收到的清濁音u/v來(lái)決定。發(fā)清音時(shí),激勵(lì)為偽隨機(jī)的白噪聲源,發(fā)濁音時(shí),激勵(lì)為基音周期控制的準(zhǔn)周期脈沖源。采用這種編

50、碼方式進(jìn)行語(yǔ)音有效傳輸?shù)南到y(tǒng)稱(chēng)為線性預(yù)測(cè)器(LPC)。,線性預(yù)測(cè)分析仍是目前聲碼器技術(shù)的主流。近年來(lái)值得注意的有三個(gè)方面。首先是提高合成語(yǔ)音質(zhì)量的措施,如采用余數(shù)激勵(lì)聲碼器RELP、多脈沖激勵(lì)聲碼器MELP以及聲道參數(shù)模型的改善等。其次是進(jìn)一步降低速率,如采用變換技術(shù),優(yōu)化編碼、矢量量化技術(shù)等等。顯然,這兩方面的技術(shù)都與復(fù)雜性成正比,所以用復(fù)雜性換取技術(shù)性是今后的一個(gè)方向。最后是參數(shù)的自適應(yīng)特性。一般預(yù)測(cè)系數(shù)自適應(yīng)范圍大致在30次/s至

51、400次/s,而對(duì)音調(diào)基音周期和增益的自適應(yīng)范圍大致在100次/s至200次/s。,4.5.3 混合編碼 余數(shù)激勵(lì)聲碼器(RELPC)將余數(shù)低頻譜中的一小部分(基帶余數(shù)信號(hào))所攜帶的激勵(lì)信息傳送給收端,它避免了清、濁音判決及基音提取??梢?jiàn),它是在LPC聲碼器基礎(chǔ)上發(fā)展起來(lái)的,從而是一種混合編碼的方法。在接收端,用高頻再生技術(shù)來(lái)恢復(fù)完整的余數(shù)信號(hào),其實(shí)現(xiàn)方框圖如圖4―4所示。,圖4―4 RELPC原理方

52、框圖,圖中語(yǔ)音帶寬為ωH2,而余數(shù)信號(hào)的基帶帶寬是BH2,且它僅是全頻帶余數(shù)信號(hào)頻譜的一部分(1/L),采樣以原采樣率Fs的1/L進(jìn)行采樣,然后對(duì)采樣信號(hào)進(jìn)行編碼。下支路LPC分析提取參量并編碼,將兩路編碼合并后送入信道。在接收端,上支路經(jīng)過(guò)譯碼,輸出基帶余數(shù)信號(hào),對(duì)基帶余數(shù)信號(hào)進(jìn)行高頻再生處理,然后該信號(hào)通過(guò)下端截止頻率為BH2的高通濾波器輸出,再與基帶余數(shù)信號(hào)相加產(chǎn)生全頻帶余數(shù)信號(hào)去激勵(lì)LPC合成器產(chǎn)生合成語(yǔ)音輸出。,可見(jiàn),RELP

53、C方法在發(fā)送端用余數(shù)信號(hào)中低頻信息取代寬帶余數(shù)信號(hào)信息,而在接收端對(duì)基帶余數(shù)信號(hào)進(jìn)行高頻再生處理,產(chǎn)生全頻帶余數(shù)信號(hào)去激勵(lì)LPC合成器。,4.6 圖像壓縮編碼,在20世紀(jì)90年代,計(jì)算機(jī)技術(shù)、微電子技術(shù)和通信技術(shù)得到迅猛發(fā)展。多媒體計(jì)算機(jī)、多媒體數(shù)據(jù)庫(kù)、多媒體通信、多媒體表現(xiàn)技術(shù)等多媒體研究領(lǐng)域也成為計(jì)算機(jī)和通信發(fā)展中的一個(gè)重要研究熱點(diǎn)。其中面臨最大的問(wèn)題是數(shù)據(jù)量巨大的“爆炸”。文件、表格、工程圖紙等二值圖像的數(shù)據(jù)已較大。,但相

54、比之下,語(yǔ)音信號(hào)、靜止灰值圖像、彩色靜止圖像電視圖像、高清晰電視圖像等的數(shù)據(jù)量更是巨大。特別是高清晰電視圖像。一般電視圖像的數(shù)據(jù)量要比語(yǔ)音的數(shù)據(jù)量大上千倍。因此,研究有效的數(shù)據(jù)壓縮和解壓縮的技術(shù)成為重要的、關(guān)鍵的研究方向。信息率失真理論從理論上指出,解決這種問(wèn)題的途徑是存在的、可能的。,4.6.1 靜止圖像壓縮編碼 新聞圖片、醫(yī)療圖片、衛(wèi)星圖片以及圖像文獻(xiàn)資料等均屬于靜止圖像。這類(lèi)靜止圖片的壓縮,對(duì)傳輸和存儲(chǔ)

55、都具有重要的應(yīng)用價(jià)值。靜止圖像壓縮編碼一般可劃分為無(wú)失真編碼與限失真編碼兩大類(lèi)。對(duì)無(wú)失真編碼一般采用霍夫曼編碼或者算術(shù)編碼。限失真編碼主要有:幀內(nèi)、幀間的預(yù)測(cè)編碼;二維變換編碼:KLT、DFT、DCT、HRT、SLT等等,以及子帶編碼、分層編碼、輪廓編碼、分形編碼、小波變換等等,但主要以預(yù)測(cè)編碼和正交變換編碼為主,JPEG標(biāo)準(zhǔn)是用于多個(gè)灰度及色度連續(xù)變化的靜止圖像編碼的國(guó)際標(biāo)準(zhǔn)。,4.6.2 活動(dòng)圖像壓縮編碼

56、廣播電視、會(huì)議電視和可視電話等運(yùn)動(dòng)圖像信號(hào),除幀內(nèi)像素間有相關(guān)性而外,幀與幀之間也有很強(qiáng)的相關(guān)性,所以對(duì)這類(lèi)信號(hào)的處理常用幀間預(yù)測(cè)技術(shù)。幀間預(yù)測(cè)不僅要利用本行的前幾個(gè)樣值和前幾行的相鄰取樣值,而且要利用上一幀或前幾幀的取樣值來(lái)估計(jì)當(dāng)前幀內(nèi)的像素值,因此幀間預(yù)測(cè)是一種三維預(yù)測(cè)方法。它在幀內(nèi)預(yù)測(cè)的基礎(chǔ)上,再利用幀間的時(shí)間相關(guān)性進(jìn)一步消除圖像信號(hào)的冗余度,提高壓縮比。,為了達(dá)到實(shí)時(shí)幀間預(yù)測(cè),前幾幀的圖像數(shù)據(jù)必須儲(chǔ)存在幀存儲(chǔ)器(VRAM)中。超

57、大規(guī)模集成電路技術(shù)(VLSl)日趨成熟,使幀間預(yù)測(cè)技術(shù)變?yōu)楝F(xiàn)實(shí),因此,幀間預(yù)測(cè)技術(shù)正在成為會(huì)議電視、可視電話、數(shù)字電視、HDTV的壓縮數(shù)據(jù)的主要方法之一。在介紹幀間預(yù)測(cè)技術(shù)之前,先研究一下電視圖像等幀間差值的統(tǒng)計(jì)特性。 er(i,j)=ur(i,j)-ur-1(i,j) (4―43),實(shí)際統(tǒng)計(jì)結(jié)果表明,該差值不大。對(duì)于變化緩慢的黑白圖像序列,如可視電話、會(huì)議電視的圖像信號(hào)

58、,如果對(duì)其進(jìn)行256級(jí)量化,只有4%像素的幀間差值超過(guò)閾值3;對(duì)于亮度值變化較為劇烈的256級(jí)的彩色電視圖像序列,也只有7.5%像素的幀間差值越過(guò)閾值6。可見(jiàn)幀與幀之間,信號(hào)的相關(guān)性是很強(qiáng)的,即冗余度很大。這一統(tǒng)計(jì)特性就是幀間預(yù)測(cè)編碼的基礎(chǔ)。幀間差值從總體上來(lái)看雖然不大,但從活動(dòng)的局部圖像像素或子塊間看,有時(shí)還是比較大的,因此根據(jù)具體情況可采用兩種幀間預(yù)測(cè)方法處理。,1.狹義幀間預(yù)測(cè) 狹義幀間預(yù)測(cè)就是用某點(diǎn)

59、前一幀的像素值ur-1(i,j)作為該點(diǎn)當(dāng)前幀的像素值ur(i,j)的預(yù)測(cè)值。這種誤差為 e(i,j)=ur(i,j)-ur-1(i,j) (4―44),2.復(fù)合差值預(yù)測(cè) 當(dāng)幀間某點(diǎn)的像素差值比較大,且圖況較為復(fù)雜時(shí),顯然就不能簡(jiǎn)單地傳輸鄰近兩幀間對(duì)應(yīng)像素的幀間差值,而應(yīng)按一定準(zhǔn)則,先估計(jì)一個(gè)像素或一個(gè)圖像子塊的運(yùn)動(dòng),然后根據(jù)預(yù)測(cè)出的運(yùn)動(dòng)位移確定對(duì)應(yīng)像素

60、,從而獲得相鄰兩幀間的幀間差值。復(fù)合差值預(yù)測(cè)與狹義幀間預(yù)測(cè)相比,對(duì)活動(dòng)圖像,其預(yù)測(cè)的幀間差值要小得多,且準(zhǔn)確性高。在發(fā)送端稱(chēng)為運(yùn)動(dòng)估計(jì),在接收端則稱(chēng)為運(yùn)動(dòng)補(bǔ)償,一般簡(jiǎn)稱(chēng)運(yùn)動(dòng)補(bǔ)償(MC)預(yù)測(cè)技術(shù)。根據(jù)參加運(yùn)動(dòng)估計(jì)的對(duì)象不同,有條件幀間修補(bǔ)法和運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)兩種估計(jì)方法。,1)條件幀間修補(bǔ)法 幀間預(yù)測(cè)誤差為,(4―45),式中: e(i,j)——當(dāng)前像素ur(i,j)幀間差值;

61、 ——第r幀中當(dāng)前像素值; ——第r幀中當(dāng)前像素ur(i,j)的預(yù)測(cè)值; ——前一幀中對(duì)應(yīng)像素ur-1(i,j)復(fù)原值。,對(duì)電視圖像編碼Mounts、Pease等人提出的條件像素修補(bǔ)法規(guī)定:若幀間誤差e(i,j)超過(guò)閾值,則把這些像素存在緩沖存儲(chǔ)器中,并以恒定的傳輸速度傳送或者只傳送誤差e(i,j);對(duì)低于閾值的像素則不傳送,在接

62、收端用上一幀圖像的相應(yīng)像素值來(lái)代替。這樣,一幅電視圖像只要傳送其中很少部分的像素,或只傳送幀間差值,所以能得到較高的壓縮比。,2)運(yùn)動(dòng)補(bǔ)償預(yù)測(cè) 運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)技術(shù)正處于研究和發(fā)展中,重點(diǎn)是尋找一些簡(jiǎn)單而又實(shí)用的幀內(nèi)和幀間復(fù)合的自適應(yīng)預(yù)測(cè)方法,但是至今沒(méi)有取得特別有效的方案。下面簡(jiǎn)單介紹在國(guó)際標(biāo)準(zhǔn)化視頻編碼方案MPEG中,使用的運(yùn)動(dòng)補(bǔ)償技術(shù)。運(yùn)動(dòng)補(bǔ)償技術(shù)的基本原理是,運(yùn)動(dòng)補(bǔ)償技術(shù)對(duì)占整個(gè)畫(huà)面有較小的運(yùn)動(dòng)部分的圖像

63、,其壓縮數(shù)據(jù)效果特別好,如會(huì)議電視、可視電話等。用運(yùn)動(dòng)補(bǔ)償技術(shù)計(jì)算圖像中運(yùn)動(dòng)部分位移的兩個(gè)分量可使預(yù)測(cè)效果大大提高,運(yùn)動(dòng)補(bǔ)償法跟蹤畫(huà)面內(nèi)的活動(dòng)情況,先對(duì)其加以補(bǔ)償之后,再進(jìn)行幀間預(yù)測(cè)。,運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)方案的使用規(guī)則是,首先把圖像分割為靜止的和運(yùn)動(dòng)的兩部分。這里假設(shè)運(yùn)動(dòng)物體只作平移運(yùn)動(dòng),即把物體的復(fù)雜運(yùn)動(dòng)化成一段段簡(jiǎn)單的平移,使算法簡(jiǎn)單易于實(shí)現(xiàn)。然后計(jì)算物體的位移值;接著用位移估值(即運(yùn)動(dòng)矢量)進(jìn)行運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)。最后對(duì)預(yù)測(cè)信息進(jìn)行編碼。這項(xiàng)

64、技術(shù)的關(guān)鍵是運(yùn)動(dòng)矢量的計(jì)算。 從運(yùn)動(dòng)補(bǔ)償技術(shù)中已看到,如何把圖像分割成靜、動(dòng)兩部分是運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)的基礎(chǔ),但這也是困難的。兩幀圖像間的運(yùn)動(dòng)估計(jì)是運(yùn)動(dòng)圖像處理的關(guān)鍵。,通常采用兩種較簡(jiǎn)單的方法處理:一種方法是把圖像分成若干矩形子塊;另一種方法是像素遞歸法。第一種方法將分成的子塊分為動(dòng)和不動(dòng)兩種,然后估計(jì)運(yùn)動(dòng)子塊的位移,再進(jìn)行預(yù)測(cè)傳輸;后一種方法則是對(duì)每個(gè)像素的位移進(jìn)行遞歸估計(jì)。,4.6.3 視頻壓縮編碼

65、電視信號(hào)具有很強(qiáng)的相關(guān)性和巨大的數(shù)據(jù)量,因此電視信號(hào)需要進(jìn)行數(shù)據(jù)壓縮,數(shù)字電視和高分辨率的電視(HDTV)將是21世紀(jì)人類(lèi)使用的主要電視系統(tǒng),這是由于數(shù)字電視比模擬電視具有很多突出優(yōu)點(diǎn)而決定的。,1.數(shù)字電視的特點(diǎn) 數(shù)字圖像的質(zhì)量遠(yuǎn)高于模擬電視圖像。例如,數(shù)字電視信號(hào)的抗噪聲干擾及克服非線性失真都明顯地優(yōu)于模擬電視信號(hào),能克服高樓大廈對(duì)電波反射所造成的重影問(wèn)題。數(shù)字電視信號(hào)經(jīng)過(guò)多次中繼再生。數(shù)字電視廣播,

66、在廣闊范圍內(nèi)具有同等優(yōu)良的圖像質(zhì)量。數(shù)字電視可以實(shí)現(xiàn)模擬電視難于實(shí)現(xiàn)的復(fù)雜的電視信號(hào)處理和加工,如數(shù)字視頻特技效果。數(shù)字電視能克服全球各種模擬電視制式難于統(tǒng)一的問(wèn)題,實(shí)現(xiàn)不同電視制式的自動(dòng)轉(zhuǎn)換等。,數(shù)字電視信號(hào)易于實(shí)現(xiàn)計(jì)算機(jī)控制和自動(dòng)化操作、管理,易于實(shí)現(xiàn)廣播電視與計(jì)算機(jī)網(wǎng)絡(luò)和電話網(wǎng)的三網(wǎng)合一,為多媒體信息的傳輸、存儲(chǔ)、同步、交互和融合創(chuàng)造條件。數(shù)字電視系統(tǒng)采用大規(guī)模數(shù)字集成電路,大大提高了電視設(shè)備的穩(wěn)定性、可靠性。電視信號(hào)數(shù)字化后也

67、存在幾個(gè)問(wèn)題:數(shù)碼率太高,傳輸一路PCM數(shù)字電視信號(hào)所需要的帶寬要比傳輸一路模擬電視信號(hào)大10倍左右,信道利用很不經(jīng)濟(jì);由于數(shù)字電視的數(shù)據(jù)量龐大,對(duì)存儲(chǔ)器的容量、元件的速度、數(shù)字電路的集成度要求很高。因此,在經(jīng)濟(jì)上、技術(shù)上實(shí)現(xiàn)全數(shù)字化的廣播電視尚有較大的難度。但經(jīng)過(guò)最近10年的研究,基本上找到了解決問(wèn)題的方法。,這些解決的方法是,采用業(yè)已成熟的帶寬壓縮編碼技術(shù),如預(yù)測(cè)編碼法(如DPCM)、正交變換編碼法、自適應(yīng)編碼等。但是人們還在探求更

68、有效的活動(dòng)圖像的數(shù)據(jù)壓縮編碼技術(shù)。對(duì)于傳輸信道,已開(kāi)始采用寬帶傳輸載體,如光纖等。目前,超高速、超大規(guī)模數(shù)字集成電路技術(shù)已很成熟,且其成本不斷降低。發(fā)達(dá)的西方國(guó)家已經(jīng)在局部范圍里采用全數(shù)字電視廣播系統(tǒng)發(fā)送和接收數(shù)字電視信號(hào),我國(guó)已于1998年試制成功了全數(shù)字電視接收機(jī),可以預(yù)料在今后幾年內(nèi),全數(shù)字電視設(shè)備將取代目前的模擬電視系統(tǒng)。,2.數(shù)字電視系統(tǒng)的結(jié)構(gòu) 數(shù)字電視系統(tǒng)的組成,如圖4―5所示。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論