2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第6章 多媒體數(shù)據(jù)的壓縮,6.1 數(shù)據(jù)壓縮概述數(shù)據(jù)壓縮的必要性數(shù)據(jù)冗余6.2 數(shù)據(jù)壓縮的基本原理信息編碼基礎(chǔ)數(shù)據(jù)壓縮方法6.3 數(shù)據(jù)壓縮的編碼算法統(tǒng)計(jì)編碼(行程編碼 哈夫曼編碼 算術(shù)編碼)預(yù)測編碼變換編碼6.4 常用多媒體數(shù)據(jù)壓縮標(biāo)準(zhǔn)音頻壓縮編碼標(biāo)準(zhǔn)靜態(tài)圖像壓縮標(biāo)準(zhǔn)動(dòng)態(tài)圖像壓縮標(biāo)準(zhǔn)視頻壓縮編碼標(biāo)準(zhǔn),6.1 數(shù)據(jù)壓縮概述,1、 壓縮的必要性 聲音、圖像、視頻和動(dòng)畫的數(shù)據(jù)量太大聲音

2、1分鐘立體聲音樂采樣頻率為44.1KHZ,16位量化精度的數(shù)據(jù)量為 44.1 * 1000 * 16 * 2 *60 / 8 =10.09MB 存儲(chǔ)一首4分鐘的歌曲約需40MB圖像 1副640*480的RGB彩色圖像的存儲(chǔ)容量為 640*480 * 24 / 8 = 900KB視頻 1秒鐘(25幀/秒)的視頻數(shù)據(jù)量為 25*900KB = 21.97

3、 MB1張650MB的CD ROM光盤只能存儲(chǔ)約 650 / 21.97 = 29.59 秒的視頻,2 數(shù)據(jù)冗余空間冗余:圖像內(nèi)部相鄰像素之間的相關(guān)性時(shí)間冗余:視頻序列中前后幀之間的相關(guān)性視覺或聽覺冗余(人眼或人耳具有一定的掩蔽效應(yīng))知識(shí)冗余(具有規(guī)律性的結(jié)構(gòu),用于圖像理解上,如人臉)統(tǒng)計(jì)冗余(出現(xiàn)的頻率具有一定的規(guī)律性,如元音多,有些輔音很少出現(xiàn))結(jié)構(gòu)冗余(具有紋理結(jié)構(gòu)的圖像區(qū)域)信息熵冗余(又叫編碼冗余,用相同位數(shù)進(jìn)

4、行編碼產(chǎn)生的冗余),6.2 數(shù)據(jù)壓縮的基本原理,1、信息編碼基礎(chǔ)壓縮的實(shí)質(zhì):根據(jù)數(shù)據(jù)的內(nèi)在聯(lián)系將數(shù)據(jù)從一種編碼映射為另一種編碼,又叫壓縮編碼。,數(shù)據(jù)壓縮過程,數(shù)據(jù)壓縮方法的衡量指標(biāo)壓縮率:越大越好壓縮質(zhì)量:數(shù)據(jù)失真越小越好壓縮與解壓縮的速度:速度越快越好,2、數(shù)據(jù)壓縮方法,6.3 數(shù)據(jù)壓縮的編碼算法,一、無損壓縮:減少或去除數(shù)據(jù)中的冗余,可以無失真地還原成原來的數(shù)據(jù),一般適合壓縮數(shù)據(jù)或程序,但是壓縮比較小,一般在2:1到5:1

5、之間。,1. 行程編碼(游程編碼)原理:將連續(xù)相同的數(shù)據(jù)序列用重復(fù)次數(shù)和單個(gè)數(shù)據(jù)來表示。應(yīng)用:用于圖像文件的壓縮(尤其適合于由計(jì)算機(jī)生成的圖像)如bmp和tiff等圖像格式。 (1)多值信息的編碼 編碼格式:信息重復(fù)次數(shù)+被重復(fù)的信息 例: 字符串為:atttefppppppddddss 行程編碼為:a3tef6p4d2s (2)二值信息的編碼

6、 編碼格式:0或1重復(fù)的次數(shù) 例如二進(jìn)制數(shù)據(jù)流為 000111111000001111 假設(shè)行程約定以0開始,則編碼為:3654 若約定以1開始,則編碼為:03654,2. 哈夫曼(Huffman)編碼,算法步驟:(1)按照符號(hào)出現(xiàn)的概率大小進(jìn)行排序(2)把最小的兩個(gè)概率值相加,得到一個(gè)新的概率序列(3)重復(fù)上述兩個(gè)步驟,直到概率值為1 (4)從后往前進(jìn)行編碼,概率大的

7、賦予1,概率小的賦予0。 (反過來也可以)(5)寫出每個(gè)符號(hào)的碼字例1:字母A B C D E出現(xiàn)的概率分別為0.15、0.25、0.1、0.37和0.13,其哈夫曼編碼為:,A: 00B: 10C: 010D: 11E: 011,假設(shè)共有100個(gè)字符,若采用等長編碼,每個(gè)字符至少需要3位二進(jìn)制,100個(gè)字母需要300位,采用哈夫曼編碼則只需要15*2+25*2+10*3+37*2+13*3=223位。壓縮比為 300

8、:223 = 1.34:1,例2:字母A B C D E出現(xiàn)的概率分別為0.53、0.25、0.07、0.05和0.1, 其哈夫曼編碼為:,A: 1B: 01C: 0011D: 0010E: 000,若采用等長編碼,至少需要3位二進(jìn)制,100個(gè)字母需要300位,采用哈夫曼編碼則需要:53*1+25*2+7*4+5*4+10*3=181位壓縮比為 300:181 = 1.65:1,3、算術(shù)編碼,編碼原理:將

9、被編碼信源表示為[0,1)區(qū)間的一個(gè)實(shí)數(shù),根據(jù)各符號(hào)出現(xiàn)的概率構(gòu)造其所在區(qū)間,隨著信息字符的不斷出現(xiàn),其所在區(qū)間越來越小,對應(yīng)表示的實(shí)數(shù)也越來越小,那么表示這一消息所需的二進(jìn)制位數(shù)就越多。例:假設(shè)一個(gè)4個(gè)符號(hào)的信源A={a1,a2,a3,a4 } ,各符號(hào)出現(xiàn)的概率及起始編碼區(qū)間如下表。,如果要傳送的消息為a1a2a3a2,算術(shù)編碼過程為:區(qū)間計(jì)算方法: 新區(qū)間起始位置:前面區(qū)間起始位置 + 當(dāng)前區(qū)間左端 * 前面區(qū)間長度

10、 新區(qū)間長度:當(dāng)前符號(hào)的概率 * 前面區(qū)間長度,① a1,取值區(qū)間為[0, 0.2)② a2,起點(diǎn):0+0.2*0.2=0.04,長度0.4*0.2=0.08,新區(qū)間為 [0.04, 0.12)③ a3,起點(diǎn):0.04+0.6*0.08=0.088,長度0.2*0.08=0.016,新區(qū)間為 [0.088 ,0.104)④ a2,起點(diǎn):0.088+0.2*0.016=0.0912,長度0.4*0.016=0.0064,新區(qū)

11、間為 [0.0912 0.0976),二、有損壓縮:壓縮時(shí)會(huì)丟失部分?jǐn)?shù)據(jù),且丟失的數(shù)據(jù)無法恢復(fù)。是不可逆的壓縮,即解壓縮以后的數(shù)據(jù)與原始數(shù)據(jù)不完全一致。,,1. PCM(Pulse Code Modulation,脈沖編碼調(diào)制)采樣:按固定時(shí)間間隔獲取一個(gè)樣本值量化:按允許的誤差將樣本對應(yīng)到近似的數(shù)值(幅度上的離散化) 。有均勻量化和非均勻量化。編碼:用二進(jìn)制代碼表示采樣量化后的樣本值。,2.預(yù)測編碼(1)DPCM(差分脈沖編

12、碼調(diào)制),原始信號(hào)為:s,預(yù)測器產(chǎn)生的預(yù)測值為:s”預(yù)測誤差:e=s-s”發(fā)送端:發(fā)送經(jīng)過量化的誤差e’接收端:用相同的預(yù)測器獲得預(yù)測值s”, 輸出s’=s”+e’最終誤差為: s’-s = s”+e’-s = e’ – (s-s”) = e’-e(即量化器產(chǎn)生的量化誤差),(2)ADPCM(自適應(yīng)脈沖編碼調(diào)制) 自適應(yīng)量化:當(dāng)信號(hào)分布不均勻時(shí),能隨輸入信號(hào)的變化改變量化區(qū)

13、間的大小。自適應(yīng)預(yù)測:采用過去的樣本值估算下一個(gè)輸入樣本的預(yù)測值,得到最小的實(shí)際樣本值與預(yù)測值之間的差值。(3)幀間預(yù)測編碼 利用視頻圖像各幀之間的時(shí)間相關(guān)性,減少幀內(nèi)圖像信號(hào)的冗余,即不直接傳送當(dāng)前幀的像素值,而是傳送x和其前一幀或后一幀對應(yīng)像素x’之間的差值。運(yùn)動(dòng)補(bǔ)償?shù)膸g預(yù)測幀間內(nèi)插法(4) 線性預(yù)測編碼(Linear Predictive Coding,LPC) 采用過去的樣本值,以一種前向反饋的方

14、式預(yù)測當(dāng)前采樣值,預(yù)測值可以用過去p個(gè)樣本值的線性組合來表示。該方法被廣泛應(yīng)用于語音處理。,3. 變換編碼 將圖像信號(hào)從一個(gè)域(如時(shí)間域)變換到另外一個(gè)域(如頻率域),然后對變換后的信號(hào)進(jìn)行量化與編碼。,正交變換前兩個(gè)樣本的聯(lián)合事件,正交變換后兩個(gè)樣本的聯(lián)合事件,例:有兩個(gè)相鄰的數(shù)據(jù)樣本x1和x2,每個(gè)樣本采用3bit編碼,各自都有8個(gè)幅度等級(jí),兩個(gè)樣本的聯(lián)合事件共有64 種可能, 用64個(gè)點(diǎn)表示。對一般的像來說,兩個(gè)相鄰

15、的數(shù)據(jù)樣本很有可能出現(xiàn)近似的幅度,即很可能出現(xiàn)在x1=x2直線附近。,對該數(shù)據(jù)進(jìn)行正交變換,將坐標(biāo)系逆時(shí)針旋轉(zhuǎn)45度,在新坐標(biāo)系中y1對應(yīng)到x1=x2這條直線,那么變換后的數(shù)據(jù)樣本集中在y1軸上,對這部分?jǐn)?shù)據(jù)進(jìn)行量化、編碼和傳輸,其他數(shù)據(jù)不做處理,這樣就達(dá)到了壓縮數(shù)據(jù)的目的。,常用的變換編碼方法有:1、K-L變換2、傅立葉變換3、離散余弦變換等,1.電話語音壓縮標(biāo)準(zhǔn) 數(shù)據(jù):帶寬為200Hz~3.4kHz ,采樣頻率為8

16、kHz, 8位量化,傳輸速率為64kb/s 語音壓縮標(biāo)準(zhǔn):G.722(64kb/s)、G.721(32kb/s)、G.728(16kb/s)和G.729(8kb/s) 應(yīng)用:數(shù)字電話通信。,6.4 常用多媒體數(shù)據(jù)壓縮標(biāo)準(zhǔn)6.4.1 音頻壓縮標(biāo)準(zhǔn),2. 調(diào)幅廣播語音壓縮標(biāo)準(zhǔn) 數(shù)據(jù):帶寬為50hz ~ 7khz的調(diào)幅廣播語音,使用16kHz采樣頻率和14位量化位數(shù)時(shí),所對應(yīng)的速率為224kb/s。 語音壓縮標(biāo)準(zhǔn):G.72

17、2應(yīng)用:優(yōu)質(zhì)語音、音樂、音頻會(huì)議和視頻會(huì)議等。,3.高保真立體聲的寬帶音頻壓縮標(biāo)準(zhǔn) 數(shù)據(jù):采樣頻率44.1kHz,用16位量化,速率為每聲道705 kb/s 。語音壓縮標(biāo)準(zhǔn):MPEG音頻MPEG-1音頻: 層Ⅰ(簡化的ASPEC) 層Ⅱ(即MUSICAM,又稱MP2) 層Ⅲ(又稱MP3)。 MPEG-2音頻:多聲道,5.1聲道形式及7.1聲道形式 應(yīng)用:影劇院、家庭影院系統(tǒng),及將來

18、的高清晰度電視(HDTV)。,6.4.2 靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG (joint photographic experts group)聯(lián)合照片專家組 1.JPEG標(biāo)準(zhǔn) 適應(yīng)于彩色和單色多灰度或連續(xù)色調(diào)的靜止數(shù)字圖像。支持很高的圖像分辨率和量化精度,具有較高的壓縮比和圖像質(zhì)量。包含了基于DCT的有損壓縮方法和基于預(yù)測方法的無損壓縮方法。 2.JPEG2000標(biāo)準(zhǔn) 特征:支持低比特率傳輸,支持

19、無損和有損壓縮,象素精度和分辨率的漸進(jìn)式傳輸,感興趣域編碼,隨機(jī)碼流訪問和處理。 經(jīng)典算法:包含三個(gè)部分:小波變換、畫布坐標(biāo)系統(tǒng)、嵌入式優(yōu)化截?cái)嗑幋a(EBCOT)。,6.4.3 運(yùn)動(dòng)圖像和視頻壓縮編碼標(biāo)準(zhǔn)MPEG:運(yùn)動(dòng)圖像專家組(Moving Picture Experts Group) MPEG標(biāo)準(zhǔn)和HDTV標(biāo)準(zhǔn),視頻壓縮標(biāo)準(zhǔn)1.H.261和H.263標(biāo)準(zhǔn) 國際電信聯(lián)盟電信標(biāo)準(zhǔn)組織ITU-T 制定

20、H.261:主要用來支持在ISDN上進(jìn)行可視電話、視頻會(huì)議和其它視聽服務(wù)。H.263:主要用于公共電話交換網(wǎng)絡(luò)(PSTN)上的視頻會(huì)議和其它可視化服務(wù),旨在以盡可能低的碼率(64kpbs以下)進(jìn)行通信。2.H.26L標(biāo)準(zhǔn) 在所有碼率下都能持續(xù)提供較高的視頻質(zhì)量。 支持的圖像格式常用的有CIF和QCIF。更高的壓縮效率,更靈活的網(wǎng)絡(luò)適應(yīng)性,增強(qiáng)對于差錯(cuò)的魯棒性。,3.AVS標(biāo)準(zhǔn)2002.6 國家信息產(chǎn)業(yè)部科學(xué)技術(shù)司批

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論