版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、音頻信息處理技術(shù),http://www.hd8go.com http://www.hd88go.com http://www.sj93.cn http://www.oemgc.com http://www.189288.com http://www.hzp580.com http://www.yjoem.com http://www.oemdg.com http://www.xcdnpx.com http://www.skfjk.com
2、 http://www.oemdg.com http://www.zhongtezc.com http://www.yanjigz.com http://www.zg-nsk.com http://www.ygcooper.com http://www.skf-zt.cn http://www.nsk-zt.com http://www.fag-zt.com http://www.zhongtezc.com http://www.ntn
3、-zt.com http://www.189286.com http://www.xcdnpx.com http://www.dgxcdn.com http://www.dgxcpx.com http://www.xcwxpx.com http://www.xunchi-px.com http://www.0759mz.com http://www.lczx188.com http://www.189287.com http://www
4、.oemfy.com http://www.jnxrt.com http://www.topbrightness.com http://www.ort-zc.com/,,,第2頁/共68頁,本章導(dǎo)讀,音頻信息處理技術(shù)是多媒體信息處理的主要技術(shù)之一,它使計算機具備了錄音、聲音編輯、語音合成、聲音播放等功能。在MPC中,可以通過聲音傳遞信息、制造效果、營造氣氛及演奏音樂等。目前的音頻信息處理技術(shù)主要包括模擬聲音信號的數(shù)字化、數(shù)據(jù)壓縮編碼、數(shù)
5、字音效處理、音頻文件存儲、傳輸、播放等內(nèi)容。本章主要介紹聲音信號及其數(shù)字化的基本概念、音頻卡的組成及其工作原理、數(shù)字音頻的采集與編輯、MIDI音樂以及幾個常用的音頻處理軟件等內(nèi)容,并以Adobe Audition3.0版本為例,詳細介紹音頻信息編輯處理的具體方法。,http://www.hd8go.com http://www.hd88go.com http://www.sj93.cn http://www.oemgc.com http
6、://www.189288.com http://www.hzp580.com http://www.yjoem.com http://www.oemdg.com http://www.xcdnpx.com http://www.skfjk.com http://www.oemdg.com http://www.zhongtezc.com http://www.yanjigz.com http://www.zg-nsk.com http
7、://www.ygcooper.com http://www.skf-zt.cn http://www.nsk-zt.com http://www.fag-zt.com http://www.zhongtezc.com http://www.ntn-zt.com http://www.189286.com http://www.xcdnpx.com http://www.dgxcdn.com http://www.dgxcpx.com
8、http://www.xcwxpx.com http://www.xunchi-px.com http://www.0759mz.com http://www.lczx188.com http://www.189287.com http://www.oemfy.com http://www.jnxrt.com http://www.topbrightness.com http://www.ort-zc.com/,,,第3頁/共68頁,本
9、章主要內(nèi)容,4.1 音頻基礎(chǔ)知識 4.2 音質(zhì)標(biāo)準(zhǔn)與評價4.3 音頻的數(shù)字化與編碼4.4 音頻卡4.5 數(shù)字音頻的采集與編輯4.6 MIDI音樂,,,第4頁/共68頁,4.1 音頻基礎(chǔ)知識,4.1.1 聲音的物理特征,聲音是由物體振動產(chǎn)生的,并以聲波形式通過介質(zhì)(如空氣、水、金屬等)傳播。物理上,聲音可以用一條連續(xù)曲線來表示,,如圖4-1 。物體振動的最大位移稱為振幅A,聲波中兩個連續(xù)波峰(或波谷)之間的距離稱
10、為周期T,周期,的倒數(shù)1/T即為頻率f,以赫茲(Hz)為單位,頻率反映了單位時間(1秒)物體振動的次數(shù)。,,,第5頁/共68頁,聲音按頻率可分為三類:音頻、次聲、超聲,低于20Hz的聲音稱為次聲 頻率范圍在20Hz~20kHz范圍的可聽聲音稱為音頻, 其中人說話發(fā)出的語音信號的頻率范圍是300Hz~3kHz 頻率高于20kHz的稱為超音頻(或超聲),可聽的音頻聲音又可分為語音、樂音、效果音、合成音、噪音(聲)等五種。,,,第
11、6頁/共68頁,4.1.2 音頻三要素,音頻有三個主要屬性,分別是音調(diào)、音強和音色,它們既反映了音頻信號的基本特征,也是人感受聲音信號的三個主要因素,因此又被稱為音頻三要素。 音調(diào):又稱音高,反映聲音的高低程度,由聲音信號的頻率大小所決定。頻率越大,音調(diào)越高;頻率越小,音調(diào)越低。 音強:又稱響度,反映聲音的大小或強弱,由振幅和聲源距離共同決定。振幅越大,距離越小,音強(響度)越大。 音色:又稱音質(zhì),反映聲音的品
12、質(zhì),它由振動物體(聲源)的材料、結(jié)構(gòu)、狀態(tài)等自身因素決定,表現(xiàn)為聲源的頻帶寬度。,,,第7頁/共68頁,4.1.3 數(shù)字音頻的三種形式,音頻(Audio)是指頻率在20Hz~20kHz范圍內(nèi)的可聽聲音,是多媒體信息中的一種媒體類型——聽覺類媒體。 目前多媒體計算機中的音頻主要有波形音頻、CD音頻和MIDI音樂3種形式。1、波形音頻: 是由外部聲音源通過數(shù)字化過程采集到多媒體計算機中的所有聲音形式。可通過編輯(
13、裁剪、合成、效果等)、編碼壓縮、存儲、傳輸以及還原播放等方式進行處理。在波形音頻中,有一類特殊的聲音需要特別提到,即人的語音。語音是波形聲音中人的說話聲音,具有內(nèi)在的語言學(xué)、語音學(xué)的內(nèi)涵。,,,第8頁/共68頁,2、CD音頻 CD-音頻(CD-Audio)是存儲在音樂CD光盤中的數(shù)字音頻,可以通過CD-ROM驅(qū)動器讀取并采集到多媒體計算機系統(tǒng)中,并以波形音頻的相應(yīng)形式存儲、傳輸和處理。3、MIDI音樂 也稱MIDI音頻
14、。它將音樂符號化并保存在MIDI文件中,并通過音樂合成器產(chǎn)生相應(yīng)的聲音波形來還原播放。 音頻是時間的函數(shù),具有很強的前后相關(guān)性,所以實時性是音頻處理的基本要求。,,,第9頁/共68頁,4.1.4 數(shù)字音頻的文件格式,音頻文件通常分為兩大類:聲音文件 和 MIDI文件下表介紹幾種常用的音頻文件格式及后綴名:,,,第10頁/共68頁,4.1.5 音頻處理工具軟件簡介,,音頻工具軟件在內(nèi)容上主要指處理數(shù)字音頻和MIDI樂譜的各
15、種工具軟件,在功能上包括音頻采集、編輯、合成、編碼壓縮以及MIDI樂譜的創(chuàng)作、編輯、發(fā)布等環(huán)節(jié)。 按照音頻處理的基本過程,通常可把音頻工具軟件分為: 1、MIDI制作軟件 2、音頻處理軟件 3、音頻壓縮軟件 4、音樂CD刻錄軟件,,,第11頁/共68頁,4.2 音質(zhì)標(biāo)準(zhǔn)與評價,4.2.1 音質(zhì)等級標(biāo)準(zhǔn),音質(zhì)是指音頻信號經(jīng)傳輸、處理后所再現(xiàn)的聲音質(zhì)量(保真度)。,,,第12頁/共6
16、8頁,4.2.2 音質(zhì)客觀評價,客觀評價是指通過檢測儀器測量音頻信號的技術(shù)指標(biāo)來進行聲音質(zhì)量評價,主要技術(shù)指標(biāo)有:頻帶寬度、動態(tài)范圍和信噪比等。,理論上,聲音信號是由許多頻率不同的分量信號組合而成的復(fù)合信號,因此,聲音的頻帶寬度特指復(fù)合聲音信號的頻率范圍,范圍越大,頻帶越寬,可包含的音頻信號(諧波)越豐富,因而聲音質(zhì)量就越高。 實際上,再現(xiàn)聲音(特別是樂音)的質(zhì)量與所用的播放設(shè)備和場地條件有關(guān)。高質(zhì)量的音頻信號要通過高品質(zhì)的音
17、響設(shè)備在較好的音響環(huán)境中,才能再現(xiàn)出高質(zhì)量的音響效果。對于音響設(shè)備而言,主要關(guān)注失真度、頻響、瞬態(tài)響應(yīng)、信噪比、聲道分離度、聲道平衡度等指標(biāo)。,,,第13頁/共68頁,4.2.3 音質(zhì)主觀評價,主觀評價是指通過人聆聽各種聲音而產(chǎn)生的好惡感覺來進行聲音質(zhì)量評價。 1、語音質(zhì)量評價方法 常用的主觀評價方法有:平均主觀分法,失真平均主觀分法,判斷滿意度測量法等。 ITU-TP800標(biāo)準(zhǔn)中定義的MOS,它將語音質(zhì)量分為5級,如表所
18、示:,,,第14頁/共68頁,2、樂音質(zhì)量評價 樂音音質(zhì)的優(yōu)劣取決于多種因素,如聲源特性、音響器材的信號特性、聲場特性、聽覺特性等。因此,對音響設(shè)備再現(xiàn)的樂音音質(zhì)的準(zhǔn)確評價難度較大。 主觀評價樂音音質(zhì),一般是通過再現(xiàn)樂音的響度、音調(diào)和音色的變化及其組合來評價音質(zhì)的, 幾種典型的聽感:定位感 ,空間感 ,層次感 ,厚度感 ,立體感 。除此之外,還有力度感、亮度感、臨場感、軟硬感、松緊感、寬窄感等許多評價音質(zhì)的聽感。,,,第1
19、5頁/共68頁,4.3 音頻的數(shù)字化與編碼,計算機在處理音頻信號之前,必須將模擬的聲音信號數(shù)字化,形成數(shù)字音頻。具體過程包括:采樣、量化、編碼。,4.3.1 采樣與采樣頻率,采樣是每間隔一段時間讀取一次聲音信號幅度,使聲音信號在時間上被離散化,如圖4-2所示。采樣的主要參數(shù)是采樣頻率 。,,,,第16頁/共68頁,采樣頻率:是指將模擬聲音波形數(shù)字化時,每秒鐘所抽取聲波幅度樣本的次數(shù),其計算單位是kHz(千赫茲)。如圖4-3是模擬聲音
20、信號數(shù)字化時的采樣圖示。,一般來講,采樣頻率越高聲音失真越小,用于存儲數(shù)字音頻的數(shù)據(jù)量也越大。 采樣頻率的高低是根據(jù)聲音信號本身的最高頻率和采樣定理決定的。,圖4-3 聲音信號采樣,,,第17頁/共68頁,采樣定理:在進行模擬/數(shù)字信號的轉(zhuǎn)換過程中,當(dāng)采樣頻率fs大于信號中最高頻率fmax的2倍時,即fs>=2fmax,采樣之后的數(shù)字信號完整地保留了原始信號中的信息。采樣定理又叫奈奎斯特定理(Nyquist theory
21、)。,表4-4 不同音質(zhì)數(shù)字音頻的常用采樣率,,,第18頁/共68頁,4.3.2 量化與量化位數(shù),量化就是把采樣得到的聲音信號幅度轉(zhuǎn)換為數(shù)字值,是聲音信號在幅度上被離散化。 量化位數(shù)n定義了每個采樣點的數(shù)據(jù)范圍(0~2n-1),也叫量化等級,量化等級的多少決定了聲音的動態(tài)范圍。,圖4-4 量化位數(shù)與動態(tài)范圍,,,第19頁/共68頁,4.3.2 量化與量化位數(shù),表4-5 不同音質(zhì)的量化位數(shù)、量化范圍、動態(tài)范圍,,,第20
22、頁/共68頁,4.3.3 聲道,聲道個數(shù)是反映音頻數(shù)字化質(zhì)量的另一個因素。單聲道:采集聲音數(shù)據(jù)時,僅采集一個聲波的數(shù)據(jù)雙聲道(立體聲):采集兩個聲波數(shù)據(jù)多聲道(環(huán)繞立體聲):采集兩個以上聲波數(shù)據(jù)聲道數(shù)越多,再現(xiàn)出的音響效果就越好。,,,第21頁/共68頁,4.3.4 音頻采樣的數(shù)據(jù)量,數(shù)字音頻的數(shù)據(jù)量主要取決于兩個因素:音質(zhì)因素:由采樣頻率、量化位數(shù)和聲道數(shù)3個參數(shù)決定。時間因素:單位時間的數(shù)據(jù)量可用下式表示:,v:為
23、單位時間的數(shù)據(jù)量(Kbps)fc:為采樣頻率(kHz)b:為量化位數(shù)(bit)s:為聲道數(shù),4.3.5 音頻數(shù)據(jù)編碼,音頻數(shù)據(jù)壓縮方法分類,PCM為脈沖調(diào)制編碼,DPCM為差分脈沖調(diào)制編碼,ADPCM為自適應(yīng)差分脈沖調(diào)制編碼,,VSELP為矢量和激勵線性預(yù)測編碼,MPLPC為多脈沖激勵線性預(yù)測編碼,CELP為碼本激勵線性預(yù)測編碼。,,,第23頁/共68頁,4.3.6 音頻編碼標(biāo)準(zhǔn),1、一般語音音質(zhì)的音頻壓縮標(biāo)準(zhǔn),特點:
24、音質(zhì)低,能聽到聲音就可以應(yīng)用:各類提示音壓縮標(biāo)準(zhǔn): CCITT A Law CCITT μ Law 低采樣率或低量化位數(shù)的PCM,,,第24頁/共68頁,2、電話音質(zhì)的音頻壓縮標(biāo)準(zhǔn)頻率范圍:300Hz~3.4kHz,用標(biāo)準(zhǔn)的PCM編碼。壓縮標(biāo)準(zhǔn): G系列音頻壓縮標(biāo)準(zhǔn)G系列音頻壓縮標(biāo)準(zhǔn)利用的技術(shù): 線性預(yù)測技術(shù) 矢量量化技術(shù) 綜合分析技術(shù)典型的算法:
25、 ADPCM CELP LD-CELP(短時延碼本激勵線性預(yù)測編碼) RPE-LTP(長時線性預(yù)測規(guī)則碼激勵) VSELP(矢量和激勵線性預(yù)測編碼),,,第25頁/共68頁,表4-6 電話音質(zhì)的音頻編碼標(biāo)準(zhǔn),,,第26頁/共68頁,3、 AM廣播音質(zhì)的音頻壓縮標(biāo)準(zhǔn)頻率范圍:50Hz~7kHz 壓縮標(biāo)準(zhǔn):ITU制定的G.722標(biāo)準(zhǔn) G.72
26、2標(biāo)準(zhǔn)采用的算法:SB-ADPCM(子帶ADPCM)SB-ADPCM算法:將現(xiàn)有的帶寬分成兩個獨立的子帶信道,使輸入信號進入濾波器組分成高子帶信號和低子帶信號,然后分別進行ADPCM編碼,最后進入混合器形成輸出碼流,,,第27頁/共68頁,4、高保真立體聲音頻壓縮標(biāo)準(zhǔn)包括:CD-DA以上音質(zhì)、FM廣播音質(zhì)FM廣播音質(zhì)頻率范圍:20Hz~15kHz CD-DA音頻信號的頻率范圍:50Hz~20kHz 壓縮標(biāo)準(zhǔn): 1)M
27、PEG1,MPEG2的layer1、2、3,MPEG 4 AAC音頻編碼,杜比AC-3等。用于數(shù)字廣播、數(shù)字電視廣播、消費電子產(chǎn)品、音頻信息的存儲和下載等。 2)ITU-T G.722.1、3GPP AMR-WB+和3GPP 2 4GV-WB 。用于像3G通信這樣的高音質(zhì)低碼率應(yīng)用場合。,,,第28頁/共68頁,4.4 音頻卡 4.4.1 音頻卡的功能,錄制和播放數(shù)字聲音文件 控制音量和混音效果 聲音文件的壓縮與解壓
28、縮 MIDI接口與音樂合成,,,第29頁/共68頁,4.4.2 音頻卡的組成與工作原理,,,,第30頁/共68頁,音頻卡的主要功能部件:功率放大器、混合信號處理器、DSP數(shù)字信號處理器、音樂合成器以及相關(guān)的外圍接口等。 聲音的合成與處理:由DSP數(shù)字聲音處理器、音樂合成器及MIDI接口控制器組成,主要任務(wù)是完成聲波信號的模/數(shù)、數(shù)/模轉(zhuǎn)換,利用調(diào)頻技術(shù)控制聲音的音調(diào)、音色和幅度。 混合信號處理器及功率放大器:內(nèi)置數(shù)字/
29、模擬混音器,混音器的聲源可以是MIDI信號、CD音頻、線性輸入、話筒以及PC機的揚聲器等,可以選擇輸入一個聲源或?qū)讉€不同聲源進行混合錄音。,4.4.3 音頻卡的I/O接口,,圖4-7 音頻卡的外圍接口連接示意圖,,,第32頁/共68頁,4.4.3 音頻卡的I/O接口,,圖4-8 支持5.1環(huán)繞的聲卡插口,,,,第33頁/共68頁,4.5 數(shù)字音頻的采集與編輯,一般的數(shù)字音頻采集首先需要選擇和設(shè)置恰當(dāng)?shù)牟蓸訁?shù),然后再開始錄音
30、采集,最后再使用相應(yīng)的編輯軟件對錄制的音頻數(shù)據(jù)進行剪輯和效果處理。 4.5.1 錄音采集 選擇采樣參數(shù) 調(diào)整輸入音頻的頻響 檢測輸入音頻的強度 開始錄音,,,第34頁/共68頁,圖4-9 設(shè)置錄音參數(shù),1、選擇采樣參數(shù),首先要根據(jù)實際情況選擇最佳的采樣參數(shù),做到音質(zhì)與數(shù)據(jù)量的折中考慮,避免采樣過程中出現(xiàn)存儲空間不足的現(xiàn)象發(fā)生。,CD音質(zhì)、電話質(zhì)量收音質(zhì)量Default Quality,,,,第35頁/共68頁,2.調(diào)
31、整輸入音頻的頻響,表4-7 各頻段參數(shù)對音質(zhì)的影響,,,第36頁/共68頁,3、檢測輸入音頻的強度 在Win2K環(huán)境下,可通過“音量控制”對話框來檢測、調(diào)節(jié)進入計算機的音源強度。 ① 打開Windows下的音量控制臺,選擇菜單欄中的“選項”→“屬性”命令打開“屬性”對話框。,圖4-10 音量控制臺,,,第37頁/共68頁,② 在“屬性“對話框中的音量調(diào)節(jié)選項中選擇“錄音”,在顯示音量控制欄中選中麥克風(fēng)等選項,如圖
32、4-11所示。 ③ 在彈出的錄音控制臺中選中麥克風(fēng)或線路輸入或CD音頻,使相應(yīng)的音源有效,如圖4-12所示。,圖4-11 “屬性”對話框 圖4-12 錄音控制對話框,,,第38頁/共68頁,4、開始錄音,圖4-11 錄音機操作面板,,,第39頁/共68頁,4.5.2 抓取CD、VCD和DVD音軌,獲取數(shù)字音頻的另一個快捷途徑就是從不同的多媒體產(chǎn)品中直接抓取音軌信息,并轉(zhuǎn)換
33、壓縮成所需的音頻格式。 WaveLab 5.0版 :抓取音樂CD、DVD中的音軌 “豪杰超級解霸”軟件:抓取音樂CD、VCD或DVD光盤等格式音軌 豪杰超級解霸9.0版 :可從DVD、VCD、RM/RMVB、AVI、MPG、MV等音視頻混合的媒體中提取音頻信息,并保存為一種稱為DAC高音質(zhì)壓縮格式或WAV、MP3格式的聲音文件 注意:在使用抓取音軌來采集數(shù)字音頻時,應(yīng)該遵守有關(guān)法律
34、規(guī)定,取得相應(yīng)的使用權(quán),避免以后出現(xiàn)知識產(chǎn)權(quán)糾紛。,,,第40頁/共68頁,4.5.3 編輯數(shù)字音頻,音頻編輯一般包括音頻內(nèi)容剪切、合成以及音質(zhì)和效果的編輯等方面。,① 多音軌(Multiple Tracks)② 切邊(Trimming)③ 拼接和組合(Splicing and Assembly)④ 音量調(diào)節(jié)(Volume Adjustments)⑤ 格式轉(zhuǎn)換(Format Conversion)⑥ 重采樣或降低采樣率(Re
35、sampling or Down sampling) ⑦ 淡進淡出(Fade-ins and Fade-outs)⑧ 均衡(Equalization) ⑨ 時間拉伸(Time Stretching)⑩ 數(shù)字信號處理(Digital Signal Processing-DSP),,,第41頁/共68頁,4.6 MIDI音樂,4.6.1 什么是MIDI,MIDI(Musical Instrument Digital Inter
36、face)樂器數(shù)字接口。它是由Yamaha、Roland等公司在1983年聯(lián)合提出并不斷發(fā)展確定的數(shù)字音樂的國際標(biāo)準(zhǔn),它規(guī)定了電子樂器和多媒體計算機之間進行連接的硬件及數(shù)據(jù)通信協(xié)議,是多媒體計算機所支持的又一種聲音產(chǎn)生方法——MIDI方法。 MIDI方法就是將數(shù)字式電子樂器的彈奏過程記錄下來,如選的是什么樂器,彈下哪一個鍵,用了多大力氣,持續(xù)了多長時間等。 MIDI格式的數(shù)字化文件可以看作是樂譜的數(shù)字化描述,它記錄的不
37、再是聲音的波形,而是樂器的種類以及音階的高低、長短、強弱、速度等因素,這些被稱為MIDI消息,存儲為MIDI文件。,,,第42頁/共68頁,4.6.2 MIDI設(shè)備的配置與連接,一件樂器只要包含了能處理MIDI信息的微處理器以及相關(guān)的硬件接口,就可以認(rèn)為是一臺MIDI設(shè)備。 兩臺MIDI設(shè)備之間可以通過接口發(fā)送信息而進行相互通信。 一臺MIDI設(shè)備可以有1~3個端口:MIDI In 接口:接收來自其它MIDI設(shè)備上
38、的MIDI信息;MIDI Out接口:用來輸出本設(shè)備生成的MIDI信息; MIDI Thru接口:將從MIDI In端口傳來的信息發(fā)送到另一臺相聯(lián)的MIDI設(shè)備上。,,,第43頁/共68頁,接收設(shè)備的MIDI In連接器內(nèi)常采用光電耦合器實現(xiàn)收、發(fā)設(shè)備之間的電氣隔離。 MIDI信息采用異步串行方式傳輸,傳輸速率為31.25 Kbps。 在進行MIDI通信時,用戶可以通過標(biāo)準(zhǔn)的MIDI電纜來相互連接各端口。如圖
39、4-14所示。,圖4-14 MIDI與游戲接口電纜,,,第44頁/共68頁,圖4-14 多媒體計算機與MIDI設(shè)備連接示意圖,MIDI軟件(音序器)是用于記錄、編輯和播放MIDI文件的一種軟件,其作用相當(dāng)于是MIDI樂器的一臺多軌磁帶錄音機。,MIDI設(shè)備可以配備電子鍵盤、合成器、音序器(MIDI軟件)以及揚聲器或音箱等。 MIDI鍵盤主要用于產(chǎn)生MIDI信息 MIDI合成器是一種電子設(shè)備,使用數(shù)字信號處理器或其他
40、類型的芯片產(chǎn)生音樂或聲音。,,,第45頁/共68頁,4.6.3 播放MIDI音樂,聲卡播放MIDI音樂最常用的方法有兩種:FM合成與波表(WaveTable)合成。 FM是運用聲音振蕩的原理對MIDI進行合成處理的。 波表合成,效果較好。它是將各種真實樂器所能發(fā)出的所有聲音(包括各個音域、聲調(diào))錄制下來,存儲在聲卡的ROM中,稱為硬波表。,,,第46頁/共68頁,4.6.4 制作MIDI音樂,制作MIDI音樂,需要按
41、圖4-14的示意構(gòu)成系統(tǒng)。 樂譜創(chuàng)作軟件能夠錄制、編輯、打印MIDI樂譜并播放MIDI音樂。有些樂譜創(chuàng)作軟件還能對樂譜進行量化來調(diào)節(jié)節(jié)拍的不一致問題。 MIDI編輯中很重要的是選擇MIDI樂器,MIDI標(biāo)準(zhǔn)規(guī)定了不同的演奏樂器并用編號加以區(qū)分,范圍在0~127之間,見附錄三。 在MIDI樂譜中,樂器ID用來決定以何種樂器來播放樂曲,為改變樂器,只需改變該數(shù)值即可。 MIDI是為多媒體項目創(chuàng)建原始音樂
42、素材的最佳途徑。準(zhǔn)備發(fā)布時應(yīng)將其轉(zhuǎn)換成數(shù)字音頻數(shù)據(jù)。 創(chuàng)作MIDI樂譜的軟件:Cakewalk(Cakewalk 9.0x版),,,第47頁/共68頁,4.6.5 樂譜的掃描與識別,除了通過MIDI方法創(chuàng)作樂譜(MIDI音樂)以外,還可以利用掃描-識別技術(shù),快速將印刷樂譜數(shù)字化,保存為MIDI樂譜。 SmartScore軟件掃描識別過程: 首先,通過掃描儀將樂譜以圖像的方式掃描成數(shù)字圖像,掃描參數(shù)的選擇與設(shè)置:
43、 分辨率:一般選擇150~300 dpi, 圖像類型:黑白二值或OCR, 掃描后的圖片存儲格式:TIF格式; 然后,通過樂譜識別功能識別出可編輯的數(shù)字樂譜并進行校對、編輯。,,,第48頁/共68頁,SmartScore也可以打開事先存儲好的樂譜圖片并進行識別,識別完成后會提示將識別的結(jié)果保存為SmartScore專用格式的.enf文件。,,,第49頁/共68頁,4.6.6 MIDI與數(shù)字音頻的比較,,,第50頁/
44、共68頁,MIDI具有以下幾個優(yōu)點: ① MIDI文件比數(shù)字音頻文件尺寸更小,MIDI文檔的大小與播放質(zhì)量完全無關(guān)。 ②由于MIDI文件非常小,可以嵌入到網(wǎng)頁中,因此下載和播放要比相當(dāng)?shù)臄?shù)字音頻速度快。 ③ 在有些情況下,如果使用的MIDI聲源質(zhì)量很高,MIDI將會比數(shù)字音頻文件聽起來更好。 ④ MIDI數(shù)據(jù)是完全可編輯的,可對MIDI音樂的音符、音高、輸出設(shè)備等很小的樂譜單元作精確編輯和修改。,,,第5
45、1頁/共68頁,MIDI也有以下幾方面的不足: ① 由于MIDI數(shù)據(jù)并不表示實際的聲音,而是音樂設(shè)備的聲音,因此只要MIDI的播放設(shè)備與制作MIDI時使用的設(shè)備不一樣,就無法保證播放的最佳效果完全無誤。 ② 采用MIDI無法表示語音信號。 采用數(shù)字音頻還有兩個,而且經(jīng)常起決定性作用的原因: Macintosh和Windows平臺為數(shù)字音頻提供了更多的應(yīng)用軟件和系統(tǒng)支持。 創(chuàng)建數(shù)字音頻的準(zhǔn)備和編程并不需要具備
46、音樂理論的專業(yè)知識,但是處理MIDI數(shù)據(jù)不但需要了解音頻制作,而且需要對音樂樂譜、鍵盤和音符有所了解。,,,第52頁/共68頁,4.7 音頻工具軟件,Adobe Audition是Adobe公司的音頻處理產(chǎn)品,簡稱Au,是一款集音頻錄制、混合、編輯和控制于一身的音頻處理工具軟件。 可以錄制、混合、編輯和控制數(shù)字音頻文件,也可輕松創(chuàng)建音樂、制作廣播短片、修復(fù)錄制缺陷等,以獲得所需的音頻處理效果。,Au 3.0是Adobe 公司20
47、07年11月8發(fā)布的新版音頻處理軟件,其擴充或增強的新功能包括:,4.7.1 Au 3.0的新特性,,,第53頁/共68頁,支持VSTi虛擬樂器;增強的頻譜編輯器。增強的多軌編輯:新效果:包括卷積混響、模擬延遲、母帶處理系列工具、電子管建模壓縮;iZotope授權(quán)的Radius時間伸縮工具;新增吉他系列效果器;可快速縮放波形頭部和尾部;增強的降噪工具和聲相修復(fù)工具;更強的性能:對多核心CPU進行優(yōu)化;波形編輯工具:,
48、,,第54頁/共68頁,4.7.2 Au 3.0的工作模式,Au 3.0的工作模式:編輯模式:編輯模式提供強有力的單軌編輯能力 ,具體操作和編輯處理在“編輯視圖”中完成。 多軌模式:多軌模式提供最多128個音軌的多音軌混合能力,具體操作和處理在“多軌視圖”中完成。 CD模式:CD模式提供CD光盤刻錄所需的操作功能,具體操作和處理在“CD視圖”中完成。 利用Au 3.0的集成處理環(huán)境,使用者可以在不同模式之間“無縫”切換
49、,同時進行單軌編輯、多軌混合和制作CD光盤等工作,制作出專業(yè)水準(zhǔn)的音頻。,,,第55頁/共68頁,4.7.3 編輯視圖,,,第56頁/共68頁,4.7.3 編輯視圖,主菜單:包括“文件”、“編輯”、“視圖”、“效果”、“生成”、“收藏”、“選項”、“窗口”、“幫助”等9個菜單項。 視圖切換按鈕:位于“文件”主菜單下方,包括“編輯”、“多軌”和“CD”三個按鈕 傳送器面板:定義了單軌和多軌視圖下的音頻播放和錄音操作,包括停止、播放、暫
50、停、從指針處播放、循環(huán)播放、快進、快倒、轉(zhuǎn)到開始或上一個標(biāo)記、轉(zhuǎn)到結(jié)尾或下一個標(biāo)記、錄音等。 時間面板:用于顯示操作過程中音頻時間線指針的具體時間。,,,第57頁/共68頁,縮放面板:定義了編輯音軌的橫向(時間線或采樣率)、縱向(幅度)的放大、縮小操作。,圖4-18 音頻波形的橫向放大效果圖示,,,第58頁/共68頁,選擇/查看面板:定義了顯示了音軌窗口目前可看到的音頻信號的起始時間位置、結(jié)束時間為止以及時間長度。如圖4-17中的選
51、擇/查看面板。 電平面板:顯示播放音頻時的信號電平。其他面板:視圖中的文件面板、效果面板、收藏夾面板等與主菜單中的“文件”、“效果”、“收藏夾”基本對應(yīng)。,,,第59頁/共68頁,4.7.4 多軌視圖,,,第60頁/共68頁,多軌視圖與編輯視圖不同的內(nèi)容主要表現(xiàn)在主菜單、主群組、混音器三個方面,其他內(nèi)容與編輯視圖的相應(yīng)內(nèi)容相同或相似。 1.主菜單:包括“文件”、“編輯”、“剪輯”、“視圖”、“插入”、“效果”、“選項”、“窗
52、口”、“幫助”等9個主菜單項 。與編輯視圖主菜單的不同主要有:文件,插入,剪輯。 文件:定義了對音頻會話(Session)文件的相關(guān)操作,一個會話中可包含多個音頻文件,便于多軌編輯 。 插入:定義了多軌視圖下的相關(guān)插入操作。 剪輯:定義了多軌視圖下的相關(guān)剪輯操作。 2.混音器:是一種將多路輸入的各種音頻信號,通過各種調(diào)節(jié)、混合形成一路輸出信號的音頻處理設(shè)備。如圖4-20。,,,第61頁/共68頁,3.主群
53、組:由多個音軌組成,提供多音軌編輯能力。,圖4-20 Au3.0的混音器面板,,,第62頁/共68頁,4.7.5 CD視圖,Au 3.0的CD視圖(CD View)是一個提供CD光盤內(nèi)容編輯和光盤刻錄功能的人機操作界面,它由主菜單、視圖切換按鈕、文件面板、主群組組成。如圖4-21所示。,,,第63頁/共68頁,1.主菜單:包括“文件”、“編輯”、“視圖”、“插入”、“選項”、“窗口”、“幫助”等7個主菜單項 。 文件:定義了
54、與CD列表相關(guān)的相應(yīng)操作 ,同是提供針對單個音頻文件的導(dǎo)入操作。 插入:定義了CD視圖下的相關(guān)插入操作, 選項:提供查看光盤可錄機設(shè)備屬性的操作。 2.主群組:提供CD列表的編輯能力。,,,第64頁/共68頁,本章小結(jié),通過本章學(xué)習(xí),應(yīng)掌握以下知識點:音頻是指頻率在20 Hz~20 kHz范圍的可聽聲音,音頻處理是多媒體計算機系統(tǒng)的主要功能之一,它將計算機的處理能力擴展到了聽覺媒體。多
55、媒體計算機系統(tǒng)中的聲音主要包括數(shù)字音頻和MIDI音樂兩種類型,CD音樂是數(shù)字音頻的一種存在形式。數(shù)字音頻是通過將模擬音頻信號數(shù)字化后取得的,而音頻數(shù)字化包括采樣、量化、編碼壓縮等3個環(huán)節(jié)。音頻數(shù)字化過程中,需要注意音質(zhì)和采樣參數(shù)的合理選擇問題。,,,第65頁/共68頁,音頻的編碼壓縮是為了解決音頻信息的大數(shù)據(jù)量存儲和傳輸問題,國際上制定了許多相關(guān)標(biāo)準(zhǔn),以規(guī)范數(shù)字音頻處理和傳輸。音頻處理的基本過程包括采樣、量化、編碼壓縮、編輯、存儲、傳
56、輸、解碼、播放等若干環(huán)節(jié)。數(shù)字音頻編輯包括音頻內(nèi)容、格式、效果等方面的處理。內(nèi)容處理主要指通過選擇、裁剪、粘貼等操作實現(xiàn)內(nèi)容的拼接、合并、剪輯等;格式處理則主要指不同音頻格式文件的聲音格式轉(zhuǎn)換;效果處理則包含更為豐富的內(nèi)容,例如淡入、淡出、去噪、均衡音量、音軌混合等。最終實現(xiàn)音頻處理的目的。,,,第66頁/共68頁,MIDI音樂是另一種與數(shù)字音頻(又稱波形音頻)完全不同的一種標(biāo)準(zhǔn)音頻形式,MIDI文件中保存的是用MIDI消息(或指令)
57、所表示的樂譜,播放時,MIDI樂譜通過相應(yīng)的聲音合成器就會發(fā)出美妙的樂聲,然后通過揚聲器播放出來。因此,MIDI音樂的音質(zhì)是與設(shè)備相關(guān)的。MIDI實際上就是數(shù)字化的樂譜。MIDI文件與各種格式的數(shù)字音頻文件相比,其文件尺寸非常小,所以MIDI適合于處理能力較差的環(huán)境使用,如互聯(lián)網(wǎng)絡(luò)、低檔電腦。,,,第67頁/共68頁,市面上的音頻工具軟件很多,按照音頻處理的工作流程需要,可分為音樂制作、音頻處理、音頻壓縮和音樂光盤(包括CD-Audi
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 視頻信息處理技術(shù)
- 多媒體視頻信息處理
- 音頻信息隱藏技術(shù)研究.pdf
- 音頻信息的獲取
- 云視頻信息處理技術(shù)在食品追溯中的應(yīng)用.pdf
- 智能信息處理技術(shù)
- 圖像信息處理技術(shù)
- 智慧社區(qū)中的視頻信息處理技術(shù)及應(yīng)用研究.pdf
- 第二章 音頻信息的獲取與處理
- 音頻信息隱藏關(guān)鍵技術(shù)的研究.pdf
- 多媒體信息處理技術(shù)
- 醫(yī)學(xué)信息處理新技術(shù)
- 音頻信息的采集與加工
- 音頻信息的采集與編輯
- 網(wǎng)絡(luò)多媒體系統(tǒng)視頻信息處理的研究.pdf
- 交通視頻信息處理系統(tǒng)設(shè)計與實現(xiàn).pdf
- 第二章 音頻信息的獲取與處理47909
- 第二章 音頻信息的獲取與處理48376
- 數(shù)字音頻信息隱藏技術(shù)的研究.pdf
- 現(xiàn)代音頻編碼中的立體聲相關(guān)信息處理技術(shù)研究.pdf
評論
0/150
提交評論