版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、音樂是一類重要的音頻數(shù)據(jù),傳統(tǒng)的音樂檢索都是關(guān)鍵詞的檢索,在實(shí)際應(yīng)用方面受到限制。隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展和數(shù)字化設(shè)備的普及,基于內(nèi)容的音樂檢索研究得到了廣泛的關(guān)注。本文針對(duì)基于內(nèi)容的音樂檢索的關(guān)鍵技術(shù)展開深入的研究:提出了鋼琴單音符識(shí)別方法、音樂和弦特征的表示方法和識(shí)別算法。主要完成了如下工作:
⑴在研究計(jì)算機(jī)音樂的發(fā)展和基本樂理的基礎(chǔ)上,定義了音樂特征的分類,將音樂特征分為:基本特征、部分特征和整體特征,為下一步的音樂
2、識(shí)別研究打下基礎(chǔ)。
⑵根據(jù)音樂和聲學(xué)理論結(jié)合語音信號(hào)的特性,選取MFCC(Mel-Frequency Cepstral Coefficients)作為單音信號(hào)的特征,并對(duì)特征矢量維數(shù)的選擇進(jìn)行了討論,分別利用RBF神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)對(duì)鋼琴88個(gè)單音進(jìn)行識(shí)別,實(shí)驗(yàn)均取得了100[%]的識(shí)別結(jié)果。實(shí)驗(yàn)結(jié)果表明所選識(shí)別網(wǎng)絡(luò)對(duì)識(shí)別鋼琴單音信號(hào)是有效的。
⑶研究了在西方音樂和弦識(shí)別中使用頻率較高的音級(jí)輪廓(Pitch
3、 Class Profile簡(jiǎn)稱PCP)特征及其計(jì)算方法,并給出了具體的計(jì)算公式。針對(duì)PCP特征在低頻段信息模糊的缺陷并結(jié)合人耳聽覺特性,提出了音樂和弦識(shí)別的新特征:MPCP(Mel PCP)。論文基于隱馬爾可夫模型(Hidden Markov Model HMM)構(gòu)建了音樂和弦識(shí)別系統(tǒng),定義了36個(gè)狀態(tài),每個(gè)狀態(tài)代表一類和弦;通過一個(gè)12維的多元高斯函數(shù)擬合觀察向量的概率分布,該模型分別由高斯函數(shù)的均值向量和協(xié)方差向量來定義。論文借助
4、Chris Harte制作的標(biāo)簽文件訓(xùn)練得到有監(jiān)督的HMM。識(shí)別過程通過Viterbi算法,對(duì)輸入信號(hào)依照極大似然法來尋找最佳路徑,即最佳的和弦序列。論文把兩種特征均應(yīng)用于識(shí)別系統(tǒng)中并分析了識(shí)別的結(jié)果。
⑷為了保證推導(dǎo)正確性,隱馬爾可夫模型在識(shí)別中存在嚴(yán)格的獨(dú)立性假設(shè),限制了觀察值之間的相關(guān)性。針對(duì)上述原因本文提出了基于條件隨機(jī)場(chǎng)(Conditional Random Fields,CRFs)的音樂和弦識(shí)別算法。通過對(duì)HM
5、M和CRFs兩種模型在音樂識(shí)別結(jié)果的對(duì)比:HMM的數(shù)學(xué)復(fù)雜度和訓(xùn)練時(shí)間都低于CRFs,但是整體識(shí)別率遠(yuǎn)遠(yuǎn)落后于CRFs。
⑸研究了文化算法(Cultural Algorithm CA)的框架和原理,針對(duì)CRFs訓(xùn)練時(shí)間長(zhǎng)和參數(shù)估計(jì)中出現(xiàn)的問題,提出了一種嵌入文化算法的CRFs:CA—CRFs,并將新算法應(yīng)用在音樂和弦識(shí)別中,與以前算法相比,新算法不僅提高了識(shí)別率,而且縮短了計(jì)算時(shí)間。
⑹針對(duì)文化算法中個(gè)體數(shù)目
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 音樂和弦識(shí)別的研究_4305.pdf
- 基于聽覺圖像的音樂和弦識(shí)別研究.pdf
- 輪廓特征在SLAM算法中的應(yīng)用研究.pdf
- 基于支持向量機(jī)的音樂和弦識(shí)別的研究_18208.pdf
- 巴托克音樂中的代表性和弦――極音和弦
- 圖像特征識(shí)別算法及其在聾人視覺識(shí)別中的應(yīng)用研究.pdf
- 論和弦外音及其演進(jìn)——和弦外音在歌曲鋼琴伴奏中的應(yīng)用.pdf
- 流行音樂和聲中的功能音級(jí)色彩相關(guān)技法之研究
- LPP算法在人臉識(shí)別中的應(yīng)用研究.pdf
- 咳嗽音特征提取及在身份識(shí)別中的應(yīng)用研究.pdf
- 分組特征選擇算法及其在火焰視頻早期識(shí)別中的應(yīng)用研究.pdf
- 電腦音樂技術(shù)在高師音樂和聲課教學(xué)中的應(yīng)用
- SOFM算法在圖像識(shí)別中的應(yīng)用研究.pdf
- ICA算法在人臉表情識(shí)別中的應(yīng)用研究.pdf
- 改進(jìn)的PSO算法在人臉識(shí)別中的應(yīng)用研究.pdf
- 進(jìn)化特征提取算法及其在人臉和表情識(shí)別中的應(yīng)用研究.pdf
- 遺傳算法在PCA人臉識(shí)別算法中的應(yīng)用研究.pdf
- ica算法在人臉表情識(shí)別中的應(yīng)用研究
- BP算法及其在目標(biāo)識(shí)別中的應(yīng)用研究.pdf
- 融合算法在測(cè)井曲線識(shí)別中的應(yīng)用研究.pdf
評(píng)論
0/150
提交評(píng)論