1、傳統(tǒng)的奈奎斯特采樣理論要求采樣頻率不得小于信號(hào)最大帶寬的兩倍,采集到的信息少量被保存下來(lái),大部分信息被忽略掉,對(duì)硬件設(shè)備要求高且造成了資源浪費(fèi)。隨著信息科技的迅速發(fā)展,以奈奎斯特采樣定理進(jìn)行信息采集的技術(shù)越來(lái)越不能滿(mǎn)足人們對(duì)信號(hào)處理效率的要求,壓縮感知理論的提出解決了這一問(wèn)題,它可以將采樣和壓縮同時(shí)進(jìn)行。該理論是指信號(hào)在滿(mǎn)足稀疏性的前提下,信號(hào)的觀測(cè)序列由信號(hào)與觀測(cè)矩陣的乘積得到,且由較少個(gè)數(shù)的觀測(cè)序列可以準(zhǔn)確地恢復(fù)高維原始信號(hào)。語(yǔ)音信
2、號(hào)具有良好的可壓縮性,所以壓縮感知理論可以實(shí)現(xiàn)語(yǔ)音信號(hào)的壓縮重構(gòu)。不同于圖像領(lǐng)域,國(guó)內(nèi)外將CS用于語(yǔ)音信號(hào)處理領(lǐng)域的研究還比較少,處于起步階段。
本文研究了壓縮感知理論,并將壓縮感知理論應(yīng)用到語(yǔ)音信號(hào)處理中,描述了語(yǔ)音信號(hào)壓縮重構(gòu)的實(shí)現(xiàn)過(guò)程,介紹了重構(gòu)語(yǔ)音評(píng)價(jià)方法,并提出了幾點(diǎn)優(yōu)化改進(jìn),具體工作如下:
首先,本文圍繞信號(hào)稀疏表示、觀測(cè)矩陣的構(gòu)造和重構(gòu)算法研究三個(gè)主要方面闡述了壓縮感知理論。以專(zhuān)業(yè)語(yǔ)音庫(kù)中的男生和女生朗
3、讀語(yǔ)音作為實(shí)驗(yàn)對(duì)象,對(duì)比兩種常用重構(gòu)算法BP算法和OMP算法在語(yǔ)音信號(hào)壓縮重構(gòu)中的表現(xiàn),并研究了壓縮比和幀長(zhǎng)對(duì)語(yǔ)音重構(gòu)效果的影響。實(shí)驗(yàn)結(jié)果表明,同一重構(gòu)算法下,男聲的重構(gòu)質(zhì)量比女聲的要好;針對(duì)同一實(shí)驗(yàn)語(yǔ)音,BP算法要比OMP算法的重構(gòu)效果好。
其次,本文分析和比較了幾種壓縮感知常見(jiàn)的觀測(cè)矩陣在語(yǔ)音信號(hào)壓縮重構(gòu)過(guò)程中的性能,并對(duì)在不同的實(shí)驗(yàn)條件下觀測(cè)矩陣的選取提出建議。實(shí)驗(yàn)表明,壓縮比和幀長(zhǎng)是觀測(cè)矩陣選取的關(guān)鍵因素。在不同的壓縮
4、比和幀長(zhǎng)下,需要選取不同的觀測(cè)矩陣,以達(dá)到最好的語(yǔ)音重構(gòu)效果。
第三,文中從信號(hào)的稀疏表示著手,引入冗余字典中的緊框架算法,可以使得信號(hào)得到更加稀疏的表示,并與壓縮感知理論常用的高斯隨機(jī)矩陣進(jìn)行重構(gòu)語(yǔ)音質(zhì)量的比較。實(shí)驗(yàn)結(jié)果表明,緊框架矩陣相對(duì)于傳統(tǒng)常用的高斯隨機(jī)矩陣,在語(yǔ)音重構(gòu)過(guò)程中取得了更好的效果。
第四,文中加入心理聲學(xué)模型中的絕對(duì)聽(tīng)閾,把一些人耳聽(tīng)不見(jiàn)、無(wú)用的信號(hào)過(guò)濾掉,減少信號(hào)非零值,增加信號(hào)的稀疏度,以達(dá)到