版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、機(jī)器音譯就是根據(jù)發(fā)音將給定的源語言中的專有名詞自動(dòng)翻譯成目標(biāo)語言對(duì)應(yīng)的詞匯的過程。相對(duì)于機(jī)器翻譯而言,機(jī)器音譯不存在語義層次的翻譯要求,并且是一種順序翻譯的過程,不存在音譯對(duì)之間調(diào)序問題,所以機(jī)器音譯是一種相對(duì)弱化的機(jī)器翻譯。因此機(jī)器音譯的研究對(duì)于機(jī)器翻譯而言具有重要的理論意義。目前不斷增長的全球化趨勢(shì)需要跨過語言壁壘獲得全世界范圍內(nèi)的有效有價(jià)值的信息,因此機(jī)器音譯在跨語言應(yīng)用中的作用也日益凸現(xiàn),機(jī)器音譯的研究因此也受到越來越多的關(guān)注。
2、
不同語系間的機(jī)器音譯存在著巨大的挑戰(zhàn)性,如英/漢之間的機(jī)器音譯。因其采用不同字母表和發(fā)音系統(tǒng),音譯過程相當(dāng)復(fù)雜且存在眾多導(dǎo)致音譯性能下降的因素。目前關(guān)于中英文的跨語言應(yīng)用研究有很多,本文調(diào)研了近三年機(jī)器音譯研究現(xiàn)狀,對(duì)重要會(huì)議上發(fā)表的所有16篇音譯相關(guān)文獻(xiàn)中提出的新方法進(jìn)行了全面而詳實(shí)的分析,通過比較,本文采用性能較好的基于字形的英漢機(jī)器音譯框架,首先探索了語料規(guī)模的擴(kuò)大對(duì)于音譯性能的影響,進(jìn)而引入判別學(xué)習(xí)解決英漢音譯中提高
3、性能的瓶頸問題,即改進(jìn)音譯單元對(duì)齊效果的問題,并探討了不同的半指導(dǎo)學(xué)習(xí)樣本對(duì)于判別式模型的作用,以期獲得較好的學(xué)習(xí)性能。本文即是從提高英漢機(jī)器音譯性能的可能途徑入手,研究改進(jìn)音譯的方法。
具體的講,本文從以下幾個(gè)方面進(jìn)行了研究:
1.本文進(jìn)行了語料規(guī)模對(duì)于機(jī)器音譯性能影響的研究。在基于字形的英漢機(jī)器音譯框架下,采用了噪聲通道模型(NCM)和聯(lián)合信源通道模型(JSCM)建模以捕捉字形的上下文信息,并進(jìn)行了兩種模型下機(jī)器
4、音譯性能實(shí)驗(yàn)。進(jìn)而進(jìn)行不同語料規(guī)模的實(shí)驗(yàn),研究語料規(guī)模給基于字形機(jī)器音譯帶來的改變。
2.利用EM算法進(jìn)行了英漢音譯單元等級(jí)上的對(duì)齊研究,并引入判別學(xué)習(xí)方法解決英漢音譯單元對(duì)齊中存在的問題。本文使用了新的音譯單元對(duì)齊EMD方法,并通過實(shí)驗(yàn)比較了EM算法和EMD方法獲得的對(duì)齊語料的性能。實(shí)驗(yàn)表明采用EMD算法提高了英漢機(jī)器音譯單元對(duì)齊的性能。
3.本文介紹了現(xiàn)有的機(jī)器學(xué)習(xí)方法,及判別學(xué)習(xí)框架下的機(jī)器音譯單元對(duì)齊方法,并
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于字形的英漢機(jī)器音譯方法的研究與實(shí)現(xiàn).pdf
- 英漢人名音譯的研究.pdf
- 英漢人名音譯方法的研究與實(shí)現(xiàn).pdf
- 英漢翻譯中的音譯及其用字規(guī)范研究.pdf
- 基于語言生成法的英漢機(jī)器翻譯研究.pdf
- 基于實(shí)例的英漢機(jī)器翻譯系統(tǒng).pdf
- 音譯詞研究.pdf
- 基于E-Chunk的英漢機(jī)器翻譯系統(tǒng).pdf
- 基于語料庫的英漢“機(jī)器與工具”詞匯的隱喻研究.pdf
- 英漢語字形和字義象似性對(duì)比.pdf
- 音譯用字規(guī)范研究.pdf
- 名詞性短語的英漢機(jī)器互譯研究.pdf
- 基于漢語虛詞用法的機(jī)器翻譯改進(jìn)研究.pdf
- 基于英漢平行語料庫的機(jī)器翻譯知識(shí)獲取研究.pdf
- 基于音節(jié)切分的維吾爾人名漢字音譯研究與實(shí)現(xiàn).pdf
- 基于群機(jī)器人特征的改進(jìn)微粒群算法研究.pdf
- 基于改進(jìn)蟻群算法的迷宮機(jī)器人的研究.pdf
- 基于Link-grammer英漢詞層機(jī)器翻譯系統(tǒng).pdf
- 基于字形的筆跡鑒定系統(tǒng).pdf
- 基于機(jī)器學(xué)習(xí)的中國移動(dòng)業(yè)務(wù)監(jiān)控方法改進(jìn)研究.pdf
評(píng)論
0/150
提交評(píng)論