版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、語(yǔ)義障礙是自然語(yǔ)言處理的一個(gè)攔路石,當(dāng)然也是影響提高機(jī)器翻澤譯文質(zhì)量的因素之一。機(jī)器翻譯中的“義障”主要在于自然語(yǔ)言詞匯語(yǔ)義的不確定性,這種不確定性往往使得翻譯系統(tǒng)難以做出恰當(dāng)?shù)淖g詞選擇。從評(píng)測(cè)的角度來(lái)看,在譯文質(zhì)量?jī)?yōu)劣的評(píng)價(jià)因素中,語(yǔ)義因素?zé)o疑也是權(quán)重最高的評(píng)判標(biāo)準(zhǔn)。在語(yǔ)言本體研究中,語(yǔ)義研究一直是重中之重,前人運(yùn)用不同的理論和方法,對(duì)自然語(yǔ)言的語(yǔ)義及語(yǔ)義關(guān)系進(jìn)行了不同層面的描寫,編纂了各種釋義詞典(對(duì)詞匯語(yǔ)義的描寫)、義類詞典(對(duì)詞
2、匯聚合語(yǔ)義關(guān)系的描寫)和搭配詞典(對(duì)詞匯組合語(yǔ)義關(guān)系的描寫)等;在自然語(yǔ)言處理研究中,語(yǔ)義的處理方興未艾,計(jì)算語(yǔ)言學(xué)家也依據(jù)不同的語(yǔ)義體系,構(gòu)建了大型語(yǔ)義知識(shí)庫(kù)和機(jī)器可讀的語(yǔ)義詞典等。然而,上述研究仍不能滿足機(jī)器翻譯對(duì)譯詞選擇的語(yǔ)義分析的要求,更無(wú)法為量化的譯文質(zhì)量評(píng)價(jià)提供切實(shí)可行的語(yǔ)義依據(jù)。為此,我們有必要為機(jī)器翻譯這個(gè)特定的自然語(yǔ)言處理領(lǐng)域做專門的語(yǔ)義研究。 本文在前人語(yǔ)義研究的基礎(chǔ)上,人工總結(jié)了英-漢機(jī)器翻譯系統(tǒng)中英語(yǔ)動(dòng)詞
3、的語(yǔ)義特征組合模式,在此基礎(chǔ)上提出了一種基于“語(yǔ)義特征組合模式”的動(dòng)詞譯詞選擇方案。首先,通過(guò)知識(shí)庫(kù)融合的方法從英語(yǔ)FrameNet和英漢雙語(yǔ)HowNet中生成了常見(jiàn)的英語(yǔ)多義動(dòng)詞839個(gè),在大量真實(shí)語(yǔ)料和詞典例句語(yǔ)料的基礎(chǔ)上對(duì)其語(yǔ)義特征組合模式進(jìn)行了歸納總結(jié),現(xiàn)已完成412個(gè)英語(yǔ)多義動(dòng)詞的2546種語(yǔ)義特征組合模式的提取工作。在每種模式中,我們都給出了該英語(yǔ)動(dòng)詞相對(duì)應(yīng)的漢語(yǔ)可選譯詞。在此基礎(chǔ)上構(gòu)建了供機(jī)器翻譯譯詞選擇所“專用”的“雙語(yǔ)
4、動(dòng)詞語(yǔ)義詞典(BiVSD)”,利用BiVSD中這2000余種語(yǔ)義特征組合模式及其所涉及英語(yǔ)動(dòng)詞的漢語(yǔ)可選譯詞,輔以動(dòng)詞語(yǔ)法語(yǔ)義特征,機(jī)器翻譯系統(tǒng)就可以準(zhǔn)確判斷出該動(dòng)詞在一個(gè)具體語(yǔ)境中的恰當(dāng)譯詞,從而選擇出恰當(dāng)?shù)淖g詞。確定了基于語(yǔ)義特征組合模式的譯詞選擇方案之后,本文圍繞機(jī)器翻譯過(guò)程對(duì)原語(yǔ)分析、譯詞選擇和譯文生成各個(gè)階段進(jìn)行了分析,界定了命題、小句和句子的定義,提出了主觀性語(yǔ)義特征的概念并分析其在譯詞選擇中的作用,并具體分析了兩種特殊結(jié)構(gòu)
5、中的動(dòng)詞譯詞選擇方法。最后,以個(gè)案研究的方式,對(duì)含有英語(yǔ)多義動(dòng)詞beat的176句英文原句進(jìn)行動(dòng)詞的譯詞選擇,實(shí)驗(yàn)結(jié)果譯詞選擇正確率為89.2%,模式匹配正確率為98.8%,模式匹配覆蓋度為94.9%。 在譯文評(píng)價(jià)方面,本文首先對(duì)上述譯詞選擇方法進(jìn)行比對(duì)評(píng)價(jià):選取800個(gè)動(dòng)詞中的200個(gè)典型多義動(dòng)詞,從語(yǔ)料庫(kù)中抽取含有這200個(gè)動(dòng)詞的例句共1000個(gè)例句(每個(gè)動(dòng)詞抽取含有該動(dòng)詞的例句5句),建立語(yǔ)義選擇測(cè)試集。分別通過(guò)語(yǔ)義特征組
6、合模式、機(jī)器翻譯系統(tǒng)和人工選擇三種方法選擇每句原文中動(dòng)詞的恰當(dāng)義項(xiàng),將這三種形式的譯詞選擇結(jié)果分別與參考譯文中的譯詞進(jìn)行比較,得到每種形式與參考譯文譯詞的吻合度。比對(duì)實(shí)驗(yàn)結(jié)果表明語(yǔ)義特征組合模式的譯詞選擇結(jié)果吻合度為92.7%,遠(yuǎn)遠(yuǎn)高于機(jī)器翻譯譯詞選擇結(jié)果(52.3%),也高于人工選擇的結(jié)果(88.06%)。此外,本文還提出一種基于模糊集的多語(yǔ)言點(diǎn)譯文質(zhì)量綜合評(píng)價(jià)方法,該方法綜合了待評(píng)價(jià)譯文的語(yǔ)義、語(yǔ)法、語(yǔ)用和語(yǔ)篇諸因素,利用模糊數(shù)學(xué)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 編寫教學(xué)目標(biāo)行為動(dòng)詞選擇表
- 基于語(yǔ)義知識(shí)的動(dòng)詞隱喻識(shí)別與應(yīng)用.pdf
- 文言實(shí)詞選擇
- 搜索引擎優(yōu)化的關(guān)鍵詞選擇評(píng)價(jià)研究.pdf
- 基于謂詞選擇率估計(jì)的SPARQL查詢優(yōu)化.pdf
- 基于語(yǔ)義相似度的漢語(yǔ)未登錄動(dòng)詞語(yǔ)義框架識(shí)別.pdf
- 面向譯文選擇的雙語(yǔ)語(yǔ)義詞典自動(dòng)構(gòu)建研究.pdf
- 語(yǔ)義場(chǎng)中具有“變化”語(yǔ)義的動(dòng)詞研究.pdf
- 指示代詞選擇的整合模型與英漢指示對(duì)比.pdf
- 基于語(yǔ)義相似度的漢語(yǔ)未登錄動(dòng)詞語(yǔ)義框架識(shí)別
- 基于語(yǔ)義地圖的漢英言說(shuō)類動(dòng)詞對(duì)比研究.pdf
- 基于產(chǎn)品設(shè)計(jì)領(lǐng)域的動(dòng)詞塊語(yǔ)義分析.pdf
- 俄語(yǔ)動(dòng)詞前綴的語(yǔ)義研究.pdf
- 俄語(yǔ)動(dòng)詞Дymatь的語(yǔ)義研究.pdf
- 視覺(jué)動(dòng)詞SEE的語(yǔ)義變化與主觀化.pdf
- 英漢作格動(dòng)詞的句法與語(yǔ)義研究.pdf
- 動(dòng)詞“放”的語(yǔ)義角色分析.pdf
- 基于心語(yǔ)假說(shuō)與NP移位非賓格動(dòng)詞的語(yǔ)義與句法解析.pdf
- 俄語(yǔ)轉(zhuǎn)遞動(dòng)詞的語(yǔ)義研究.pdf
- 位移介質(zhì)動(dòng)詞的語(yǔ)義與論元表達(dá)
評(píng)論
0/150
提交評(píng)論