版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著科技的進步和國際技術交流的深入,大量新的科技術語會被引入到另外一種語言中使用,這些術語通常不是被另外創(chuàng)造新詞表示。日語也從別的語種(特別是英語)中引入詞語,并且利用音標字符片假名來表示引入的外來語。由于雙語詞典僅能覆蓋有限的片假名,基于詞典的機器翻譯系統(tǒng)不可能翻譯所有的片假名,因此未登陸片假名的翻譯問題也是機器翻譯需要解決的關鍵問題。
本文利用統(tǒng)計機器翻譯方法實現(xiàn)了片假名的自動翻譯,從片假名短語的分詞,片假名的翻譯,雙向翻
2、譯結果的融合,到翻譯結果短語的獲取以及翻譯結果的自動評測,實現(xiàn)了完整的片假名短語翻譯流程。其主要工作如下:
第一,與以往基于詞典的分詞方法不同,本文采用機器學習的方法進行片假名短語分詞。本文將片假名分詞問題轉化為序列標注問題,取前后三個片假名字符范圍內的上下文作為特征,然后引入條件隨機場來進行片假名分詞,實驗結果表明,基于條件隨機場的片假名分詞方法取得了較高的分詞準確率。
第二,采用基于短語的統(tǒng)計機器翻譯方法進行片假
3、名的翻譯,并在基于短語的機器翻譯方法的基礎上提出了一種雙向融合的策略進行片假名翻譯。該方法將片假名利用日英系統(tǒng)譯出英語單詞候選,然后將英語單詞候選利用英日系統(tǒng)再次翻譯,并將兩次翻譯結果進行融合得到最終的翻譯結果。實驗表明,基于雙向融合的翻譯方法比基于短語的日英翻譯方法的結果有明顯提高,取得了較為理想的效果。
第三,對于片假名短語的英語短語結果的獲取,本文使用了雙向融合打分值和短語語言模型兩個特征來指導英語短語結果的獲取,然后采
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 日語假名片假名學習
- 平假名、片假名練習題
- 卡通平片假名表
- 日語平假名和片假名一覽表
- 【標準日本語基礎—五十音圖(平假名、片假名發(fā)音口型及練習)】
- アイロニ歌詞(日文+平假名+羅馬音+中文)
- 清末民初中日文字交流研究——以漢字、假名、注音字母為例.pdf
- 漢語詞“通信”“通訊”的日文翻譯方法
- 初級日語(假名)
- [中文翻譯]日文sai教程1
- 英漢機器翻譯系統(tǒng)中術語自動翻譯技術的研究.pdf
- 假名書寫練習
- 基于歸納學習法的日語假名和漢語實體對自動獲取方法.pdf
- 假名與漢字的關系對照(表格)
- 如何識別真假名表
- “假名牌”那些事兒
- 女書、假名及諺文比較研究.pdf
- 面向機器翻譯的模板自動獲取技術研究.pdf
- 從等效原則看中日文學翻譯中的文化誤讀.pdf
- 小幸運日文歌詞及中文翻譯如下
評論
0/150
提交評論