版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、網(wǎng)絡(luò)的普及和發(fā)展給語言學(xué)習(xí)和語言測(cè)試提供了前所未有的機(jī)遇和發(fā)展空間。隨著客觀題測(cè)試技術(shù)的日趨完善,主觀題的自動(dòng)測(cè)評(píng)讓語言測(cè)試者備感興趣,同時(shí)也給語言測(cè)試帶來了新的挑戰(zhàn)。學(xué)生英譯漢網(wǎng)上自動(dòng)測(cè)評(píng)研究具有很高的理論意義和實(shí)用價(jià)值。學(xué)生譯文與標(biāo)準(zhǔn)譯文的比對(duì)、測(cè)評(píng)是漢語語義理解和概念相似性分析研究,其理論探索有意義,技術(shù)實(shí)現(xiàn)也有難度。 本文研究學(xué)生英譯漢網(wǎng)上自動(dòng)測(cè)評(píng)問題,內(nèi)容包括實(shí)踐嘗試、理論探討、網(wǎng)上實(shí)現(xiàn)、部分標(biāo)準(zhǔn)譯文自動(dòng)生成四個(gè)部分。
2、實(shí)踐嘗試包括字符串完全匹配、關(guān)鍵詞匹配、詞語相似度計(jì)算、同義詞匹配和句式匹配等一系列有效實(shí)驗(yàn),并取得了較好的效果,與人工測(cè)評(píng)的相關(guān)系數(shù)達(dá)到了0.58(一般人工評(píng)分員之間公認(rèn)的相關(guān)系數(shù)為0.7~0.75)。理論探討包括學(xué)生英譯漢網(wǎng)上自動(dòng)測(cè)評(píng)問題的本質(zhì)以及與機(jī)器翻譯系統(tǒng)、漢語主觀題、標(biāo)準(zhǔn)化考試中的英譯漢三種自動(dòng)測(cè)評(píng)的區(qū)別。結(jié)合認(rèn)知心理學(xué)分析了測(cè)評(píng)中的相似度、離散度、容納度及有關(guān)理論和技術(shù)難點(diǎn)。理論模型將測(cè)評(píng)問題分解為相似度等四個(gè)子問題。網(wǎng)上
3、實(shí)現(xiàn)基于現(xiàn)有中文信息處理資源,設(shè)計(jì)了測(cè)評(píng)系統(tǒng)流程和算法,創(chuàng)建了自動(dòng)測(cè)評(píng)網(wǎng)站,完善了必要的網(wǎng)站結(jié)構(gòu)及其功能,研究了題庫(kù)結(jié)構(gòu)并逐步積累題庫(kù)資源,從而初步完成了測(cè)評(píng)的工程化,實(shí)施了學(xué)生英譯漢的網(wǎng)上自動(dòng)測(cè)評(píng)。實(shí)際效果表明學(xué)生英譯漢網(wǎng)上自動(dòng)測(cè)評(píng)已達(dá)到了實(shí)用要求。最后探索了利用網(wǎng)絡(luò)資源為標(biāo)準(zhǔn)譯文庫(kù)自動(dòng)生成和篩選源自英語名詞短語的標(biāo)準(zhǔn)譯文候選項(xiàng),以及利用語義對(duì)候選項(xiàng)進(jìn)行再次篩選等深層理論和應(yīng)用技術(shù)問題。實(shí)驗(yàn)結(jié)果表明,自動(dòng)語義篩選方法的正確率為84.2
4、1%,召回率為76%。實(shí)踐證明詞頻統(tǒng)計(jì)和詞語語義的雙重篩選方法可以使自動(dòng)生成的候選項(xiàng)基本達(dá)到標(biāo)準(zhǔn)譯文數(shù)量和質(zhì)量上的要求。方法論上,創(chuàng)新研究不是從算法比較開始,而是從學(xué)生譯文分析和測(cè)評(píng)問題的本質(zhì)及實(shí)踐探索開始,旨在認(rèn)識(shí)問題的實(shí)質(zhì)及其關(guān)鍵。重視實(shí)踐過程,數(shù)據(jù)分析及其相關(guān)理論:具有獨(dú)特特點(diǎn)的漢語語義理論,涉及人腦學(xué)習(xí)機(jī)制的認(rèn)知理論。 本文的創(chuàng)新點(diǎn)主要在于: 一、凸現(xiàn)本質(zhì),攻克難點(diǎn)。首次對(duì)學(xué)生英譯漢自動(dòng)測(cè)評(píng)問題進(jìn)行實(shí)踐探索和理論
5、探討,提出測(cè)評(píng)問題的本質(zhì)是基于語義的自動(dòng)測(cè)評(píng)。在現(xiàn)有中文信息處理相關(guān)理論和技術(shù)條件下,采用關(guān)鍵詞匹配和詞語語義相似度計(jì)算的混合方法實(shí)現(xiàn)自動(dòng)測(cè)評(píng),超越了通常單純字符串匹配的局限性。其難點(diǎn)在于如何處理好相似度、離散度和容納度三者之間的關(guān)系。給出了學(xué)生英譯漢網(wǎng)上自動(dòng)測(cè)評(píng)模型。 二、技術(shù)獨(dú)特,分類處理?!霸~語對(duì)比分析器”首次采用詞語分類對(duì)比方法,對(duì)不同詞類(名詞、動(dòng)詞、形容詞和副詞)采用不同的基于語義的自動(dòng)評(píng)分方法,有別于現(xiàn)有常規(guī)的不分
6、詞類的相似度單一算法,明顯提高了譯文對(duì)比時(shí)的精確度,而對(duì)其它詞類仍采用關(guān)鍵詞匹配,更貼切真實(shí)地反映了學(xué)生的實(shí)際水平。此外,設(shè)計(jì)了“句式對(duì)比分析器”,采用人工設(shè)計(jì)標(biāo)準(zhǔn)譯文句式模板,實(shí)現(xiàn)了句子層次上的全局評(píng)分,從而更客觀地反映了學(xué)生的理解程度。 三、獨(dú)辟蹊徑,生成譯文。自動(dòng)篩選源自英語名詞短語的部分標(biāo)準(zhǔn)譯文候選項(xiàng)時(shí),首次提出了在概念意義層次上對(duì)比英漢詞語、篩選漢譯短語的方法,從而實(shí)現(xiàn)自動(dòng)語義篩選。將詞語表達(dá)式提升到概念層次,克服單純
7、字串匹配所帶來的弊端,試圖反映學(xué)生心智上對(duì)詞語的認(rèn)知,從而在較高層次,即復(fù)合概念層次,而不是從單個(gè)概念上,客觀地反映學(xué)生對(duì)語言的理解和掌握程度。實(shí)踐證明,該方法對(duì)源自英語名詞短語“N1N2”和“N1ofN2”的漢語譯文的自動(dòng)語義篩選,成效顯著。 四、注重實(shí)用,工程實(shí)現(xiàn)。研制了面向?qū)嵱玫南到y(tǒng),建成了自動(dòng)測(cè)評(píng)網(wǎng)站,實(shí)現(xiàn)了學(xué)生網(wǎng)上注冊(cè)、網(wǎng)上選題、網(wǎng)上限時(shí)做題、網(wǎng)上提交譯文、網(wǎng)上即時(shí)反饋和電子郵件反饋評(píng)分結(jié)果及標(biāo)準(zhǔn)譯文等功能,在當(dāng)前國(guó)內(nèi)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
評(píng)論
0/150
提交評(píng)論