版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、摘要摘要酷息時(shí)代呼喚著實(shí)用手寫體漢字識(shí)別(HandwritenChineseCharacterRecognitionHCCR)系統(tǒng)的出現(xiàn),因此對(duì)HCCR的研究迫在眉睫。漢字筆劃寬度(Strokewidth)是HCCR系統(tǒng)中最基本的統(tǒng)計(jì)特征,但手寫漢字的書寫很不規(guī)整,給筆劃寬度的確定帶來很大的困難婦丈文提出掃描首筆劃的概念和基于首筆劃的筆劃寬度確定算法,實(shí)驗(yàn)分析證明這種算法能有效克服了漢字筆劃傾斜和粘連所帶來的困難,具有很好的適應(yīng)性和魯棒
2、性。本文在仔細(xì)分析FanWu筆劃抽取算法優(yōu)缺點(diǎn)的基礎(chǔ)上,提出了基于Runlength游程的并行筆劃抽取算法,它能夠抵抗點(diǎn)陣中微小的凸起和凹陷噪聲,文中闡述的模糊筆劃連接概念為粗分類中的多筆劃匹配提供了有效信息。恤字識(shí)別研究方法包括:統(tǒng)計(jì)識(shí)別法和結(jié)構(gòu)識(shí)別法。前者不適用于手寫體漢字識(shí)別,后者使用漢字的本質(zhì)結(jié)構(gòu)特征,但要提取大字量、多字形的漢字本質(zhì)特征又太復(fù)雜了只有將二者結(jié)合起來刁‘有生命力,為特征的HCCR粗分類子系統(tǒng)方案,包括:因峙本文提
3、出了以筆劃結(jié)構(gòu)部首模式表達(dá)、部首模糊匹配、調(diào)整部首權(quán)重w和二級(jí)粗分類的思想。本文實(shí)現(xiàn)了一個(gè)包含26個(gè)部首的粗分類系統(tǒng),通過實(shí)驗(yàn)證明用部首位置、筆劃類型和筆劃關(guān)系表達(dá)部首模式的可行性,并提出了系統(tǒng)改進(jìn)的方向。關(guān)鍵字:筆劃寬度i粗分類、模糊筆劃連接模糊匹配第一章前言第一章前言1.1文字識(shí)別研究的歷史回顧和現(xiàn)狀文字識(shí)別是模式識(shí)別領(lǐng)域的一個(gè)重要研究分支,主要研究如何能夠讓計(jì)算機(jī)“認(rèn)識(shí)”印刷(或書寫)在紙張〔或其他介質(zhì))上文字的相關(guān)技術(shù)和系統(tǒng)。由
4、于早期字符識(shí)別系統(tǒng)都是首先利用光電轉(zhuǎn)換裝置(例如掃描儀)把字符圖像信息轉(zhuǎn)換為電信號(hào),然后送入計(jì)算機(jī)進(jìn)行模式分類識(shí)別,因此,文字識(shí)別又被稱為光學(xué)字符識(shí)別(OpticalCharacterRecognition,簡(jiǎn)稱OCR).目前,文字識(shí)別按所識(shí)別文字的種類一般分為西文字符識(shí)別、數(shù)字識(shí)別和漢字識(shí)別(ChineseCharacterRecognition,簡(jiǎn)稱CCR)三種。對(duì)前兩種f7題的研究始于19世紀(jì)初,目前己進(jìn)入應(yīng)用階段,研發(fā)出許多商用
5、西文字符識(shí)別系統(tǒng)。漢字識(shí)別問題的研究是隨著模式識(shí)別和人工智能研究的進(jìn)展,在西文和數(shù)字識(shí)別的基礎(chǔ)上開展起來的,20世紀(jì)70年代取得了初步的研究成果。由于漢字識(shí)別具有字符數(shù)量大、字體多、結(jié)構(gòu)復(fù)雜、字形相似等特點(diǎn),而且印刷(或書寫)質(zhì)量也有好有壞,這些都給漢字識(shí)別研究帶來了許多難以克服的困難。早期的漢字識(shí)別研究主要集中在日本,我國(guó)的漢字識(shí)別研究始于20世紀(jì)70年代,經(jīng)過廣大學(xué)者和科研人員近三十年的努力也取得了豐碩的成果,目前已經(jīng)有了商品化的漢
6、字識(shí)別系統(tǒng)面世。但是漢字識(shí)別遠(yuǎn)還沒有達(dá)到完全實(shí)用化的程度,這個(gè)領(lǐng)域中還有很多艱巨的任務(wù)、難關(guān)需要完成和解決,還需要國(guó)內(nèi)外研究人員長(zhǎng)期的共同努力。1.2漢字識(shí)別研究的范圍和應(yīng)用領(lǐng)域~、伴隨看信息時(shí)代前進(jìn)的腳步,漢字識(shí)別研究在建立漢字信息庫(kù)、實(shí)現(xiàn)漢字信息處理系統(tǒng)自動(dòng)化(例如辦公自動(dòng)化)等方面都起著舉足輕重的作用。它的應(yīng)用范圍非常廣泛,包括:高速自動(dòng)地將印刷體或手寫體漢字輸入計(jì)算機(jī),構(gòu)建智能計(jì)算機(jī)的智能接「l,將漢字圖像壓縮為漢字編碼減少存儲(chǔ)
7、、傳輸?shù)臄?shù)據(jù)量根據(jù)識(shí)別漢字類型的不同,漢字識(shí)別的研究?jī)?nèi)容包括:聯(lián)機(jī)手寫體漢字識(shí)別(OnlineHandwrittenChineseCharacterRecognition),印刷體漢字識(shí)別(PrintedChineseCharacterRecognitionPCCR),脫機(jī)手寫體漢字識(shí)別(OflineHandwritenChineseCharacterRecognitionHCCR)。對(duì)前兩種內(nèi)容的研究已經(jīng)進(jìn)入了實(shí)用化階段,而脫機(jī)手寫體
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于基本筆劃筆壓特征的手寫漢字筆跡鑒定的研究.pdf
- 手寫體漢字識(shí)別實(shí)驗(yàn)平臺(tái)及筆劃網(wǎng)格特征提取方法的研究.pdf
- 漢字筆跡的筆劃提取.pdf
- 基于動(dòng)態(tài)粗外圍方向線素特征的脫機(jī)手寫漢字識(shí)別.pdf
- 手寫粗體漢字的細(xì)化與特征提取研究.pdf
- 基于筆劃密度特征的二叉樹SVM脫機(jī)手寫體漢字識(shí)別方法研究.pdf
- 基于多特征融合和多分類器的手寫體漢字識(shí)別研究.pdf
- 基于實(shí)虛筆段方向特征粗分方法的聯(lián)機(jī)手寫漢字識(shí)別.pdf
- 基于筆段特征與方向特征的聯(lián)機(jī)手寫漢字識(shí)別研究.pdf
- 基于結(jié)構(gòu)特征的手寫體漢字識(shí)別研究.pdf
- 基于筆畫結(jié)構(gòu)特征的脫機(jī)手寫漢字識(shí)別.pdf
- 自由手寫體漢字脫機(jī)識(shí)別融合特征的研究.pdf
- 基于特征融合的脫機(jī)手寫體漢字識(shí)別.pdf
- 基于筆畫結(jié)構(gòu)特征的脫機(jī)手寫漢字識(shí)別
- 手寫體筆跡單筆劃提取算法研究.pdf
- 漢字文本圖處理與手寫體漢字識(shí)別.pdf
- 基于基本筆畫頻譜特征的手寫漢字筆跡鑒定的研究.pdf
- 在線手寫電路圖筆劃分割識(shí)別研究.pdf
- 脫機(jī)手寫體漢字識(shí)別的特征提取研究與實(shí)現(xiàn).pdf
- 手寫體漢字分割的研究與應(yīng)用.pdf
評(píng)論
0/150
提交評(píng)論