基于內容及風格的離線手寫漢字鑒定算法研究.pdf_第1頁
已閱讀1頁,還剩85頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、對于未知人員手寫文字進行計算機識別與分析,基于其內容與書寫風格進行分類,進而鑒定書寫人類別是一項困難的任務。本文從圖像風格信息和文本語義信息兩個角度進行離線手寫漢字鑒定算法研究。圖像風格信息通過筆跡鑒定算法提取,文本語義信息通過字符識別和文本分類的方法提取。
  首先,鑒于深度學習中卷積神經網絡模型在圖像識別與分類中的出色性能,本文的筆跡鑒定和字符識別算法采用卷積神經網絡模型進行研究;而文本分類采用傳統(tǒng)的向量空間模型和主題模型進行

2、研究。接著,構建手寫漢字鑒定算法文本圖像數據庫,驗證鑒定算法有效性。最后,提出采用乘法規(guī)則,對圖像風格特征和文本語義特征進行信息融合,提升算法魯棒性。本文的主要內容有:
  1.針對卷積神經網絡中不同大小的卷積核提取圖像信息層次不同的特點,提出采用多級卷積特征提取結構代替卷積神經網絡中的第一個卷積和下采樣層。增強網絡的特征提取能力,并分別在離線中文筆跡鑒定和字符識別卷積神經網絡模型上進行改進驗證,提升模型鑒定和識別正確率。

3、  2.將改進后的字符識別HCCR-GoogLeNet模型,應用于文本無關離線中文筆跡鑒定領域,獲得端到端方法最佳性能。
  3.對比向量空間模型和主題模型在文本分類上的性能,提出將 Latent Dirichlet Allocation模型應用于匿名信分類場景。
  4.構建離線手寫漢字鑒定算法文本圖像數據庫,驗證基于風格和基于內容的鑒定算法有效性,并采用乘法規(guī)則對二者結果進行融合,提升鑒定算法魯棒性。
  通過本文

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論