基于主成分分析和神經網絡的蛋白質糖基化位點的預測.pdf_第1頁
已閱讀1頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著計算機科學和生物科學的不斷發(fā)展,生物信息學這門學科已成為當下生命科學和自然科學的重大前沿領域之一,同時也是21世紀自然科學的核心領域之一,其研究重點主要體現在基因組學和蛋白組學兩個方面。糖基化是蛋白質翻譯后重要修飾過程之一,更是蛋白組學研究的重要內容。鑒于已知的糖蛋白結構十分有限,而新的糖蛋白結構層出不窮,借助計算智能技術對糖基化位點進行預測和分析在蛋白質組學中具有十分重要的意義。
   主成分分析(PCA)是一種數據特征提

2、取技術,它能將數據從高維降到低維,降維后保存了數據的主要信息,從而使數據更容易處理,且提高了分析效率。傳統(tǒng)的神經網絡方法已被應用預測蛋白質糖基化位點,其預測的準確性主要依賴于特征向量的維數(蛋白質序列的長度),并隨著蛋白質序列長度的增加而提高,但神經網絡的結構變得越來越復雜,增加了計算運行成本。為了解決這一問題,本研究提出了一個主成分分析和BP神經網絡相結合的新方法對O-連接糖基化位點進行預測和分析。首先用PCA提取主成分以降低輸入特征

3、向量的維數,然后用神經網絡預測一個特定的蛋白質序列是否被糖基化。
   本研究主要圍繞以下幾個方面進行開展:
   (1)首先從闡述蛋白質糖基化的知識入手,著重介紹了稀疏編碼,并將其作為本研究中蛋白質序列的編碼方式。
   (2)采用主成分分析技術完成數據的預處理,在充分利用原始信息的基礎上,將樣本數據從高維降到低維,從而使神經網絡在下一步的預測中更具效率。
   (3)提出一種基于PCA和BP神經網絡的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論