基于密度聚類和特征分類的蛋白質(zhì)相互作用熱區(qū)預測.pdf_第1頁
已閱讀1頁,還剩108頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、蛋白質(zhì)功能由蛋白質(zhì)相互作用進行表達,蛋白質(zhì)與蛋白質(zhì)相互作用的界面上并非所有的殘基都是重要的,有時只有少數(shù)幾個殘基對蛋白質(zhì)的結合起著關鍵的作用,這些起關鍵作用的殘基稱為熱點殘基。大量實驗表明,熱點殘基在蛋白質(zhì)與蛋白質(zhì)相互作用中會形成一種特定的構象,該構象稱為熱區(qū)。熱區(qū)具有穩(wěn)定并協(xié)調(diào)蛋白質(zhì)與蛋白質(zhì)相互作用的功能,熱區(qū)的發(fā)現(xiàn)和界定對于理解疾病的起源、生物制藥、藥物作用靶點等蛋白質(zhì)活動都非常重要。
  近年來,研究人員從實驗角度出發(fā),記錄

2、了一些蛋白質(zhì)相互作用的數(shù)據(jù),但是由于蛋白質(zhì)相互作用實驗成本高、周期長、復雜度高,實驗數(shù)據(jù)相當有限,因此利用計算機的方法預測蛋白質(zhì)相互作用的熱區(qū)就顯得尤為重要。本文提出一種基于密度聚類和特征分類的蛋白質(zhì)熱區(qū)預測模型,實驗結果顯示,與其他方法相比,所提出的方法可以得到更好的預測結果。并且在熱區(qū)研究的基礎上,提出了一種基于序列保守性的驗證熱區(qū)的方法。研究的主要創(chuàng)新點概括如下:
  (1)提出了一種基于密度的增量型聚類結合特征分類的預測蛋

3、白質(zhì)相互作用熱區(qū)的方法。首先利用基于密度的增量型聚類對數(shù)據(jù)集里面的數(shù)據(jù)進行聚類,得到多個初始的聚類簇,然后利用基于特征的分類剔除這些聚類簇中的非熱點殘基,從而得到最終的預測熱區(qū)。實驗結果顯示所提出的方法可以預測出絕大多數(shù)的熱區(qū),同時在預測熱區(qū)中熱點的覆蓋率也高于其他相關方法。
  (2)提出了一種有效的特征選擇的方法。在進行特征分類時,為了有效的選擇關鍵的生物特征,首先從蛋白質(zhì)結構出發(fā),提取一系列與蛋白質(zhì)相互作用相關的特征,然后通

4、過基于支持向量機的遞歸特征消除結合歸一化互信息特征選擇,利用向后特征淘汰策略得到最重要的特征和去除無關緊要的特征,從而得到一個從最重要到最無關的特征排序列表,最后通過引入F-score找到這些特征的最優(yōu)化組合。
  (3)提出了一種基于序列保守性的熱區(qū)驗證方法。由于生物實驗的復雜性和長周期性,使得由生物實驗驗證熱區(qū)十分困難,這里提出一種基于序列保守性的熱區(qū)驗證方法。對于熱區(qū)中的每一個熱點,在蛋白質(zhì)數(shù)據(jù)庫中找到形成該復合物的兩個蛋白

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論