

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、蛋白質(zhì)是生命活動(dòng)的主要執(zhí)行者,其通過相互作用來完成生命活動(dòng),因此只有對蛋白質(zhì)進(jìn)行整體,網(wǎng)絡(luò)水平上的研究,才能真正揭示生命現(xiàn)象的分子機(jī)制,這就導(dǎo)致了蛋白質(zhì)組學(xué)的出現(xiàn)。蛋白質(zhì)組學(xué)是研究一個(gè)細(xì)胞或生物組織在一定條件下所有蛋白質(zhì)的結(jié)構(gòu)與功能,以及這些蛋白質(zhì)與其他分子之間的相互作用關(guān)系。因此檢測蛋白質(zhì)之間的相互作用成為蛋白質(zhì)組學(xué)的重要研究課題之一。
由于傳統(tǒng)檢測蛋白質(zhì)相互作用的實(shí)驗(yàn)方法耗費(fèi)大量的人力物力,而且具有較高的假陽率和假陰率
2、,因此采用計(jì)算方法對蛋白質(zhì)相互作用進(jìn)行預(yù)測變得越來越重要。本文主要研究基于蛋白質(zhì)的一級(jí)序列信息,利用分類算法,對蛋白質(zhì)之間的相互作用進(jìn)行預(yù)測。因?yàn)榈鞍踪|(zhì)的氨基酸序列決定結(jié)構(gòu),結(jié)構(gòu)決定性質(zhì),所以蛋白質(zhì)一級(jí)序列中含有的信息已經(jīng)足夠用來預(yù)測蛋白質(zhì)相互作用,并且這種方法具有較好的通用性,僅根據(jù)蛋白質(zhì)的序列信息就可以進(jìn)行預(yù)測。本文的工作主要包括以下幾個(gè)方面:
(1)提出了一種基于改進(jìn)的偽氨基酸組成特征提取算法的蛋白質(zhì)相互作用預(yù)測方法
3、。由于蛋白質(zhì)的功能可能受到多種不同的氨基酸屬性的影響,所以需要整合與蛋白質(zhì)相互作用相關(guān)的氨基酸性質(zhì)來更加有效的表示蛋白質(zhì)序列的特征。因此首先利用基于Geary自相關(guān)函數(shù)的特征提取算法,對氨基酸屬性與蛋白質(zhì)相互作用的相關(guān)性進(jìn)行評價(jià),然后根據(jù)評價(jià)結(jié)果選擇相關(guān)的屬性整合到基于Minkowski距離的偽氨基酸特征提取算法中提取出特征,并使用隨機(jī)森林作為分類器進(jìn)行學(xué)習(xí)預(yù)測。在幽門螺旋菌蛋白質(zhì)相互作用數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),該方法相對于傳統(tǒng)方法取得了很好的
4、效果,提高了預(yù)測正確率。
(2)提出了一種基于n-Diad特征提取算法和隨機(jī)森林的蛋白質(zhì)相互作用預(yù)測方法。采用了n-diad特征提取算法從蛋白質(zhì)序列中提取特征,所提取的特征中不僅含有氨基酸的同義變異信息,還包括了蛋白質(zhì)序列中間隔不同距離的氨基酸之間的疏水作用信息。由于隨機(jī)森林參數(shù)較少,泛化能力較好,因此被選作分類器進(jìn)行學(xué)習(xí)和預(yù)測。同時(shí),由于訓(xùn)練數(shù)據(jù)集的質(zhì)量對分類器的效果有較大的影響,我們選取了DIP數(shù)據(jù)庫中的酵母蛋白質(zhì)相互
5、作用數(shù)據(jù)作為正集,然后基于不同的生物學(xué)原理,構(gòu)造了四種負(fù)集,用來比較不同的負(fù)集生成方法對分類效果的影響。通過實(shí)驗(yàn)表明,ScoNeg數(shù)據(jù)集綜合了多種生物信息源,具有較多的生物意義,所訓(xùn)練出的隨機(jī)森林分類器預(yù)測效果最好。
(3)提出了一種基于Moran-PseAA特征提取算法和改進(jìn)的K近鄰分類器的預(yù)測模型來預(yù)測蛋白質(zhì)相互作用。蛋白質(zhì)序列使用Moran-PseAA特征提取算法來編碼,這種算法使用Moran相關(guān)函數(shù)來計(jì)算蛋白質(zhì)序列
6、的順序信息和氨基酸的疏水作用信息,然后采用K近鄰算法作為分類器,同時(shí)根據(jù)蛋白質(zhì)相互作用的特點(diǎn),提出新的距離函數(shù)來計(jì)算兩個(gè)蛋白質(zhì)對之間的距離。在酵母蛋白質(zhì)相互作用數(shù)據(jù)上進(jìn)行實(shí)驗(yàn),獲得了較好的預(yù)測準(zhǔn)確率。
(4)提出了一種基于蛋白質(zhì)表面熱點(diǎn)氨基酸性質(zhì)和相互作用的蛋白質(zhì)之間存在共進(jìn)化現(xiàn)象的預(yù)測方法。由于自然選擇壓力,相互作用的蛋白質(zhì)在進(jìn)化過程中呈現(xiàn)出共進(jìn)化的特征,因此提出co-Diad特征提取算法來表示兩個(gè)蛋白質(zhì)之間的共進(jìn)化信息
7、。另外,由于兩個(gè)蛋白質(zhì)之間發(fā)生物理相互作用所需要的結(jié)合能量是由少數(shù)分布在蛋白質(zhì)表面的熱點(diǎn)氨基酸提供,因此在co-Diad提出的特征中,只有包含熱點(diǎn)氨基酸信息的特征分量才與蛋白質(zhì)相互作用相關(guān),所以選取多表達(dá)式編程作為分類器,在學(xué)習(xí)過程中自動(dòng)提取出有效的特征分量。由于單個(gè)多表達(dá)編程分類器可能僅提取出含有某一類熱點(diǎn)氨基酸信息的特征,而丟失了含有其他類型熱點(diǎn)氨基酸信息的特征,因此我們提出了集成多表達(dá)式編程分類器,將多個(gè)多表達(dá)編程分類器整合為一個(gè)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 蛋白質(zhì)相互作用網(wǎng)絡(luò)中關(guān)鍵蛋白質(zhì)預(yù)測算法及其應(yīng)用研究.pdf
- 蛋白質(zhì)相互作用預(yù)測及其應(yīng)用的研究.pdf
- 蛋白質(zhì)相互作用預(yù)測算法的研究及其在帕金森氏病中的應(yīng)用.pdf
- 蛋白質(zhì)相互作用網(wǎng)絡(luò)中致病基因預(yù)測算法研究.pdf
- 基于多分類器組合的蛋白質(zhì)-蛋白質(zhì)相互作用位點(diǎn)預(yù)測研究.pdf
- 蛋白質(zhì)相互作用預(yù)測及Hub蛋白分類與作用規(guī)律研究.pdf
- 基于智能計(jì)算的蛋白質(zhì)相互作用預(yù)測方法研究.pdf
- 蛋白質(zhì)網(wǎng)絡(luò)中相互作用及功能預(yù)測算法的研究.pdf
- 基于蛋白質(zhì)相互作用網(wǎng)絡(luò)的蛋白質(zhì)功能預(yù)測.pdf
- 蛋白質(zhì)相互作用預(yù)測方法的研究.pdf
- 蛋白質(zhì)與染料、藥物相互作用及其應(yīng)用研究.pdf
- 樸素貝葉斯分類器預(yù)測擬南芥蛋白質(zhì)相互作用及蛋白質(zhì)功能注釋.pdf
- 從蛋白質(zhì)相互作用網(wǎng)絡(luò)預(yù)測未知蛋白質(zhì)功能.pdf
- 蛋白質(zhì)相互作用
- 蛋白質(zhì)-蛋白質(zhì)相互作用界面和熱點(diǎn)預(yù)測的方法研究.pdf
- 基于覆蓋算法的蛋白質(zhì)相互作用位點(diǎn)預(yù)測.pdf
- 蛋白質(zhì)相互作用預(yù)測及其假陽性過濾研究.pdf
- 蛋白質(zhì)相互作用及其位點(diǎn)的預(yù)測方法研究.pdf
- 基于協(xié)同智能的蛋白質(zhì)相互作用及其網(wǎng)絡(luò)研究.pdf
- 不均衡數(shù)據(jù)集的研究及其在蛋白質(zhì)相互作用位點(diǎn)預(yù)測中的應(yīng)用.pdf
評論
0/150
提交評論