核學習方法及其在生物序列分析中的應用.pdf

上傳人：奔*** IP屬地：河北更新時間：2024-03-01 格式：pdf 頁數(shù)：64 大?。?6.38MB 人氣指數(shù)：12 舉報 版權申訴

已閱讀1頁，還剩63頁未讀，繼續(xù)免費閱讀

版權說明：本文檔由用戶提供并上傳，收益歸屬內容提供方，若內容存在侵權，請進行舉報或認領

文檔簡介

1、蛋白質序列可以按照功能，結構，亞細胞位置等分成不同的類別。在計算生物學中的一個很重要的問題是如何自動地進行這個分類過程。我們從兩個角度使用核方法來解決這個問題：首先建立新的字符串核，其次開發(fā)新的基于核的學習算法。首先，我們在核方法的范疇內介紹一個對蛋白質序列相似性建模的框架。在這個框架下，我們可以更靈活的構造不同的核函數(shù)為支持向量機的輸入?，F(xiàn)有的字符串核方法都是基于顯式的定義從蛋白質序列到向量空間的特征映射

2、。而我們的方法是通過局部核函數(shù)構造和核組合的方法來直接建立核函數(shù)的。我們提出的框架提供了有生物意義的核函數(shù)，因為我們選取有區(qū)分能力的k長氨基酸序列和考慮到了錯配，BLOSMM62分值，InterPro項和基因本體。我們在關于蛋白質亞細胞定位和遠同源性檢測的兩個不同的數(shù)據(jù)集上做了實驗。實驗結果表明使用我們構造的核函數(shù)的支持向量機可以取得比現(xiàn)有的基于序列的方法更好的結果。當使用了InterPro和基因本體的先驗知識后，我們的方法和其他使用先

3、驗知識的方法有相似的性能。其次，我們探索了亞細胞位置之間的依賴關系，并且將這種關系用于支持向量機來進行蛋白質亞細胞定位。傳統(tǒng)的預測系統(tǒng)使用了“平面”分類器組合結構，比如說一對其他方法和一對一方法。所以，現(xiàn)有的研究基本上都忽略了亞細胞位置問的依賴關系。和這些方法不同，我們使用了一個層次化結構來組織亞細胞位置并且對它們之間的關系建模。我們提出了四種層次化的預測方法，并且在三個數(shù)據(jù)集上做了比較實驗。試驗結果表明三種層次化模型在樹損失

眾賞文庫> 全部分類> 畢業(yè)設計

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內容里面會有圖紙預覽，若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲空間，僅對用戶上傳內容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內容本身不做任何修改或編輯，并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

核學習方法及其在生物序列分析中的應用.pdf

文檔簡介

溫馨提示

最新文檔

評論

核學習方法及其在生物序列分析中的應用.pdf

文檔簡介

溫馨提示

最新文檔

評論

免費下載