文檔簡介
1、自從全基因組測序成為可能以來,基因組結構注釋(包括了解基因組DNA中的基因組成、結構及其調控元件)成為生物信息學研究的重要問題。隨著越來越多的生物體的DNA被測序出來,對大量的序列進行基因組分析并從中獲取有價值的信息變得日益重要。mRNA序列中多聚腺苷化位點(簡稱poly(A)位點)識別是基因識別的重要組成部分,對poly(A)位點的正確識別有助于確定基因編碼的終止位置,這在基因組分析中有重要的應用意義。 人們普遍認為,用來識別
2、poly(A)位點的信號定位在剪切點的附近。在許多哺乳動物的poly(A)位點的上游10—35nt的區(qū)域定位了一個六聯(lián)子AAUAAA。由于其保守性,它通常被認為是poly(A)信號(PAS)。而且我們發(fā)現(xiàn)在酵母和哺乳類中出現(xiàn)的大部分cis順式元件也都存在于植物的poly(A)位點區(qū)域。此外,國際上最新的研究成果表明,在藻類的位點上游區(qū)域也存在poly(A)信號。因此,我們有理由相信,在所有真核細胞的poly(A)位點周圍存在著一些保守的
3、cis順式元件,這些cis順式元件對mRNA前體的多聚腺苷化過程(即poly(A)位點的形成過程)具有調控作用。 本文根據(jù)衣藻(Chlamydomonas)poly(A)位點上下游周圍序列cis順式元件的特征,運用層次聚類的方法來建立poly(A)位點的識別模型。對建立模型采用的訓練集數(shù)據(jù),使用Z算法進行提取,并通過WEKA supervised attribute filter進行特征篩選,獲得cis順式元件。接下來自定義了對
4、象間距離,采用層次聚類的方法對上述cis順式元件進行聚類得到cis順式元件組。最后轉化這些cis順式元件組為PSSM,依據(jù)PSSM建立用于分類的cis特征,分別采用決策樹分類法與貝葉斯分類法,構建出完整的poly(A)位點識別模型。該模型可依據(jù)訓練結果,對待測序列中可能含有位點的序列進行分類,判斷其中含有位點的情況。本文使用建立的識別模型對測試數(shù)據(jù)進行測試,并對兩種分類方法的識別結果進行對比和分析。模型的測試結果表明,本文所建立的模型是
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于判別分析的植物poly(A)位點識別研究.pdf
- 基于LVMM算法的擬南芥poly(A)位點識別及與SNPs關聯(lián)性研究.pdf
- 識別含有Poly(A)位點模式植物序列的方法與應用研究.pdf
- 轉錄因子結合位點和順式調控模塊識別方法的研究.pdf
- 基于DNA序列的功能位點識別.pdf
- 提高衣藻產(chǎn)能效率的研究.pdf
- 基于HMM模型的順式調控模塊識別方法的研究.pdf
- 基于HMM的轉錄因子結合位點識別方法研究.pdf
- 調控FTmRNA長距離運輸?shù)捻樖阶饔迷难芯?pdf
- 基于Z曲線理論的轉錄因子結合位點的識別研究.pdf
- 基于機器學習方法的基因剪接位點識別研究.pdf
- 基于城市CIS的居住社區(qū)可識別性研究.pdf
- 37055.mirna的drosha識別位點特征研究和剪切位點預測
- 衣藻轉基因體系的構建及添加不同碳氮源對衣藻生長影響的研究.pdf
- 119.基于序列模式挖掘識別基因剪接位點的研究
- 2180.真核生物順式作用元件提取與識別模型研究與實現(xiàn)
- 基于CIS原理的城市居住空間可識別性研究.pdf
- 轉錄因子結合位點的識別與分析.pdf
- 水稻淀粉代謝酶基因高溫響應的順式元件的分離.pdf
- 真核基因轉錄因子結合位點的識別研究.pdf
評論
0/150
提交評論