版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、近年來,基因組序列信息高速增加,為我們提供了進(jìn)行大批量的進(jìn)化分析的原始材料。生物信息學(xué)的主要研究對象集中在核酸和蛋白質(zhì)的分子序列上。作為生物信息學(xué)的主要研究方向之一,建立各種快速的序列分析軟件或方法具有重要的意義。 然而現(xiàn)在還沒有以基于全基因組遺傳信息進(jìn)行進(jìn)化分析的Windows應(yīng)用軟件,現(xiàn)有的多重序列比對分析工具在面對數(shù)量大,平均長度長的多重序列時(shí)顯得無能為力,因此有必要發(fā)展一種新的快速的基于全基因組信息,同時(shí)又可以避開使用序
2、列聯(lián)配的Windows軟件。本文介紹PMG軟件的創(chuàng)建及Z曲線數(shù)據(jù)庫的建立。 PMG為PhylogenybasedonMulti-Genes的縮寫。該軟件是我們運(yùn)用MicrosoftVisualC++6.0中的MFC,主要基于組分矢量法創(chuàng)建的一個(gè)Windows綠色軟件。它首先將要分析的全基因組或蛋白質(zhì)家族的編碼序列用組分矢量法產(chǎn)生一個(gè)物種之間的距離矩陣,然后用Bionj、PHYLIP軟件包中的鄰接法、Fitch法或Kitsch法四
3、種建樹方法中的一種基于此距離矩陣重建進(jìn)化樹,最后軟件調(diào)用本地的進(jìn)化樹顯示軟件或通過網(wǎng)絡(luò)調(diào)用ATV顯示進(jìn)化樹。在開發(fā)過程中,系統(tǒng)整合許多已有的比較成熟的源代碼和軟件資源(包括PHYLIP,ATV等),節(jié)省了人力、物力和時(shí)間。還用PHP開發(fā)一個(gè)小工具,能從NCBI上的一個(gè)物種基因組文件中分離全基因組編碼序列,保存在一個(gè)Fasta格式的文件中。 利用PMG,以29種桿狀病毒的全基因組為對象,重建了系統(tǒng)發(fā)育樹(K串值設(shè)為5時(shí)約需16分鐘
4、,而設(shè)為3時(shí)只須16秒鐘)。另外,以34種真核生物的線粒體全基因組為對象,重建了34種真核生物的系統(tǒng)發(fā)育樹(K串值設(shè)為5時(shí)約需21分鐘)。兩者的分析結(jié)果和以前采用傳統(tǒng)方法所獲得的結(jié)果具有高度的一致性。這些結(jié)果顯示,在基于全基因組或蛋白質(zhì)家族編碼序列的遺傳信息進(jìn)行進(jìn)化分析時(shí),對比傳統(tǒng)的,必須進(jìn)行基因選擇和參數(shù)選擇系統(tǒng)發(fā)育樹重建過程,本文開發(fā)的軟件能明顯體現(xiàn)出高速度和有相對高的精確度優(yōu)勢。本軟件操作簡單,不需要很高的技巧。用戶可以通過網(wǎng)址h
5、ttp://life.zsu.edu.cn/pmg下載本文的軟件,測試數(shù)據(jù)及閱讀軟件的詳細(xì)的使用說明。 Z曲線是一種基于DNA序列的對稱性理論,用計(jì)算幾何學(xué)、微分幾何學(xué)和計(jì)算機(jī)圖形學(xué)技術(shù)的方法顯示和分析蛋白質(zhì)編碼區(qū)DNA序列的理論與方法。通過計(jì)算不同物種基因組蛋白質(zhì)編碼區(qū)DNA序列的Z曲線之間的平均斜率差異,同樣可以產(chǎn)生一個(gè)物種之間的距離矩陣,然后用Bionj、PHYLIP軟件包中的鄰接法、Fitch法或Kitsch法四種建樹方
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基因組島數(shù)據(jù)庫及分析平臺(tái)構(gòu)建.pdf
- 文蛤線粒體基因組序列測定及進(jìn)化分析.pdf
- 54040.生物基因組中蛋白質(zhì)編碼序列的長度分布模型與基因組進(jìn)化的研究
- 寄生植物肉蓯蓉的葉綠體基因組序列測定及進(jìn)化分析.pdf
- 基于核苷酸距離的基因組進(jìn)化分析.pdf
- 基于DFS編碼的圖形數(shù)據(jù)庫Top-K查詢技術(shù)研究.pdf
- 中國馬業(yè)綜合數(shù)據(jù)庫的建立及馬基因組序列預(yù)測.pdf
- 圖形數(shù)據(jù)庫集成研究與實(shí)踐.pdf
- 33204.基因識(shí)別算法研究與基因組進(jìn)化分析
- 面向組合夾具的圖形數(shù)據(jù)庫研究.pdf
- 基因組啟動(dòng)子序列數(shù)據(jù)庫和web應(yīng)用系統(tǒng)的構(gòu)建.pdf
- 基于VBA的AutoCAD圖形數(shù)據(jù)庫管理技術(shù)研究.pdf
- 基于網(wǎng)絡(luò)的刀片標(biāo)準(zhǔn)圖形數(shù)據(jù)庫管理系統(tǒng).pdf
- 真核細(xì)胞的結(jié)構(gòu)基因包含了編碼序列和非編碼序列
- 鋼節(jié)點(diǎn)圖形數(shù)據(jù)庫的研究與應(yīng)用.pdf
- 基因組序列CGR圖形的多重分形分析及應(yīng)用.pdf
- 昆蟲基因組密碼子使用及進(jìn)化分析.pdf
- 勘探開發(fā)圖形數(shù)據(jù)庫的研究與應(yīng)用.pdf
- 水稻基因組微衛(wèi)星多態(tài)性數(shù)據(jù)庫構(gòu)建及假基因分析.pdf
- 基因組水平的基因進(jìn)化分析與水平轉(zhuǎn)移基因的識(shí)別.pdf
評(píng)論
0/150
提交評(píng)論