版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、自人類基因組計(jì)劃(HGP)開(kāi)展以來(lái),人們已經(jīng)獲取了大量的DNA、RNA及蛋白質(zhì)序列的數(shù)據(jù).有人說(shuō),基于序列的生物學(xué)時(shí)代已經(jīng)到來(lái),盡管對(duì)"序列生物學(xué)"這一提法可能有所爭(zhēng)議,但是今日像潮水般涌現(xiàn)的序列信息卻是無(wú)可爭(zhēng)辯的事實(shí).截至目前,登錄在GeneBank數(shù)據(jù)庫(kù)中的DNA序列總量已經(jīng)超過(guò)73億堿基.生物學(xué)數(shù)據(jù)的積累并不僅僅表現(xiàn)在DNA序列方面,與其同步的還有蛋白質(zhì)一級(jí)結(jié)構(gòu),即氨基酸序列的增長(zhǎng).目前已有18個(gè)生物體的完整基因組被破譯,已有89
2、00多種蛋白質(zhì)和其他生物分子的空間結(jié)構(gòu)被闡明,這些都構(gòu)成了生物信息的重要組成部分.數(shù)據(jù)并不等于信息和知識(shí),但卻是信息利知識(shí)的源泉,關(guān)鍵在于如何從中挖掘它們.與正在以指數(shù)方式增長(zhǎng)的生物學(xué)數(shù)據(jù)相比,人類相關(guān)知識(shí)的增長(zhǎng)(粗略地用每年發(fā)表的生物、醫(yī)學(xué)論文數(shù)來(lái)代表)卻十分緩慢.一方面是巨量的數(shù)據(jù);另一方面是我們?cè)卺t(yī)學(xué)、藥物、農(nóng)業(yè)和環(huán)保等方面對(duì)新知識(shí)的渴求,這些新知識(shí)將幫助人們改善其生存環(huán)境和提高生活質(zhì)量.這就構(gòu)成了一個(gè)極大的矛盾.這個(gè)矛盾就催生了
3、一門新興的交叉科學(xué),這就是生物信息學(xué).生物信息學(xué)是一門新興的邊緣交叉學(xué)科,是近年來(lái)國(guó)際上的研究熱點(diǎn).生物信息學(xué)是利用信息技術(shù)來(lái)理解生物問(wèn)題的一種手段,是探索生命奧妙,擴(kuò)展生物醫(yī)學(xué)行為數(shù)據(jù)使用的一種方法,是通過(guò)計(jì)算方法將生物信息轉(zhuǎn)化為知識(shí)的工具.它是一門利用信息來(lái)理解生命活動(dòng)的科學(xué),它綜合利用了生物學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、數(shù)學(xué)等學(xué)科的優(yōu)勢(shì),借以探索現(xiàn)有的海量生物學(xué)數(shù)據(jù)中蘊(yùn)含的生物學(xué)意義.人們獲得各種核酸和蛋白質(zhì)序列的目的是了解這個(gè)序列在生物
4、體中充當(dāng)了怎樣的角色.該文的工作主要分為針對(duì)核酸序列的預(yù)測(cè)和針對(duì)氨基酸序列的預(yù)測(cè)兩部分.剪切點(diǎn)和啟動(dòng)區(qū)域的預(yù)測(cè)主要是基于基因序列的預(yù)測(cè).GPCRs超家族的識(shí)別和蛋白質(zhì)二級(jí)結(jié)構(gòu)含量的分類預(yù)測(cè)則以氨基酸序列作為研究的數(shù)據(jù)來(lái)源.G蛋白偶聯(lián)受體(G Protein Coupled Receptors,GPCRs)是體內(nèi)最大的蛋白質(zhì)超家族,許多疾病與之密切相關(guān),GPCRs因此成為藥物治療的重要靶標(biāo).然而,大多數(shù)GPCRs三級(jí)結(jié)構(gòu)仍然是未知的.隨著
5、人類基因組以及其它種類生物基因組的開(kāi)展,大量的GPCRs的一級(jí)結(jié)構(gòu)信息即氨基酸序列的數(shù)據(jù)已經(jīng)獲得.在缺乏實(shí)驗(yàn)數(shù)據(jù)的情況下,通??梢岳糜?jì)算方法對(duì)新發(fā)現(xiàn)的受體進(jìn)行識(shí)別,給出它們可能隸屬的類別,從而發(fā)現(xiàn)其潛在的功能.比如:如果發(fā)現(xiàn)一個(gè)新的受體序列與現(xiàn)有的某蛋白質(zhì)家族有很大的相似性,我們就可以在一定程度上推測(cè)該受體可能具有該類蛋白質(zhì)家族的一些特征和功能.針對(duì)這個(gè)問(wèn)題,該文采用了一種隱馬爾可夫模型的方法,利用GPCRs一級(jí)結(jié)構(gòu)信息和數(shù)據(jù)自身特性
6、,在GPCRs超家族層次各類別之間進(jìn)行識(shí)別,具體考慮了ACDE與B類超家族,以及BCDE與A類超家族的分辨,取得了不錯(cuò)的效果,類之間的識(shí)別準(zhǔn)確率可以達(dá)到100%.研究過(guò)程中,我們考慮了生物統(tǒng)計(jì)過(guò)程中常見(jiàn)的不等長(zhǎng)變量問(wèn)題.通過(guò)與常規(guī)的等變量截取效果的對(duì)比,我們也證明了HMM用于不等長(zhǎng)的同源蛋白序列分類的預(yù)測(cè)是非常合適的.除了對(duì)GPCRS超家族的分類研究之外,我們還嘗試將HMM用于真核生物的剪切點(diǎn)和初始轉(zhuǎn)錄位點(diǎn)(TSS)的識(shí)別.用HMM對(duì)真
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于隱馬爾可夫模型的G蛋白偶聯(lián)受體預(yù)測(cè)的研究.pdf
- 語(yǔ)音識(shí)別中隱馬爾可夫模型的研究.pdf
- 基于隱馬爾可夫模型的手指靜脈識(shí)別研究.pdf
- 基于隱馬爾可夫模型的EST序列聚類研究.pdf
- 基于隱馬爾可夫模型的多序列比對(duì)算法.pdf
- 基于隱馬爾可夫模型的人臉識(shí)別研究.pdf
- 基于隱馬爾可夫模型的自動(dòng)和弦識(shí)別.pdf
- 基于隱馬爾可夫模型的步態(tài)識(shí)別算法研究.pdf
- 隱馬爾可夫模型簡(jiǎn)介
- 隱馬爾可夫模型下基于通信流的隱組織識(shí)別.pdf
- 基于隱馬爾可夫模型的協(xié)議識(shí)別技術(shù)的研究.pdf
- 隱馬爾可夫模型技術(shù)
- 隱馬爾可夫模型系統(tǒng)調(diào)用序列異常檢測(cè)研究.pdf
- 基于隱馬爾可夫模型的時(shí)間序列聚類的研究.pdf
- 基于隱馬爾可夫模型的語(yǔ)音識(shí)別技術(shù)研究.pdf
- 41351.基于隱馬爾可夫模型的并行多重序列比對(duì)
- 基于隱馬爾可夫模型的語(yǔ)音識(shí)別方法的研究.pdf
- 基于隱馬爾可夫模型的人臉識(shí)別技術(shù)研究.pdf
- 基于隱馬爾可夫模型的J波識(shí)別技術(shù)研究.pdf
- 空間統(tǒng)計(jì)中的隱馬爾可夫模型.pdf
評(píng)論
0/150
提交評(píng)論