版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、人類(lèi)已經(jīng)步入后基因組時(shí)代。隨著對(duì)基因研究的不斷深入,了解基因表達(dá)調(diào)控機(jī)制特別是轉(zhuǎn)錄調(diào)控機(jī)制的需求就顯得尤為迫切起來(lái)。這是因?yàn)椋蚴羌?xì)胞生命活動(dòng)的基礎(chǔ)。在同一生物體內(nèi),每個(gè)細(xì)胞都有一套完全相同的基因組。但是在不同的條件下,基因的表達(dá)水平不盡相同,這種行為限定了細(xì)胞中的RNA組成,進(jìn)而影響到最終所能產(chǎn)生出的全部蛋白質(zhì),從而決定了該細(xì)胞的功能。 轉(zhuǎn)錄過(guò)程既是DNA翻譯成蛋白質(zhì)的關(guān)鍵一步,同時(shí)也是調(diào)控基因表達(dá)的關(guān)鍵階段。轉(zhuǎn)錄調(diào)控通常是
2、在轉(zhuǎn)錄起始步驟實(shí)現(xiàn)的。除了啟動(dòng)子以外,在幾乎所有基因的上游區(qū)域中都還存在著激活基因所需的一段特定的DNA序列(轉(zhuǎn)錄因子結(jié)合位點(diǎn))。這些序列本身并不執(zhí)行任何功能,只有當(dāng)其被調(diào)控蛋白(轉(zhuǎn)錄因子)識(shí)別、結(jié)合后才能發(fā)揮作用。它們共同控制著基因的轉(zhuǎn)錄。轉(zhuǎn)錄因子與其結(jié)合位點(diǎn)的結(jié)合具有高度的專(zhuān)一性。研究轉(zhuǎn)錄因子就是研究轉(zhuǎn)錄調(diào)控的分子機(jī)制,研究一類(lèi)特定的蛋白質(zhì)分子與DNA序列的結(jié)合特性,研究與DNA結(jié)合的蛋白質(zhì)是如何調(diào)控基因轉(zhuǎn)錄等問(wèn)題。因此,鑒別出全部
3、與特定轉(zhuǎn)錄因子結(jié)合的DNA序列的特征,有助于對(duì)轉(zhuǎn)錄因子性質(zhì)的進(jìn)一步研究。目前,一些實(shí)驗(yàn)已經(jīng)證實(shí)在真核細(xì)胞中,特別是在高等生物體內(nèi),在多數(shù)情況下轉(zhuǎn)錄因子并不是獨(dú)自發(fā)揮作用,而是與其它轉(zhuǎn)錄因子協(xié)同作用,共同影響靶基因的表達(dá)。因此,對(duì)多轉(zhuǎn)錄因子協(xié)同DNA結(jié)合位點(diǎn)的研究正在成為一個(gè)新的亮點(diǎn)。 利用現(xiàn)代分子生物學(xué)實(shí)驗(yàn)技術(shù),例如凝膠阻滯實(shí)驗(yàn)、足跡法等,可以逐一鑒別出與特定轉(zhuǎn)錄因子結(jié)合的DNA序列片段。但是,單純依靠這類(lèi)技術(shù)來(lái)對(duì)幾百個(gè)或上千條
4、潛在的結(jié)合位點(diǎn)進(jìn)行檢測(cè),科研人員將不得不付出極大的代價(jià)。因此,在基因組水平上對(duì)潛在的轉(zhuǎn)錄因子結(jié)合位點(diǎn)進(jìn)行識(shí)別、篩選的生物信息學(xué)技術(shù)已經(jīng)成為一項(xiàng)非常有效的輔助手段。不過(guò)在實(shí)際使用過(guò)程中,過(guò)度預(yù)測(cè)問(wèn)題的存在已經(jīng)嚴(yán)重地制約了這些算法的發(fā)展。 在生物信息學(xué)領(lǐng)域中,人工神經(jīng)網(wǎng)絡(luò)、隱馬氏模型已經(jīng)成為解決序列分析和模式識(shí)別問(wèn)題的重要工具之一。在文中,我們對(duì)轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)算法的發(fā)展歷程進(jìn)行了回顧;討論了人工神經(jīng)網(wǎng)絡(luò)、隱馬氏模型應(yīng)用于該領(lǐng)域
5、時(shí)所具有的優(yōu)點(diǎn)和存在的局限性;最后,在這兩種技術(shù)的基礎(chǔ)上,提出了新的更適合解決該問(wèn)題的算法。同時(shí),對(duì)多轉(zhuǎn)錄因子協(xié)同DNA結(jié)合位點(diǎn)預(yù)測(cè)問(wèn)題以及過(guò)度預(yù)測(cè)問(wèn)題的解決進(jìn)行了有益的嘗試,并取得較令人滿意的結(jié)果。 基于誤差平方和最小化原則(MSSE)的反向轉(zhuǎn)播算法的出現(xiàn)是人工神經(jīng)網(wǎng)絡(luò)發(fā)展史上的一個(gè)里程碑。在生物序列分析領(lǐng)域中BP算法也是一種經(jīng)典的解決方案,特別是在蛋白質(zhì)二級(jí)結(jié)構(gòu)預(yù)測(cè)方面。人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的目的是要揭示產(chǎn)生樣本的規(guī)律,因而可以
6、使用最大似然方法進(jìn)行求解。但是只有在目標(biāo)變量滿足高斯分布的前提下,最大似然函數(shù)才可化為誤差平方和函數(shù)。這就說(shuō)明了,傳統(tǒng)BP模型不適合解決轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)問(wèn)題。因此,我們提出了一個(gè)以交叉熵為目標(biāo)函數(shù)的BP神經(jīng)網(wǎng)絡(luò)模型——ANN-CE(ArtificialNeuralNetworkusingCrossEntropy)模型,并推導(dǎo)了該目標(biāo)函數(shù)條件下的BP算法的迭代公式。 隱馬氏模型有著堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)和有效的學(xué)習(xí)算法,它甚至可以直
7、接從原始數(shù)據(jù)中構(gòu)造出模型來(lái)。目前,剖面隱馬氏模型已成為生物序列分析中應(yīng)用最為廣泛的模型之一,如在多重序列聯(lián)配方面。但是,隱馬氏模型受其馬爾可夫性質(zhì)的限制,無(wú)法表現(xiàn)遠(yuǎn)程狀態(tài)之間的相互關(guān)系。所以,針對(duì)轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)這一特定問(wèn)題,隱馬氏模型的處理能力稍顯不足。同時(shí),經(jīng)實(shí)驗(yàn)證實(shí)的特定轉(zhuǎn)錄因子的DNA結(jié)合位點(diǎn)序列數(shù)據(jù)過(guò)少,也影響著任何預(yù)測(cè)算法的性能。我們提出了一種新的剖面隱馬氏模型算法——BssHMMs(BindingSiteSearchb
8、aesdonHiddenMarkovmodels)算法。該算法通過(guò)提取正反兩方面數(shù)據(jù)(轉(zhuǎn)錄因子結(jié)合位點(diǎn)序列和隨機(jī)序列)的特征,建立起相應(yīng)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)模型,并利用似然比檢驗(yàn)尋找出位點(diǎn)中遠(yuǎn)程位置之間的相關(guān)性信息,從而在一定程度上避免了隱馬氏模型的局限。 在本文的最后部分,我們給出了一個(gè)包含266條記錄的轉(zhuǎn)錄因子結(jié)合位點(diǎn)剖面數(shù)據(jù)庫(kù)BSDbase,以及兩套預(yù)測(cè)系統(tǒng)。同時(shí),對(duì)多轉(zhuǎn)錄因子協(xié)同DNA結(jié)合位點(diǎn)預(yù)測(cè)及過(guò)度預(yù)測(cè)問(wèn)題的解決進(jìn)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別問(wèn)題的算法研究.pdf
- 轉(zhuǎn)錄因子結(jié)合位點(diǎn)的識(shí)別與分析.pdf
- 轉(zhuǎn)錄因子結(jié)合位點(diǎn)和動(dòng)物毒素的分析與預(yù)測(cè).pdf
- miRNA及轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)與調(diào)控功能分析.pdf
- 基于ChIP-seq數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別算法.pdf
- 基于PWMSA預(yù)測(cè)堿基關(guān)聯(lián)三聯(lián)體轉(zhuǎn)錄因子結(jié)合位點(diǎn).pdf
- 基于HMM模型和信息量的轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè).pdf
- 14141.結(jié)合基因芯片和dna測(cè)序的轉(zhuǎn)錄因子結(jié)合位點(diǎn)預(yù)測(cè)方法研究
- 真核基因轉(zhuǎn)錄因子結(jié)合位點(diǎn)的識(shí)別研究.pdf
- 基于結(jié)構(gòu)數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)分析
- 基于序列信息的轉(zhuǎn)錄因子結(jié)合位點(diǎn)和啟動(dòng)子理論預(yù)測(cè).pdf
- 基于結(jié)構(gòu)數(shù)據(jù)的轉(zhuǎn)錄因子結(jié)合位點(diǎn)分析.pdf
- 基于轉(zhuǎn)錄因子結(jié)合位點(diǎn)的特性對(duì)轉(zhuǎn)錄因子分類(lèi)的新方法.pdf
- 基于HMM的轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別方法研究.pdf
- 一種基于遺傳算法的轉(zhuǎn)錄因子結(jié)合位點(diǎn)識(shí)別方法.pdf
- 基于Z曲線理論的轉(zhuǎn)錄因子結(jié)合位點(diǎn)的識(shí)別研究.pdf
- 轉(zhuǎn)錄因子結(jié)合位點(diǎn)位置頻率矩陣的聚類(lèi)方法研究.pdf
- 轉(zhuǎn)錄因子結(jié)合位點(diǎn)甲基化檢測(cè)及其基因轉(zhuǎn)錄調(diào)控效應(yīng)的研究.pdf
- 轉(zhuǎn)錄因子結(jié)合位點(diǎn)和順式調(diào)控模塊識(shí)別方法的研究.pdf
- 轉(zhuǎn)錄因子結(jié)合親和性預(yù)測(cè)的研究.pdf
評(píng)論
0/150
提交評(píng)論