版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、鼠疫耶爾森氏菌(Yersinia pestis)是一種能夠引起致命全身感染的高危細(xì)菌,世界上曾發(fā)生過三次鼠疫大流行,死亡人數(shù)過億。根據(jù)WHO的數(shù)據(jù),僅2001-2015年間,全球就發(fā)生18次鼠疫公共安全事件。中國目前已經(jīng)發(fā)現(xiàn)12塊典型的鼠疫自然疫源地,分布于15個省,占國土陸地總面積的15%。
自2001年Sanger實驗室發(fā)表第一株鼠疫菌CO92全基因組起,目前已有12株鼠疫菌的完成圖序列被公布,且都進(jìn)行了基因組注釋工作。由
2、于高通量實驗技術(shù)的快速發(fā)展,鼠疫菌各方面研究工作產(chǎn)出了大量數(shù)據(jù),對其致病和傳播的理論認(rèn)識也得到提高。因此重新審視基于過去知識的基因組注釋時發(fā)現(xiàn):原有信息存在諸多局限性甚至錯誤,而且這些錯誤信息會隨著以同源序列比對為基礎(chǔ)的注釋工作被不斷復(fù)制、放大、擴(kuò)散。研究者曾使用比較基因組學(xué)、轉(zhuǎn)錄組和蛋白基因組學(xué)方法對個別鼠疫菌基因組進(jìn)行了重注釋,但這些注釋側(cè)重于基因功能矯正和發(fā)現(xiàn)新基因等方面,數(shù)據(jù)內(nèi)容不夠全面。因此需要?dú)w納、整合、完善已有鼠疫菌知識庫
3、,在過去基因組注釋結(jié)果基礎(chǔ)上,通過增加新的實驗數(shù)據(jù)、使用改進(jìn)的算法對序列進(jìn)行重新分析、修正可能存在的注釋錯誤,以進(jìn)一步完善鼠疫菌基因組注釋結(jié)果,最終達(dá)到系統(tǒng)化加深鼠疫菌功能、生物行為和致病機(jī)理認(rèn)識的目的。
數(shù)據(jù)共享是推動研究知識進(jìn)步的重要方法。但除了大型公共數(shù)據(jù)庫外,僅有極少數(shù)原核模式生物(例如大腸桿菌)建立了組學(xué)數(shù)據(jù)庫。因此為了給研究者提供更加完整、準(zhǔn)確、且易于查用的鼠疫菌注釋信息,有必要在收集整合鼠疫菌多種類型實驗數(shù)據(jù)和重
4、注釋結(jié)果基礎(chǔ)上,建立了針對該物種的跨組學(xué)數(shù)據(jù)庫系統(tǒng)。
本研究工作的主要數(shù)據(jù)來源包括:①基因組序列。NCBI提供的12株鼠疫菌的完成圖,它們是注釋的基礎(chǔ);②91001的蛋白組質(zhì)譜數(shù)據(jù)。質(zhì)譜結(jié)果是一種格式化、標(biāo)準(zhǔn)化的數(shù)據(jù),篩選后可以方便地使用,同時這類數(shù)據(jù)直接來源于實驗,數(shù)據(jù)質(zhì)量高;③RNA-seq數(shù)據(jù),來源于對91001菌株進(jìn)行的RNA測序;④表達(dá)譜數(shù)據(jù)。來自91001基因芯片實驗,這些數(shù)據(jù)顯示基因在多種環(huán)境下的表達(dá)量,雖然暫時
5、難以在注釋中使用,但是可以為研究人員提供一個參考。此外,補(bǔ)充了文獻(xiàn)中發(fā)表的相關(guān)數(shù)據(jù)。
數(shù)據(jù)重注釋工作包括兩部分,第一部分是數(shù)據(jù)預(yù)處理。首先,結(jié)合多組學(xué)數(shù)據(jù)和生物信息軟件、數(shù)據(jù)庫,采用de novo從頭注釋的方法,共同完成重注釋工作。從基因預(yù)測開始,重新鑒定CDS區(qū),修正部分基因的起始位點(diǎn);結(jié)合多個蛋白注釋數(shù)據(jù)庫,確定基因的功能;對于非基因區(qū),采用預(yù)測工具、數(shù)據(jù)庫和文獻(xiàn)注釋出 ncRNA;最后,在全基因組范圍,注釋出重復(fù)序列、移
6、動元件注釋工具等。第二部分是數(shù)據(jù)整理和分析。數(shù)據(jù)經(jīng)過分類、篩選,確定數(shù)據(jù)標(biāo)準(zhǔn),進(jìn)行標(biāo)準(zhǔn)化處理過程,完成后進(jìn)行基因同源性分析、等位基因性分析等。整個過程需要對30多種軟件和數(shù)據(jù)庫進(jìn)行本地化和使用。
跨組學(xué)數(shù)據(jù)庫是一個以若干組學(xué)數(shù)據(jù)庫表為基礎(chǔ)的數(shù)據(jù)庫,不同類型數(shù)據(jù)之間存在密切的相互聯(lián)系。構(gòu)建數(shù)據(jù)庫時采用信息系統(tǒng)的處理方法,結(jié)合鼠疫菌的生物學(xué)特點(diǎn),確定研究目標(biāo)后,從研究人員的需求出發(fā),首先進(jìn)行需求分析,評估系統(tǒng)的可行性,了解功能和業(yè)
7、務(wù)需求,初步制定出數(shù)據(jù)標(biāo)準(zhǔn),并構(gòu)建出數(shù)據(jù)模型;然后根據(jù)數(shù)據(jù)模型,進(jìn)行組學(xué)數(shù)據(jù)庫的結(jié)構(gòu)設(shè)計和功能設(shè)計;最終基于MySQL關(guān)系數(shù)據(jù)庫,使用Python Django框架進(jìn)行web service系統(tǒng)的開發(fā)。
結(jié)合基因組、蛋白組、轉(zhuǎn)錄組等多組學(xué)數(shù)據(jù)和上述方法,本研究首先對鼠疫菌91001株進(jìn)行了全面的重注釋:移除了137個不可靠的編碼區(qū);修正了41個基因起始位點(diǎn)、以及7個假基因和392個假想基因的功能;增加了ncRNA、重復(fù)序列、移
8、動元件等特殊基因組元件和基因組片段多樣性的注釋。通過對信息分析算法和軟件等的梳理整合,建立起可應(yīng)用于其他鼠疫菌的半自動化重注釋工作流程;并進(jìn)一步將該流程應(yīng)用于其他11株鼠疫菌完成圖序列。最后,采用關(guān)系數(shù)據(jù)庫和web框架,構(gòu)建了基于互聯(lián)網(wǎng)絡(luò)的鼠疫菌跨組學(xué)數(shù)據(jù)庫系統(tǒng)——TODY分析平臺(http://tody.bmi.ac.cn/),方便研究者對重注釋數(shù)據(jù)進(jìn)行查詢和使用。在等位基因多樣性處理和Web service服務(wù)系統(tǒng)實現(xiàn)的過程中,采用
9、了并行計算技術(shù)和分布式調(diào)度系統(tǒng),大大減少了計算時間,為下一步大規(guī)模數(shù)據(jù)分析和處理提供知識儲備和技術(shù)支持。
本工作融合了生物實驗、生物學(xué)知識、生物信息工具和計算機(jī)技術(shù),對明確鼠疫菌基因組的結(jié)構(gòu)和功能,揭示其更多的生物學(xué)特性具有重要意義。下一步我們將增加更多的相關(guān)文獻(xiàn)數(shù)據(jù)和實驗數(shù)據(jù),不斷豐富、充實鼠疫菌組學(xué)數(shù)據(jù)庫;通過實驗進(jìn)行重注釋結(jié)果的準(zhǔn)確性驗證;尋找合適的數(shù)據(jù)挖掘模型,進(jìn)行深層次的數(shù)據(jù)分析,構(gòu)建出鼠疫菌知識庫;不斷完善web
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 鼠疫耶爾森氏菌與假結(jié)核耶爾森氏菌比較基因組學(xué)研究.pdf
- 鼠疫耶爾森氏菌pYC質(zhì)粒的全基因組初步分析.pdf
- 鼠疫耶爾森氏菌噬菌體Yep-phi基因組研究及其受體鑒定.pdf
- 鼠疫耶爾森氏菌布氏田鼠疫源地菌株91001全基因組序列測定及初步分析.pdf
- 鼠疫耶爾森氏菌基因組多態(tài)性研究及快速鑒定溯源系統(tǒng)的建立.pdf
- 耶爾森氏菌91001株基因組測序、比較基因組學(xué)及Ⅲ型分泌系統(tǒng)研究.pdf
- 鼠疫耶爾森氏菌知識庫的建立.pdf
- 鼠疫耶爾森氏菌密度感應(yīng)系統(tǒng)研究.pdf
- 鼠疫耶爾森菌課件
- 鼠疫耶爾森氏菌新型候選DNA疫苗的構(gòu)建及其免疫效果鑒定.pdf
- 基于DNA芯片技術(shù)鼠疫耶爾森氏菌在不同條件下的轉(zhuǎn)錄組學(xué)研究.pdf
- 環(huán)境因素調(diào)控鼠疫耶爾森氏菌基因表達(dá)的比較轉(zhuǎn)錄譜學(xué)研究.pdf
- 鼠疫耶爾森氏菌Pla蛋白的提取與純化.pdf
- 鼠疫耶爾森氏菌密度感應(yīng)系統(tǒng)與毒力關(guān)系研究.pdf
- 鼠疫耶爾森氏菌基因表達(dá)譜技術(shù)平臺的建立與應(yīng)用.pdf
- 基因組島數(shù)據(jù)庫及分析平臺構(gòu)建.pdf
- cAMP受體蛋白調(diào)控鼠疫耶爾森氏菌毒力的研究.pdf
- 人類基因組結(jié)構(gòu)注釋數(shù)據(jù)庫構(gòu)建及數(shù)據(jù)可視化展示.pdf
- 鼠疫耶爾森氏菌降解其分泌的鼠毒素研究.pdf
- 鼠疫耶爾森氏菌LcrV突變體的初步研究.pdf
評論
0/150
提交評論