版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、bowung@20101216I一什么是生物信息學一什么是生物信息學?Genomeinfmaticsisascientificdisciplinethatencompassesallaspectsofgenomeinfmationacquisitionprocessingstagedistributionanalysisinterpretation.(它是一個學科領域,包含著基因組信息的獲取、處理、存儲、分配、分析和解釋的所有方面。)(
2、TheU.S.HumanGenomeProject:TheFirstFiveYearsFY19911995byNIHDOE)生物信息學是把基因組DNA序列信息分析作為源頭,破譯隱藏在DNA序列中的遺傳語言,特別是非編碼區(qū)的實質;同時在發(fā)現(xiàn)了新基因信息之后進行蛋白質空間結構模擬和預測。生物信息學的研究目標是揭示“基因組信息結構的復雜性及遺傳語言的根本規(guī)律”。它是本世紀自然科學和技術科學領域中“基因組、“信息結構”和“復雜性”這三個重大科學
3、問題的有機結合。二、生物學研究內容(一)經典的研究內容大規(guī)模基因組測序中的信息分析拼接和注釋大規(guī)模測序是基因組研究的最基本任務,它的每一個環(huán)節(jié)都與信息分析緊密相關。從測序儀的光密度采樣與分析、堿基讀出、載體標識與去除、拼接與組裝、填補序列間隙、到重復序列標識、讀框預測和基因標注的每一步都是緊密依賴基因組信息學的軟件和數(shù)據(jù)庫的。1HowtofindthecodingregionsinrudeDNAsequenceBysignalsByco
4、ntents基于信號或堿基組成Bysignals作為參考信息作為參考信息○1AmongthetypesoffunctionalsitesingenomicDNAthatresearchershavesoughttorecognizearesplicesitesstartstopcodonsbranchpointspromotersterminatsoftranionpolyadenylationsitesribosomalbinding
5、sitestopoisomeraseIIbindingsitestopoisomeraseIcleavagesitesvarioustranionfactbindingsites.Localsitessuchasthesearecalledsignalsmethodsfdetectingthemmaybecalledsignalsenss.第一、序列長度短,重復性大,假的比真的多百千倍,因而單獨使用無法真正達到檢測的目的。第二、信號模式
6、不是唯一不變的,而是用概率來表示的。Bycontent更多依賴于更多依賴于○2I.StatisticalmethodSequenceAlignmentMethodenevenpositionalbasefrequence(Dvalue)編碼區(qū)是三聯(lián)體,將密碼子翻譯與天然蛋白的氨基酸序列進行比較(天然的蛋白質有固定的氨基酸比例)。這種方法產生三種可能的氨基酸序列,若其中有一個非常像氨基酸序列,則另外兩個都非常不像,則非常像的那個便是;若三
7、個都模糊像,則都不是。與數(shù)據(jù)庫進行比對,這種方法發(fā)現(xiàn)不了新蛋白。II.SequenceAnalysis–PairwiseAlignment雙序列比對經典的雙序列比對運用動態(tài)規(guī)劃(DP)的形式,通過緩存亞問題的解決和重利用而不是重計算他們而解決一個最佳問題,運動DP的尋找兩個長度為N的序列最佳排列將產生N2的亞問題。準確,但耗費計算機的資源。上述方法在序列很長時計算速度太慢,因此人們將之簡化,發(fā)展處Heuristicschemes的方法。
8、比較成熟的有FASTA和BLAST。這種方法搜尋短序列不插入間隔。bowung@20101216III2問題與挑戰(zhàn)1)散在重復序列:花樣類似但是分散在不同的位置。Alu2)由于RNA編輯,可變剪接,一個基因產生許多蛋白3四個例子1)理論研究:騰沖耐熱菌的測序和其耐熱性的研究研究代謝途徑,測出未知功能的基因方法,將所有FA合成的路徑圖全畫出,將其編碼○1的2800多個蛋白與圖上所需酶進行比對,所有酶都對上就是這個途徑。親緣關系(和枯草桿菌
9、60%的親緣性,不耐熱)○2代謝(脂肪酸,核酸)有什么特殊的pathway重復片段300bp280次,是轉錄的起始位點將耐熱與不耐熱的細菌基因組進行比較,得出耐熱所需的蛋白一般來說,耐熱菌的GC含量較高(其實不然),耐熱菌的GC大部分小于50%,但是不耐熱菌GC含量變化更大,多以細菌基因組GC含量與耐熱無關,但與mRNArRNA的GC含量有關,GC含量高,耐熱性上升。2)疾病研究:細菌性痢疾測序發(fā)現(xiàn),引起細菌性痢疾細菌的基因組和Ecol
10、iK12Ecoli157很近。比較引起痢疾和不引起痢疾細菌,發(fā)現(xiàn)了痢疾引起的細菌含有毒力島和黑洞(痢疾沒有,不痢疾的有,保護機制的喪失)。3)工業(yè)生產:維生素C生產菌株氧化葡萄酸桿菌基因組測序和組裝4)SARS簡介ThecappedpolyadenylatedgenomeisthelargestoftheRNAviruseshasauniquemethodofreplication.Theseviruseshavetheabilityt
11、ogeicallyrecombinewithothermembersoftheconavirusfamily.Thegenomeencodes34differentstructuralproteins.HumanConavirusOC43encodesfhemagglutininesterase(HE)whereasHCV229Edoesnot.Thisproteincausesredbloodcellstoclumptogetherc
12、anbeusedtodeterminehowmuchvirusisinasample.HEcanalsoinitiatebinding.HumanTovirusalsoencodesfHE.Allconavirusesencodefanucleocapsidprotein(N).ThisproteinbindstoRNAfmsahelicalnucleocapsid.ItmaybeinvolvedintheregulationofRNA
13、synthesis.Themembraneglycoprotein(M)isinvolvedwithenvelopefmation.Thespikeprotein(S)isalsoresponsiblefbindingtocells.Theconacyclelinktotheleftexplainstheinvolvementoftheseproteinsineachstepofthedynamicphase.(二)(二)新基因和新新基
14、因和新SNPs的發(fā)現(xiàn)與鑒定的發(fā)現(xiàn)與鑒定大部分新基因是靠理論方法預測出來的。比如啤酒酵母完整基因組(約1300萬bp)所包含的6千多個基因,大約60%是通過信息分析得到的。a)、利用EST(ExpressionSequenceTag)數(shù)據(jù)庫(dbEST)發(fā)現(xiàn)新基因和新SNPs國際上現(xiàn)已出現(xiàn)了幾個基于EST的基因索引如UniGeneMerckGeneGenExpressindex,這些基因索引數(shù)據(jù)庫(即二次數(shù)據(jù)庫)構建了基因框架,極大地方便
15、了相關研究者。超大規(guī)模計算方法:建立實驗方法,讓一小段真正的編碼區(qū)標簽表達,企圖發(fā)現(xiàn)整個編碼序列,幾百方法:建立實驗方法,讓一小段真正的編碼區(qū)標簽表達,企圖發(fā)現(xiàn)整個編碼序列,幾百個堿基序列一個標簽,其數(shù)據(jù)庫集中全世界所有的標簽,進行拼接和組裝,得到編碼序個堿基序列一個標簽,其數(shù)據(jù)庫集中全世界所有的標簽,進行拼接和組裝,得到編碼序列,同樣將相同片段進行比較能發(fā)現(xiàn)列,同樣將相同片段進行比較能發(fā)現(xiàn)SNPs也可以發(fā)現(xiàn)非編碼序列也可以發(fā)現(xiàn)非編碼序
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論