版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、一、名詞解釋:一、名詞解釋:1.生物信息學(xué):生物信息學(xué):研究大量生物數(shù)據(jù)復(fù)雜關(guān)系的學(xué)科,其特征是多學(xué)科交叉,以互聯(lián)網(wǎng)為媒介,數(shù)據(jù)庫為載體。利用數(shù)學(xué)知識建立各種數(shù)學(xué)模型利用計算機(jī)為工具對實驗所得大量生物學(xué)數(shù)據(jù)進(jìn)行儲存、檢索、處理及分析,并以生物學(xué)知識對結(jié)果進(jìn)行解釋。2.二級數(shù)據(jù)庫:二級數(shù)據(jù)庫:在一級數(shù)據(jù)庫、實驗數(shù)據(jù)和理論分析的基礎(chǔ)上針對特定目標(biāo)衍生而來,是對生物學(xué)知識和信息的進(jìn)一步的整理。3.FASTA序列格式序列格式:是將DNA或者蛋白
2、質(zhì)序列表示為一個帶有一些標(biāo)記的核苷酸或者氨基酸字符串,大于號()表示一個新文件的開始,其他無特殊要求。4.genbank序列格式序列格式:是GenBank數(shù)據(jù)庫的基本信息單位,是最為廣泛的生物信息學(xué)序列格式之一。該文件格式按域劃分為4個部分:第一部分包含整個記錄的信息(描述符);第二部分包含注釋;第三部分是引文區(qū),提供了這個記錄的科學(xué)依據(jù);第四部分是核苷酸序列本身,以“”結(jié)尾。5.Entrez檢索系統(tǒng):檢索系統(tǒng):是NCBI開發(fā)的核心檢索
3、系統(tǒng),集成了NCBI的各種數(shù)據(jù)庫,具有鏈接的數(shù)據(jù)庫多,使用方便,能夠進(jìn)行交叉索引等特點(diǎn)。6.BLAST:基本局部比對搜索工具,用于相似性搜索的工具,對需要進(jìn)行檢索的序列與數(shù)據(jù)庫中的每個序列做相似性比較。P947.查詢序列(查詢序列(querysequence):也稱被檢索序列,用來在數(shù)據(jù)庫中檢索并進(jìn)行相似性比較的序列。P988.打分矩陣(打分矩陣(scingmatrix):):在相似性檢索中對序列兩兩比對的質(zhì)量評估方法。包括基于理論(如
4、考慮核酸和氨基酸之間的類似性)和實際進(jìn)化距離(如PAM)兩類方法。P299.空位(空位(gap):):在序列比對時,由于序列長度不同,需要插入一個或幾個位點(diǎn)以取得最佳比對結(jié)果,這樣在其中一序列上產(chǎn)生中斷現(xiàn)象,這些中斷的位點(diǎn)稱為空位。P2910.空位罰分空位罰分:空位罰分是為了補(bǔ)償插入和缺失對序列相似性的影響,序列中的空位的引入不代表真正的進(jìn)化事件,所以要對其進(jìn)行罰分,空位罰分的多少直接影響對比的結(jié)果。P3711.E值:值:衡量序列之間相
5、似性是否顯著的期望值。E值大小說明了可以找到與查詢序列(query)相匹配的隨機(jī)或無關(guān)序列的概率,E值越接近零,越不可能找到其他匹配序列,E值越小意味著序列的相似性偶然發(fā)生的機(jī)會越小,也即相似性越能反映真實的生物學(xué)意義。P9512.低復(fù)雜度區(qū)域:低復(fù)雜度區(qū)域:BLAST搜索的過濾選項。指序列中包含的重復(fù)度高的區(qū)域,如poly(A)。13.點(diǎn)矩陣(點(diǎn)矩陣(dotmatrix):構(gòu)建一個二維矩陣,其X軸是一條序列,Y軸是另一個序列,然后在2
6、個序列相同堿基的對應(yīng)位置(x,y)加點(diǎn),如果兩條序列完全相同則會形成一條主對角線,如果兩條序列相似則會出現(xiàn)一條或者幾條直線;如果完全沒有相似性則不能連成直線。14.多序列比對:多序列比對:通過序列的相似性檢索得到許多相似性序列,將這些序列做一個總體的比對,以觀察它們在結(jié)構(gòu)上的異同,來回答大量的生物學(xué)問題。15.分子鐘:分子鐘:認(rèn)為分子進(jìn)化速率是恒定的或者幾乎恒定的假說,從而可以通過分子進(jìn)化推斷出物種起源的時間。16.系統(tǒng)發(fā)育分析:系統(tǒng)發(fā)
7、育分析:通過一組相關(guān)的基因或者蛋白質(zhì)的多序列比對或其他性狀,可以研究推斷不同物種或基因之間的進(jìn)化關(guān)系。17.進(jìn)化樹的二歧分叉結(jié)構(gòu):進(jìn)化樹的二歧分叉結(jié)構(gòu):指在進(jìn)化樹上任何一個分支節(jié)點(diǎn),一個父分支都只能被分成兩個子分支。系統(tǒng)發(fā)育圖:系統(tǒng)發(fā)育圖:用枝長表示進(jìn)化時間的系統(tǒng)樹稱為系統(tǒng)發(fā)育圖,是引入時間概念的支序圖。18.直系同源:直系同源:指由于物種形成事件來自一個共同祖先的不同物種中的同源序列,具有相似或不同的功能。(書:在缺乏任何基因復(fù)制證據(jù)
8、的情況下,具有共同祖先和相同功能的同源基因。)19.旁系(并系)同源:旁系(并系)同源:指同一個物種中具有共同祖先,通過基因重復(fù)產(chǎn)生的一組基因,這些基因在功能上可能發(fā)生了改變。(書:由于基因重復(fù)事件產(chǎn)生的相似序列。)20.外類群:外類群:是進(jìn)化樹中處于一組被分析物種之外的,具有相近親緣關(guān)系的物種。21.有根樹:有根樹:能夠確定所有分析物種的共同祖先的進(jìn)化樹。22.除權(quán)配對算法(除權(quán)配對算法(UPGMA):):最初,每個序列歸為一類,然后
9、找到距離最近的兩類將其歸為一類,定義為一個節(jié)點(diǎn),重復(fù)這個過程,直到所有的聚類被加入,最終產(chǎn)生樹根。23.鄰接法(鄰接法(neighbjoiningmethod):是一種不僅僅計算兩兩比對距離,還對整個樹的長度進(jìn)行最小化,從而對樹的拓?fù)浣Y(jié)構(gòu)進(jìn)行限制,能夠克服UPGMA算法要求進(jìn)化速率保持恒定的缺陷。24.最大簡約法(最大簡約法(MP):在一系列能夠解釋序列差異的的進(jìn)化樹中找到具有最少核酸或氨基酸替換的進(jìn)化樹。25.最大似然法(最大似然法(
10、ML):):它對每個可能的進(jìn)化位點(diǎn)分配一個概率,然后綜合所有位點(diǎn),找到概率最大的進(jìn)化樹。最大似然法允許采用不同的進(jìn)化模型對變異進(jìn)行分析評估,并在此基礎(chǔ)上構(gòu)建系統(tǒng)發(fā)育樹。4.4.一致序列:一致序列:這些序列是指把多序列聯(lián)配的信息壓縮至單條序列,主要的缺點(diǎn)是除了在特定位置最常見的殘基之外,它們不能表示任何概率信息。5.5.HMMHMM隱馬爾可夫模型:隱馬爾可夫模型:一種統(tǒng)計模型,它考慮有關(guān)匹配、錯配和間隔的所有可能的組合來生成一組序列排列。
11、(課件定義)是蛋白質(zhì)結(jié)構(gòu)域家族序列的一種嚴(yán)格的統(tǒng)計模型,包括序列的匹配,插入和缺失狀態(tài),并根據(jù)每種狀態(tài)的概率分布和狀態(tài)間的相互轉(zhuǎn)換來生成蛋白質(zhì)序列。6.6.信息位點(diǎn):信息位點(diǎn):由位點(diǎn)產(chǎn)生的突變數(shù)目把其中的一課樹與其他樹區(qū)分開的位點(diǎn)。7.7.非信息位點(diǎn):非信息位點(diǎn):對于最大簡約法來說沒有意義的點(diǎn)。8.8.標(biāo)度樹:標(biāo)度樹:分支長度與相鄰節(jié)點(diǎn)對的差異程度成正比的樹。9.9.非標(biāo)度樹:非標(biāo)度樹:只表示親緣關(guān)系無差異程度信息。10.有根樹:單一的
12、節(jié)點(diǎn)能指派為共同的祖先,從祖先節(jié)點(diǎn)只有唯一的路徑歷經(jīng)進(jìn)化到達(dá)其他任何節(jié)點(diǎn)。11.無根樹:只表明節(jié)點(diǎn)間的關(guān)系,無進(jìn)化發(fā)生方向的信息,通過引入外群或外部參考物種,可以在無根樹中指派根節(jié)點(diǎn)。18.質(zhì)譜(MS)是一種準(zhǔn)確測定真空中離子的分子質(zhì)量電荷比(mz)的方法,從而使分子質(zhì)量的準(zhǔn)確確定成為可能。質(zhì)譜分析的兩個工具19.分子途徑是指一組連續(xù)起作用以達(dá)到共同目標(biāo)的蛋白質(zhì)。20.虛擬細(xì)胞:一種建模手段,把細(xì)胞定義為許多結(jié)構(gòu),分子,反應(yīng)和物質(zhì)流的集
13、合體。21.先導(dǎo)化合物:是指具有一定藥理活性的、可通過結(jié)構(gòu)改造來優(yōu)化其藥理特性而可能導(dǎo)致藥物發(fā)現(xiàn)的特殊化合物。就是利用計算機(jī)在含有大量化合物三維結(jié)構(gòu)的數(shù)據(jù)庫中,搜索能與生物大分子靶點(diǎn)匹配的化合物,或者搜索能與結(jié)合藥效團(tuán)相符的化合物,又稱原型物,簡稱先導(dǎo)物,是通過各種途徑或方法得到的具有生物活性的化學(xué)結(jié)構(gòu)22.權(quán)重矩陣(序列輪廓):它們表示完全結(jié)構(gòu)域序列,多序列聯(lián)配中每個位點(diǎn)的氨基酸都有分值,并且特定位置插入或缺失的可能性均有一定的衡量方
14、法(課件定義)?;A(chǔ)上針對特定的應(yīng)用目標(biāo)而建立的數(shù)據(jù)庫。23.系統(tǒng)發(fā)育學(xué)(phylogeic):確定生物體間進(jìn)化關(guān)系的科學(xué)分支。24.系統(tǒng)生物學(xué)(systemsbiology):是研究一個生物系統(tǒng)中所有組分成分(基因、mRNA、蛋白質(zhì)等)的構(gòu)成以及在特定條件下這些組分間的相互關(guān)系,并分析生物系統(tǒng)在一定時間內(nèi)的動力學(xué)過程25.蛋白質(zhì)組(proteome):是指一個基因組、一種生物或一個細(xì)胞組織的基因組所表達(dá)的全套蛋白質(zhì)。26.ESI電噴霧
15、離子化:一種適合大分子如蛋白質(zhì)離子化沒有明顯降解的質(zhì)譜技術(shù)。1.鳥槍法測序(shotgunmethod)一種測序方法,包括從基因組中獲得隨機(jī)的、已測序的克隆片段,并且對初始基因的位置一無所知。2.BLAST:基本局部相似性比對搜索工具。在序列數(shù)據(jù)庫中快速查找與給定的序列具有最優(yōu)局部對準(zhǔn)結(jié)果的序列的一種序列對算法。3.整體聯(lián)配(globalalignment):對兩個核苷酸或蛋白質(zhì)序列的全長所進(jìn)行的比對。4.FASTA:是第一個被廣泛使用
16、的數(shù)據(jù)庫相似性搜索算法,這個程序通過掃描序列中“詞”的小配對,從而尋找最優(yōu)局部比對。5.算法(algithm):在計算機(jī)程序中包含的一種固定過程。6.序列比對(alignment):將兩個或多個序列排在一起,以達(dá)到最大一致性的過程(對于氨基酸序列是比較他們的保守性),這樣評估序列間的相似性和同源性。7.多序列比對(multiplesequencealignment):三個或多個序列之間的比對,如果序列在同一列有相同結(jié)構(gòu)位置的殘基和(或)
17、祖?zhèn)鞯臍埢?,則會在該位置插入空位。8.最佳聯(lián)配(optimalalignment):兩個序列之間有最高打分值的排列。9.空位(gap):在兩條序列比對過程中需要在檢測序列或目標(biāo)序列中引入空位,以表示插入或刪除。10.模塊替換矩陣(BLUSUM)在替換矩陣中,每個位置的打分是在相關(guān)蛋白局部比對模塊中觀察到的替換的頻率而獲得的,每個矩陣被修改成一個特殊的進(jìn)化距離。11.可接受點(diǎn)突變(PAM)一個用于衡量蛋白質(zhì)序列的進(jìn)化突變程度的單位。12.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 生物信息學(xué)復(fù)習(xí)題
- 生物信息學(xué) 復(fù)習(xí)題
- 生物信息學(xué)復(fù)習(xí)題及答案西農(nóng)
- 生物信息學(xué)復(fù)習(xí)題及答案(陶士珩)
- 生物信息學(xué)復(fù)習(xí)題及答案陶士珩
- 翠花生物信息學(xué)復(fù)習(xí)題
- 生物信息學(xué) 期末復(fù)習(xí)
- 中國藥科大學(xué)《藥物生物信息學(xué)》復(fù)習(xí)題庫
- 生物信息學(xué)課后題及答案
- 生物信息學(xué)
- 農(nóng)業(yè)信息學(xué)復(fù)習(xí)題
- 生物信息學(xué)課件
- 生物信息學(xué)導(dǎo)論
- 生物信息學(xué)教案
- 生物信息學(xué)課程信息
- 醫(yī)學(xué)信息學(xué)復(fù)習(xí)題資料
- 生物信息學(xué)概論
- 生物信息學(xué)序列分析
- 生物信息學(xué)考試大綱
- 生物信息學(xué)作業(yè)實驗
評論
0/150
提交評論