版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、隨著高通量測序技術的快速發(fā)展,出現(xiàn)了很多應用高通量測序數(shù)據的結構變異檢測方法。由于高通量測序本身的局限性,例如片段較短、測序誤差偏大等因素,常規(guī)的檢測方法存在較大的局限性,檢測精度和敏感度不夠。針對這個問題,本文主要針對插入變異,提出了一種基于序列拼接的基因組插入變異集成檢測方法,取名為ISALins。本文的主要內容如下:
(1)設計基因組插入變異檢測流程,分析了檢測流程用到的實驗數(shù)據。鑒于千人基因組發(fā)布的插入變異數(shù)量太少,本
2、文通過編程實現(xiàn)生成實驗要用到的插入變異標準集。為了全面驗證實驗的檢測效果,根據實驗需求準備了NA12878個體真實測序數(shù)據和變異基準數(shù)據,仿真數(shù)據和真實數(shù)據為本課題奠定了數(shù)據基礎。
(2)分析了插入變異的片段特征,提出了一個聚簇支持插入變異片段的聚簇算法,保證了后續(xù)序列拼接和變異檢測的有效性。同時提出一種解決基于De Brujin圖序列拼接算法中重復序列的有效策略。
(3)提出了一種基于序列拼接的插入變異集成檢測策略
3、,在仿真數(shù)據和真實數(shù)據上分別進行了實驗。該策略的實施分為四個階段:第一階段,為了在保證檢測敏感度的情況下,提高長插入變異的檢測精度,通過融合多個工具的檢測結果得到一個初始插入變異可疑斷點集合;第二階段,通過在每個可疑斷點附近聚簇OEA片段,并進行軟切片段(soft-clipped read)分析來得到高質量軟切片段;第三階段,利用基于De Brujin圖的方法來進行局部拼接,通過使動態(tài)k-mer和k-mer頻率分析策略來消除基因組重復序
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于reads引導的基因組序列拼接.pdf
- 基于特征挖掘與SVM集成的基因組缺失變異檢測.pdf
- 基因組短序列片段拼接算法研究.pdf
- 13769.宏基因組的序列拼接算法研究
- 基因組序列denovo拼接系統(tǒng)的設計與實現(xiàn)
- 2284.基于debruijn圖的宏基因組序列拼接算法實現(xiàn)
- 基因組序列片段快速拼接及其可視化.pdf
- 基因組變異仿真與基因組模式鑒定.pdf
- 結合基因組變異數(shù)據的序列比對算法的研究.pdf
- 基因組序列快速拼接算法及可視化技術的研究.pdf
- 木瓜核基因組和線粒體基因組的拼接和初步分析.pdf
- 基于BioNano圖譜的基因組結構變異檢測方法研究和應用.pdf
- 基于二代測序的基因組缺失變異綜合檢測策略.pdf
- 基于全基因組的DNA序列詞語挖掘.pdf
- 基因組序列特征分析.pdf
- 草莓病毒分子檢測及其部分基因組序列分析.pdf
- 基因組中插入與缺失的分布規(guī)律.pdf
- 基于基因組序列比對信息挖掘的基因結構預測.pdf
- 櫻桃病毒的檢測及櫻桃病毒A基因組序列分析.pdf
- 基于錨點的多基因組序列比對算法.pdf
評論
0/150
提交評論