版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、索引的動(dòng)態(tài)維護(hù)與更新是全文檢索與全文索引技術(shù)中的一個(gè)重要研究和應(yīng)用方向,當(dāng)隨著Internet的迅速發(fā)展,互聯(lián)網(wǎng)上信息數(shù)據(jù)在急劇地增長,而在這種海量數(shù)據(jù)的情況下,新的數(shù)據(jù)在不斷增長,同時(shí)過時(shí)的數(shù)據(jù)就要被淘汰,這就需要對(duì)信息數(shù)據(jù)頻繁的插入和刪除,因此,索引的動(dòng)態(tài)維護(hù)中的歸并算法的研究也就處于了一個(gè)十分重要的地位。本論文主要針對(duì)常見的索引歸并算法進(jìn)行改良,并對(duì)改良的算法在時(shí)間效率以及可行性上進(jìn)行了研究論述。 索引的過程就是把原始的數(shù)
2、據(jù)處理成一個(gè)有利于高效檢索的數(shù)據(jù)形式,因此索引的基本結(jié)構(gòu)關(guān)系到動(dòng)態(tài)索引維護(hù)與更新的效率,包括建立索引的過程,索引的組織方式,正排表,倒排文件及倒排索引的建立,本文介紹了構(gòu)造倒排索引的過程,并分析靜態(tài)索引技術(shù)的優(yōu)缺點(diǎn)以及增量索引知識(shí),還有索引動(dòng)態(tài)更新對(duì)信息檢索技術(shù)的重要性。 本文比較了各種索引更新策略,包括原地更新策略,重建策略,重新歸并更新策略,并且分析了這些策略的成本代價(jià),在此基礎(chǔ)上研究了基于歸并策略的各種不同的索引歸并算法,
3、包括有立即歸并算法,對(duì)數(shù)歸并算法,幾何劃分歸并算法,類哈夫曼索引歸并算法,同時(shí)分析了他們的優(yōu)缺點(diǎn),提出了各自的改良算法,其中本文的重點(diǎn)是在詳細(xì)分析幾何劃分歸并算法的基礎(chǔ)上,針對(duì)原有的幾何歸并算法在索引過程中沒有對(duì)文檔刪除,提出了帶有索引垃圾碎片的回收的新的幾何歸并算法,其中新算法采用了極限值的方法對(duì)刪除的文檔進(jìn)行處理。 最后通過一個(gè)開源的全文檢索與全文索引平臺(tái)測(cè)試了立即歸并算法,對(duì)數(shù)歸并算法及改進(jìn)算法的索引合并過程和時(shí)間,驗(yàn)證了
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 外存全文索引算法的研究.pdf
- 壓縮全文索引的研究
- 壓縮全文索引的研究.pdf
- 分布式全文索引技術(shù)的研究.pdf
- 數(shù)據(jù)庫中基于多索引段的全文索引研究.pdf
- 基于HBase的全文索引及檢索技術(shù)的研究.pdf
- 后綴樹全文索引模型的研究與應(yīng)用.pdf
- 動(dòng)態(tài)全文索引系統(tǒng)關(guān)鍵技術(shù)研究.pdf
- 基于COM技術(shù)的全文索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于MapReduce的全文索引模塊的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 全文索引引擎Lucene的研究及其手機(jī)中的應(yīng)用實(shí)現(xiàn).pdf
- 基于鄰接矩陣的全文索引模型的研究.pdf
- 分布式WEB文檔全文索引關(guān)鍵技術(shù)研究.pdf
- 備份系統(tǒng)中流式全文索引嵌入模型的研究與設(shè)計(jì).pdf
- 基于混合全文索引的煤質(zhì)文件管理系統(tǒng)研究
- 全文檢索中索引算法的優(yōu)化研究.pdf
- 高并發(fā)查詢條件下動(dòng)態(tài)在線全文索引技術(shù)研究.pdf
- 基于混合全文索引的煤質(zhì)文件管理系統(tǒng)研究.pdf
- 一種分布式全文索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 壓縮全文自索引算法的研究.pdf
評(píng)論
0/150
提交評(píng)論