版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、本體搜索引擎是本體選擇與重用過程中的重要工具,在語義網(wǎng)快速發(fā)展的今天,隨著本體文檔的數(shù)量級不斷攀升,本體搜索引擎的研究得到了越來越多的關(guān)注并發(fā)揮了日益重要的作用。近幾年來,人們對本體搜索引擎的相關(guān)研究問題做了初步的研究,取得了階段性的成果,主要集中在RDF文檔的收集、語義網(wǎng)中的排序問題、本體文檔中文本信息索引、海量RDF三元組存儲等方面。然而,現(xiàn)有的本體搜索引擎在從收集本體到幫助用戶選擇與重用本體的過程中依然存在諸多的問題,需要進一步的
2、研究。1998年,Tim Berners-Lee進一步提出了語義網(wǎng)(Semantic Web)的概念,目標是一個使用計算機可理解的方式描述事物的共享平臺。 在現(xiàn)有工作的基礎(chǔ)上,本文對本體搜索引擎的收集、分析、索引和檢索這四個環(huán)節(jié)中的若干問題開展了深入地研究。論文的貢獻主要包括以下四個方面: (1)給出了發(fā)現(xiàn)語義網(wǎng)站點的一組規(guī)則,并且提出了語義網(wǎng)站點的一個排序方法。本文定義了一系列啟發(fā)式規(guī)則,對給定的原始數(shù)據(jù)集中的RDF文
3、檔進行分析,發(fā)現(xiàn)可能包含新的RDF文檔的語義網(wǎng)站點,并提出了語義網(wǎng)站點的排序方法。相對于目前已有的數(shù)據(jù)收集方式,對語義網(wǎng)站點的發(fā)現(xiàn)與排序方法的研究將提高本體搜索引擎數(shù)據(jù)收集的效率。 (2)給出了基于RDF句子的本體文檔分析方法,并且提出了基于RDF句子圖的術(shù)語排序方法。本文定義了RDF句子的概念,并以RDF句子為基礎(chǔ),提出了一套本體文檔的分析方法。在這套分析方法中,本文主要討論了五個關(guān)鍵的研究點,包括術(shù)語定義權(quán)威性的判斷方法、判
4、斷術(shù)語類型的一組規(guī)則、RDF句子解析算法、基于RDF句子圖的術(shù)語排序方法及術(shù)語的組織方法。這些研究將從不同的方面加強和擴展本體搜索引擎所能提供的功能。 (3)提出了一種基于虛擬文檔的術(shù)語文本信息索引方法以及一種基于鄰居樹的結(jié)構(gòu)信息索引方法。本文首先借助于虛擬文檔概念,提出了索引術(shù)語虛擬文檔的方法。將術(shù)語的虛擬文檔作為術(shù)語的文本信息進行索引,可以提高檢索的召同率;其次,本文提出了鄰居樹的數(shù)據(jù)結(jié)構(gòu),并通過分而治之的方法,索引術(shù)語之間
5、的關(guān)系這一重要的語義網(wǎng)結(jié)構(gòu)信息。相對于現(xiàn)有的結(jié)構(gòu)信息索引方法,基于鄰居樹的結(jié)構(gòu)信息索引更適合于大規(guī)模的信息檢索系統(tǒng)。 (4)提出了本體文檔的摘要方法和詞匯的摘要方法。類似于文本摘要方法,本體文檔或詞匯的摘要方法使用鏈接分析方法從本體文檔或詞匯中評價并抽取重要的RDF句子作為摘要,并通過一定的重排序策略降低摘要的信息冗余度。 本文對以上研究內(nèi)容均開展了相應(yīng)的實驗,并與相關(guān)工作進行了對比。實驗結(jié)果表明,本文中提出的概念和方法
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于Rough本體的語義搜索引擎研究.pdf
- 基于語義本體的智能搜索引擎研究.pdf
- 傳統(tǒng)搜索引擎與智能搜索引擎比較研究.pdf
- 基于本體的語義垂直搜索引擎研究.pdf
- [學(xué)習(xí)]搜索引擎優(yōu)化與搜索引擎營銷
- 搜索引擎
- 基于本體的Deep Web語義搜索引擎.pdf
- 基于本體的個性化搜索引擎研究.pdf
- 基于本體的省情網(wǎng)垂直搜索引擎研究.pdf
- 搜索引擎及搜索引擎優(yōu)化(seo)實驗
- 搜索引擎改進問題的研究.pdf
- 搜索引擎相關(guān)技術(shù)研究.pdf
- 基于本體的智能搜索引擎研究與應(yīng)用.pdf
- 基于語義本體的垂直搜索引擎模型研究.pdf
- 基于本體的專業(yè)搜索引擎的研究與設(shè)計.pdf
- se(搜索引擎)相關(guān)知識詳解
- 搜索引擎07011
- 全文搜索引擎
- 搜索引擎18307
- 搜索引擎06826
評論
0/150
提交評論