版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、信息網(wǎng)絡(luò)表示現(xiàn)實(shí)世界中實(shí)體以及實(shí)體之間的聯(lián)系。隨著科技的進(jìn)步和互聯(lián)網(wǎng)的普及,信息網(wǎng)絡(luò)應(yīng)用廣泛,如社交網(wǎng)絡(luò)、生物網(wǎng)絡(luò)、交通網(wǎng)絡(luò)等。信息網(wǎng)絡(luò)可以用圖數(shù)據(jù)模型進(jìn)行建模,包含頂點(diǎn)和邊兩個(gè)元素,其中頂點(diǎn)對(duì)應(yīng)現(xiàn)實(shí)世界中的實(shí)體對(duì)象,邊對(duì)應(yīng)實(shí)體之間的聯(lián)系。按照信息網(wǎng)絡(luò)中頂點(diǎn)和關(guān)系的類型的數(shù)量,信息網(wǎng)絡(luò)被劃分為兩類:同構(gòu)信息網(wǎng)和異構(gòu)信息網(wǎng)。同構(gòu)信息網(wǎng)中頂點(diǎn)和邊的類型都只有一種,如朋友網(wǎng)、作者合作網(wǎng)等。異構(gòu)信息網(wǎng)包含多種類型的頂點(diǎn)和邊。大多數(shù)真實(shí)世界的信息
2、網(wǎng)絡(luò)都是異構(gòu)的,如知識(shí)圖譜、社交網(wǎng)絡(luò)、物聯(lián)網(wǎng)等。異構(gòu)信息網(wǎng)絡(luò)強(qiáng)大的表達(dá)能力使其蘊(yùn)含大量有價(jià)值的信息,使異構(gòu)信息網(wǎng)絡(luò)查詢和分析研究具有重要的現(xiàn)實(shí)意義。本文運(yùn)用算法學(xué)、數(shù)據(jù)分析和計(jì)算復(fù)雜性的相關(guān)技術(shù),結(jié)合異構(gòu)信息網(wǎng)信息豐富和結(jié)構(gòu)復(fù)雜的特點(diǎn),對(duì)異構(gòu)信息網(wǎng)絡(luò)查詢和分析問題進(jìn)行深入研究,主要研究成果概括如下:
1.本文研究了異構(gòu)信息網(wǎng)上可達(dá)性查詢問題??蛇_(dá)性查詢是查詢兩個(gè)頂點(diǎn)之間是否存在路徑連接,是信息網(wǎng)絡(luò)中的基本查詢。研究?jī)蓚€(gè)頂點(diǎn)的關(guān)
3、系時(shí),首先考慮的查詢也是兩點(diǎn)的可達(dá)性。然而,信息網(wǎng)絡(luò)上的可達(dá)性查詢不涉及頂點(diǎn)的類型和邊的類型,且都是建立在有向無環(huán)圖的基礎(chǔ)上。在異構(gòu)信息網(wǎng)中環(huán)路是經(jīng)常存在的,把異構(gòu)信息網(wǎng)中強(qiáng)連通組件壓縮成一個(gè)頂點(diǎn)會(huì)丟失不同類型頂點(diǎn)之間的路徑信息,現(xiàn)有的信息網(wǎng)絡(luò)上可達(dá)性研究都無法解決異構(gòu)信息網(wǎng)上基于不同關(guān)系的可達(dá)性查詢。本文形式化的定義了異構(gòu)信息網(wǎng)上可達(dá)性查詢問題,并證明該問題的時(shí)間復(fù)雜性是PTIME的。隨著網(wǎng)絡(luò)規(guī)模的爆炸式增長(zhǎng),每個(gè)查詢都需要遍歷一遍網(wǎng)
4、絡(luò)的時(shí)間開銷是不能容忍的。因此,本文提出MP索引結(jié)構(gòu)用于快速響應(yīng)查詢。通過將網(wǎng)絡(luò)的元路徑按照長(zhǎng)度進(jìn)行分層,構(gòu)建元路徑的偏序圖。在偏序圖上選擇一部分元路徑,并預(yù)計(jì)算元路徑上頂點(diǎn)的可達(dá)信息,使多個(gè)查詢可以共享相同元路徑中頂點(diǎn)可達(dá)信息。在真實(shí)和人工數(shù)據(jù)集上實(shí)驗(yàn)驗(yàn)證了本文算法可以快速響應(yīng)查詢。
2.本文研究了異構(gòu)信息網(wǎng)上聚集算法。聚集操作允許用戶從特定的維度上觀察數(shù)據(jù)的視圖,是多維分析的基礎(chǔ)。然而,信息網(wǎng)絡(luò)上的聚集操作只基于同構(gòu)信息網(wǎng)
5、上頂點(diǎn)的屬性維度,與頂點(diǎn)的類型、邊的類型、以及網(wǎng)絡(luò)的結(jié)構(gòu)無關(guān)。異構(gòu)信息網(wǎng)不僅包含多種類型的頂點(diǎn),還包含多種類型的關(guān)系,聚集的維度不應(yīng)該僅限于頂點(diǎn)的屬性,而忽略豐富的結(jié)構(gòu)信息。因此信息網(wǎng)絡(luò)上現(xiàn)有的聚集工作無法用于異構(gòu)信息網(wǎng)。本文提出了基于多種類型頂點(diǎn)和多種類型邊的聚集操作,聚集的維度包括:頂點(diǎn)的類型、頂點(diǎn)的屬性和邊的類型。定義了異構(gòu)信息網(wǎng)上基于圖熵的度量函數(shù),該函數(shù)能夠很好的刻畫異構(gòu)信息網(wǎng)中頂點(diǎn)在不同關(guān)系上的相似度。本文證明了異構(gòu)信息網(wǎng)上
6、的聚集問題是NP難的,并提出了線性時(shí)間和空間的高效近似聚集算法。聚集算法包括兩個(gè)過程:信息維聚集和結(jié)構(gòu)維聚集。本文進(jìn)一步證明了算法的近似比。最后在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果顯示異構(gòu)信息網(wǎng)上的聚集算法能夠在特定的維度上對(duì)異構(gòu)信息網(wǎng)進(jìn)行深入的分析,并具有較好的可擴(kuò)展性。
3.本文研究了異構(gòu)信息網(wǎng)上立方體計(jì)算問題。立方體計(jì)算允許用戶從不同的維度觀察數(shù)據(jù)對(duì)象的概括,是多維數(shù)據(jù)分析的核心。由于信息網(wǎng)絡(luò)上聚集操作的維度定義的局限制,也導(dǎo)致其立
7、方體物化技術(shù)只基于頂點(diǎn)的屬性維度,通過屬性子集合之間的包含關(guān)系,選擇部分立方體進(jìn)行物化。異構(gòu)信息網(wǎng)上維度概念的復(fù)雜化,使得傳統(tǒng)立方體物化技術(shù)并不適用于異構(gòu)信息網(wǎng)。本文提出了異構(gòu)信息網(wǎng)上立方體概念,從多個(gè)維度分析網(wǎng)絡(luò):頂點(diǎn)屬性、頂點(diǎn)類型和元路徑。本文研究了異構(gòu)信息網(wǎng)上的部分立方體物化問題,證明了該問題是NP難的。為了解決部分立方體物化問題,本文提出了異構(gòu)信息網(wǎng)上聚集圖之間兩種依賴關(guān)系:屬性依賴和路徑依賴,利用這兩種依賴關(guān)系建立代價(jià)模型和構(gòu)
8、建方體格。本文為解決部分立方體物化問題提出了貪心算法,證明了該算法的近似比。在真實(shí)數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果顯示異構(gòu)信息網(wǎng)立方體可以從多個(gè)維度上對(duì)網(wǎng)絡(luò)進(jìn)行有效的分析,部分立方體物化算法可以提高查詢效率。
4.本文研究了異構(gòu)信息網(wǎng)上近似冰山立方體問題。冰山立方體問題是計(jì)算聚集值大于閾值的立方體,是多維數(shù)據(jù)分析中的重要操作。然而,現(xiàn)有信息網(wǎng)絡(luò)上冰山立方體也是基于同構(gòu)信息網(wǎng)中頂點(diǎn)的屬性維度。顯然,這并不適用于異構(gòu)信息網(wǎng)。對(duì)于具有多種類型頂點(diǎn)
9、和邊的異構(gòu)信息網(wǎng)來說,冰山立方體需要涉及頂點(diǎn)的屬性維度、類型維度,以及結(jié)構(gòu)維度,聚集函數(shù)也更加復(fù)雜。因此,需要一種新的冰山立方體定義,刻畫異構(gòu)信息網(wǎng)復(fù)雜的語義和結(jié)構(gòu)。本文形式化的定義了異構(gòu)信息網(wǎng)上冰山立方體,證明了該問題是NP難的。為了快速求解問題,本文設(shè)計(jì)了基于隨機(jī)游走的近似算法,并證明了基于隨機(jī)游走計(jì)算頂點(diǎn)相似性的相對(duì)誤差界。本文設(shè)計(jì)了兩種剪枝策略。當(dāng)聚集函數(shù)滿足單調(diào)性時(shí),可以提前結(jié)束方體計(jì)算或直接對(duì)方體進(jìn)行剪枝。在真實(shí)和人工數(shù)據(jù)集
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 異構(gòu)信息網(wǎng)絡(luò)Top-k相關(guān)性查詢方法研究.pdf
- 基于jspjava信息網(wǎng)設(shè)計(jì)和實(shí)現(xiàn)
- 異構(gòu)信息網(wǎng)絡(luò)分析模型及其應(yīng)用研究.pdf
- 寧夏農(nóng)村信息網(wǎng)的績(jī)效分析.pdf
- 異構(gòu)信息網(wǎng)絡(luò)檢索技術(shù)研究.pdf
- 化學(xué)信息網(wǎng)ppt
- 安徽電力信息網(wǎng)
- 教育信息網(wǎng)若干子系統(tǒng)的研究和實(shí)現(xiàn).pdf
- 異構(gòu)信息集成查詢技術(shù)的研究與實(shí)現(xiàn).pdf
- 測(cè)控信息網(wǎng)傳輸協(xié)議研究.pdf
- 基于威脅分析的電力信息網(wǎng)風(fēng)險(xiǎn)態(tài)勢(shì)評(píng)估和預(yù)測(cè).pdf
- 異構(gòu)信息網(wǎng)絡(luò)上的主題建模研究.pdf
- 附件-浙江農(nóng)業(yè)信息網(wǎng)
- jsp就業(yè)信息網(wǎng)論文
- 陜西采購招標(biāo)信息網(wǎng)
- 營(yíng)口地區(qū)電力信息網(wǎng)系統(tǒng)規(guī)劃和設(shè)計(jì).pdf
- 文件-浙江農(nóng)業(yè)信息網(wǎng)
- 中國(guó)研究生招生信息網(wǎng)
- 控制網(wǎng)與信息網(wǎng)的數(shù)據(jù)融合.pdf
- 郵政信息網(wǎng)信息安全問題初探.pdf
評(píng)論
0/150
提交評(píng)論