版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、計算機研究與發(fā)展DOI:10.7544issn10001239.2016.JournalofComputerResearchDevelopment卷(期):起止頁年收稿日期收稿日期:20160316;修回日期修回日期:20160426六號基金項目基金項目:國家自然科學基金項目(60903098);吉林省工業(yè)技術研究和開發(fā)項目(JF2012c0162);吉林大學研究生創(chuàng)新基金項目(2015040)ThiswkissupptedbytheN
2、ationalNaturalScienceFoundationofChina(60903098)theProjectofJilinProvincialIndustrialTechnologyResearchDevelopment(JF2012c0162)theGraduateInnovationFundofJilinUniversity(2015040).六號,核實準確完整的基金名稱和英文翻譯通信作者通信作者:彭濤(tpeng@jlu.
3、)(注:此模板非完整論文,已做刪減。只看格式,勿參考內容)(注:此模板非完整論文,已做刪減。只看格式,勿參考內容)異質網中基于張量表示的動態(tài)離群點檢測方法異質網中基于張量表示的動態(tài)離群點檢測方法題目三號劉露1左萬利12彭濤12作者四號宋體,作者和單位的對應關系標注在作者姓名的右上角1(吉林大學計算機科學與技術學院長春130012)單位小五號2(符號計算與知識工程教育部重點實驗室(吉林大學)長春130012)1(.)小五號TensRepr
4、esentationBasedDynamicOutlierDetectionMethodinHeterogeneouswkTitle四號四號LiuLu1ZuoWanli12PengTao12Name五號1(CollegeofComputerScienceTechnologyJilinUniversityChangchun130012)Depart.Crespond小五號2(KeyLabatyofSymbolComputationKnow
5、ledgeEngineering(JilinUniversity)MinistryofEducationChangchun130012)AbstractMiningrichsemanticinfmationhiddeninheterogeneousinfmationwkisanimptanttaskindatamining.Thevaluedatadistributiongenerationmechanismofoutliersarea
6、lldifferentfromthatofnmaldata.Itisofgreatsignificanceofanalyzingitsgenerationmechanismeveneliminatingoutliers.Outlierdetectioninhomogeneousinfmationwkhasbeenstudiedexpledfalongtime.Howeverfewofthemareaimingatdynamicoutli
7、erdetectioninheterogeneouswks.Manyissuesneedtobesettled.Duetothedynamicsoftheheterogeneousinfmationwknmaldatamaybecomeoutliersovertime.ThispaperproposesadynamicTensRepresentationBasedOutlierdetectionmethodcalledTRBOutlie
8、r.Itconstructstensindextreeaccdingtothehighderdatarepresentedbytens.Thefeaturesareaddedtodirectitemsetindirectitemsetrespectivelywhensearchingthetensindextree.Meanwhilewedescribeaclusteringmethodbasedonthecrelationofshtt
9、extstojudgewhethertheobjectsindatasetschangetheiriginalclustersthendetectoutliersdynamically.Thismodelcankeepthesemanticrelationshipinheterogeneouswksasmuchaspossibleinthecaseoffullyreducingthetimespacecomplexity.Theexpe
10、rimentalresultsshowthatourproposedmethodcandetectoutliersdynamicallyinheterogeneousinfmationwkeffectivelyefficiently.Abstract五號,至少200字,影響EI索引Keywdsdynamicoutlierdetectionheterogeneousinfmationwktensrepresentationtensinde
11、xtreeclusteringKeywds五號摘要挖掘隱藏在異質信息網絡中豐富的語義信息是數(shù)據挖掘的重要任務之一離群點在值、數(shù)據分布、和產生機制上都明顯不同于正常數(shù)據對象檢測離群點并分析其不同的產生機制,最終消除離群點具有重要的現(xiàn)實意義目前,針對異質信息網絡動態(tài)離群點檢測的研究工作相對較少,還有很多問題有待解決由于異質信息網絡的動態(tài)性,隨著時間的變化,正常數(shù)據對象也可能轉變?yōu)殡x群點針對異質網絡提出一種基于張量表示的動態(tài)離群點檢測方法,并
12、根據張量表示的高階數(shù)據構建張量索引樹通過搜索張量索引樹,將特征加入到直接3計算機研究與發(fā)展2016年定的關系類當節(jié)點類型數(shù)量∣A∣1或邊的類型數(shù)量∣R∣1時,這樣的信息網絡被稱為異質信息網絡反之為同質信息網絡定義2異質信息網絡中的N階張量我們將異質信息網絡中的N階張量表示為X∈?其中,N為張量的階數(shù)(也可稱模NtypeNltypeltypelIII?2211數(shù))第1階張量的長度記為l1,其對應的實體類型為type1第N階張量的長度記為l
13、N,其對應的實體類型為typeNtypei∈A,1≤i≤N?公式用office2003編輯器或者mathtype,普通變量用斜體,向量、矢量、張量用黑斜體例如,文獻網絡可以被表示成1個4階張量,X∈?電影網絡可以被表示為1TermVenuePaperAuth4321llllIIII個4階張量X∈?或一個3階張LanguageGenreMovieAct4321llllIIII量X∈?GenreMovieAct321lllIII定義3張量索
14、引樹張量索引樹是包含n(n≥1)個節(jié)點且滿足下列條件的有限集合:1)張量索引樹中的每一個節(jié)點都由1個N(N≥1)維向量組成2)存在唯一一個向量節(jié)點X0,它是由一系列時序數(shù)據組成的向量,稱為張量索引樹的根節(jié)點3)張量索引樹同一層的節(jié)點可以包含不同類型的數(shù)據但同一類型的數(shù)據都處于張量索引樹的同一層中…………2.2張量索引樹的構建我們之前提到過,張量矢量化可能破壞各階中數(shù)據之間的關系在大數(shù)據環(huán)境下,不可避免地會引起維數(shù)災難而對于異質網絡中的數(shù)
15、據,如何進行高階統(tǒng)計也是我們需要考慮的問題應用張量分解方法,例如構建鄰接矩陣,處理數(shù)據集中的樣本會出現(xiàn)嚴重的數(shù)據稀疏性問題在本節(jié)中,我們提出了一種構建張量索引樹的方法來處理異質信息網絡中用張量表示的數(shù)據,進而動態(tài)發(fā)現(xiàn)網絡中存在的離群點我們首先描述張量索引樹的構建過程由于本文主要解決動態(tài)離群點發(fā)現(xiàn)的問題,因此,張量索引樹的根節(jié)點為時序數(shù)據組成的向量X=(X1,X2,…,Xn),如圖1中Layer1所示在本節(jié)中,我們使用文獻網絡中的3階張量
16、模型來說明構建過程在時間點X1中,順序遍歷N(N=3)階張量中的第1階張量將屬于type1類型的實體(作者名)加入第2層向量節(jié)點中同時,將該作者發(fā)表的論文依次加入第3層向量節(jié)點中第3層向量節(jié)點中的論文題目作為第2層向量節(jié)點中作者名的后繼節(jié)點……張量索引樹的構建不僅可以加快離群點檢測的速度,而且可以有效解決在使用鄰接矩陣進行計算時出現(xiàn)的數(shù)據稀疏性問題X1X2XiXn1Xn...A11A12A1n1Length=n1A21A22A2n2Le
17、ngth=n2An1An2AnnmLength=nmP11P12P1u1P21P22P2u2Pn1Pn2PnumT11T12T1v1T21T22T2v2Tn1Tn2T2v...mLayer1:TimestampLayer2:AuthLayer3:PaperLayer4:TermLength=u1Length=u2Length=umLength=v1Length=v2Length=vm...........................
18、.........Fig.1Thetensindextreeconstructedbyathirddertensinbibliographicwk.圖1文獻網絡中由3階張量所構建的張量索引樹中英文圖題用小五號,圖內的字用英文六號3基于張量表示的聚類過程在本節(jié)中,我們詳細介紹如何根據給定的入口entry(source,target)搜索張量索引樹,進而使用聚類方法發(fā)現(xiàn)異質網絡中存在的離群點(即源節(jié)點相對于目標類別是否離群)張量索引樹可以根
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 一種新的圖像置亂算法-歡迎訪問計算機研究與發(fā)展
- 一種基于小波變換和騎士巡游的圖像置亂算法題目三號
- 圖像的混沌置亂算法研究.pdf
- 基于混沌置亂和Radon變換置亂的圖像加密算法.pdf
- 數(shù)字圖像置亂算法的研究.pdf
- 基于分區(qū)圖像置亂算法的研究.pdf
- 圖像置亂算法及其評估研究.pdf
- 一種基于線性同余的空間變換圖像置亂加密新算法.pdf
- 彩色數(shù)字圖像的置亂算法研究.pdf
- 基于改進的zigzag置亂的dwt圖像水印算法
- 一種基于BRISK的快速圖像拼接新算法.pdf
- 一種新的圖像分割算法—一種基于免疫遺傳算法和粗糙集的改進圖像分割算法.pdf
- 基于混沌映射的數(shù)字圖像置亂算法.pdf
- 一種新的顏色量化算法
- 基于混沌映射與排序變換的圖像置亂算法.pdf
- 基于最佳置亂的自適應圖像數(shù)字水印算法.pdf
- 一種新的基于區(qū)域生長的彩色圖像分割算法.pdf
- 基于置亂的DWT域數(shù)字圖像水印算法研究.pdf
- 一種圖像拼接算法的研究.pdf
- 基于騎士巡游變換的圖像置亂算法及評價方法.pdf
評論
0/150
提交評論