基于相似性分析的時間序列異常檢測研究.pdf_第1頁
已閱讀1頁,還剩63頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著經(jīng)濟的高速發(fā)展和科技的不斷進步,人們對各類信息的關注和依賴也日趨增加,如何充分有效地管理和利用這些海量數(shù)據(jù)、發(fā)現(xiàn)這些數(shù)據(jù)背后隱含的規(guī)律和知識,就成為研究者非常關注的問題。作為數(shù)據(jù)挖掘的重要研究課題之一,時間序列的數(shù)據(jù)挖掘與預測近幾年發(fā)展迅速,它將數(shù)據(jù)挖掘和時間序列聯(lián)系起來,支持解決發(fā)現(xiàn)型問題,以從海量的時間序列數(shù)據(jù)中挖掘出有價值的、潛在的、未知的知識為目的。本文以時間序列數(shù)據(jù)的異常檢測為主題,分別研究了時間序列的模式表示方法、時間序

2、列的相似性度量、時間序列的異常檢測等問題。以下是本文的主要研究工作和成果:
   (1)基于重要點探測技術的時間序列線性分段算法能較好的保留序列的全局特征和擬合高精確度。傳統(tǒng)的基于重要點時間序列分段算法,只能通過誤差閾值來控制分段,該方法不能預計分段數(shù)量,不能適應后期要求分段數(shù)量一定的應用。本文對該方法進行改進,通過重新調整原方法的分段次序,使用重要點組成的直線段近似描述時間序列,該方法能夠在分段數(shù)量一定的情況下對時間序列分段。

3、實驗證明,該分段算法能在在固定分段數(shù)的情況下反映時間序列的主要特征,算法簡單快速,整體擬合誤差小。
   (2)提出了一種基于PLR表示的時間序列動態(tài)平移模式距離(DynamicTranslationPatternDistance,DTPD)。該方法由單模式距離(SinglePatternDistance,SPD)和全模式距離(FullPatternDistance,FPD)兩部分組成。單模式距離(SPD)用于比較一個單獨模式之

4、間的相似度,而全模式距離(FPD)用于比較模式組之間的相似度,也就是整條時間序列之間的相似度。全模式距離(FPD)采用了和時間序列動態(tài)彎曲距離(DTW)相似的動態(tài)彎曲思路,將單模式距離(SPD)整合為全模式距離(FPD),并以此作為候選序列之間的相似量度。實驗證明,使用該方法對實驗數(shù)據(jù)集進行聚類準確、高效。
   (3)通過對基于k-近鄰局部密度的異常檢測LOF方法經(jīng)行研究,將LOF方法改進后引入時間序列的異常檢測中,提出一種基

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論