多尺度關(guān)聯(lián)規(guī)則挖掘理論與方法.pdf_第1頁
已閱讀1頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘領(lǐng)域的一個重要分支,廣泛應用于互聯(lián)網(wǎng)、金融、生物信息等研究領(lǐng)域。關(guān)聯(lián)規(guī)則挖掘旨在從樣本集中找出隱藏在數(shù)據(jù)背后頻繁出現(xiàn)的相關(guān)關(guān)系與模式。多尺度關(guān)聯(lián)規(guī)則是典型的跨學科課題,其實質(zhì)是利用關(guān)聯(lián)規(guī)則技術(shù)多尺度、多層次地剖析數(shù)據(jù)之間相互關(guān)系,研究尺度轉(zhuǎn)換過程產(chǎn)生的尺度效應問題。多尺度科學已經(jīng)在關(guān)聯(lián)規(guī)則挖掘領(lǐng)域取得了可觀的進展,提出了一些多尺度關(guān)聯(lián)規(guī)則挖掘理論和尺度轉(zhuǎn)換方法,但研究大多集中在空間、圖像類型的數(shù)據(jù)上,對于一般數(shù)據(jù)的

2、多尺度數(shù)據(jù)挖掘研究較少,這限制了多尺度科學在數(shù)據(jù)挖掘領(lǐng)域的研究和發(fā)展。
  論文將多尺度科學與關(guān)聯(lián)規(guī)則挖掘相結(jié)合,進一步研究面向更為廣泛的數(shù)據(jù)類型的多尺度關(guān)聯(lián)規(guī)則理論與方法。圍繞多尺度科學的研究核心,依據(jù)層次理論提出廣義尺度定義,實現(xiàn)一般數(shù)據(jù)集的多尺度劃分,分析尺度轉(zhuǎn)換的原因和分類,提出多尺度關(guān)聯(lián)規(guī)則挖掘的實質(zhì);引入包含度概念,提出基于包含度的相似度理論,在此基礎上提出基于相似度的頻繁項集處理方法;將多尺度關(guān)聯(lián)規(guī)則挖掘理論作為指導

3、思想,基于高斯金字塔法提出多尺度關(guān)聯(lián)規(guī)則的尺度上推挖掘算法,基于三次卷積法提出多尺度關(guān)聯(lián)規(guī)則的尺度下推挖掘算法,最終實現(xiàn)知識的多尺度轉(zhuǎn)換。
  本文以多尺度關(guān)聯(lián)規(guī)則挖掘為研究重點,研究多尺度關(guān)聯(lián)規(guī)則挖掘理論體系,探索多尺度關(guān)聯(lián)規(guī)則尺度轉(zhuǎn)換方法。主要完成了以下幾個方面工作:
  1)探討多尺度關(guān)聯(lián)規(guī)則挖掘理論體系
  傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘沒有深入研究數(shù)據(jù)的多尺度特性,已有的多尺度關(guān)聯(lián)規(guī)則挖掘理論和方法大多應用于空間、圖像數(shù)

4、據(jù),對一般數(shù)據(jù)類型的多尺度關(guān)聯(lián)規(guī)則挖掘理論較少。針對上述問題,從尺度、數(shù)據(jù)的多尺度、尺度劃分、尺度轉(zhuǎn)換和多尺度關(guān)聯(lián)規(guī)則的定義及挖掘?qū)嵸|(zhì)四個方面研究多尺度關(guān)聯(lián)規(guī)則挖掘理論體系。首先,基于層次理論提出廣義的尺度定義,利用數(shù)據(jù)的四種尺度類型對一般數(shù)據(jù)進行多尺度處理,構(gòu)建多尺度數(shù)據(jù)集。在此基礎上提出尺度劃分以及多尺度數(shù)據(jù)集之間的父子、祖孫關(guān)系的定義。其次,從定義、原因和分類三個方面分析多尺度關(guān)聯(lián)規(guī)則尺度轉(zhuǎn)換;最后,提出多尺度關(guān)聯(lián)規(guī)則的定義和挖掘

5、的實質(zhì),為后續(xù)研究工作提供理論基礎和實現(xiàn)方向。
  2)提出基于相似度的頻繁項集處理方法
  引入包含度及相似度概念。基于包含度給出相似度的計算方法,結(jié)合加權(quán)平均的思想,提出基于相似度的頻繁項集處理方法。該方法在一定程度上防止尺度轉(zhuǎn)換過程頻繁項集的丟失,提高尺度轉(zhuǎn)換結(jié)果的精度。
  3)提出多尺度關(guān)聯(lián)規(guī)則挖掘算法
  以多尺度關(guān)聯(lián)規(guī)則挖掘理論體系為理論基礎,以尺度轉(zhuǎn)換為核心,基于高斯金字塔法提出多尺度關(guān)聯(lián)規(guī)則尺度

6、上推算法MSARSUA(Multi-Scale Association Rules ScalingUp Algorithm),基于三次卷積法提出多尺度關(guān)聯(lián)規(guī)則尺度下推算法MSARSDA(Multi-Scale Association Rules Scaling Down Algorithm)。算法實現(xiàn)了關(guān)聯(lián)規(guī)則挖掘知識的多尺度化,相對于傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘方法,其在準確率和執(zhí)行效率等方面具有明顯的優(yōu)勢。
  4)驗證分析多尺度關(guān)聯(lián)規(guī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論