版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、數(shù)據(jù)挖掘管理系統(tǒng)規(guī)范說明,現(xiàn)狀簡介強(qiáng)度挖掘(Intension Mining)I-MIN過程模型(Process Model)I-MIN系統(tǒng)的功能組件(Functional Components)強(qiáng)度挖掘算子(Operators) I-MIN系統(tǒng)的三層體系結(jié)構(gòu)(Architecture)小結(jié),現(xiàn)狀簡介,傳統(tǒng)的KDD過程模型(CRISP-DM模型),Business Understanding,Data Understandi
2、ng,Data Preparation,Data Exploration,Data Mining,Evaluation,Deployment,,,,,,,現(xiàn)狀簡介,當(dāng)前的數(shù)據(jù)挖掘系統(tǒng)和數(shù)據(jù)挖掘工具包要求使用者必須是數(shù)據(jù)挖掘?qū)<曳菍I(yè)用戶需要與數(shù)據(jù)挖掘?qū)<颐芮信浜喜拍鼙WC獲得理想的數(shù)據(jù)挖掘結(jié)果用戶使用極為不方便,強(qiáng)度挖掘(Intension Mining),挖掘目標(biāo)以知識發(fā)現(xiàn)模式(Knowledge Discovery Schema)
3、的形式存儲強(qiáng)度挖掘模式包含了一般挖掘需求(Generic mining requirements)的規(guī)格說明強(qiáng)度挖掘是基于增量式挖掘概念的,增量數(shù)據(jù)庫按固定的時間間隔進(jìn)行自動處理處理過程由數(shù)據(jù)預(yù)挖掘組成,主要包括初步分析和聚集(Aggregation)強(qiáng)度挖掘主要由計劃階段(Planning phase),累積階段(Accumulation phase)和挖掘階段(Mining phase)三個階段組成,強(qiáng)度挖掘(Intensi
4、on Mining),計劃階段知識發(fā)現(xiàn)模式(Knowledge Discovery Schema, KDS)的創(chuàng)建編譯知識發(fā)現(xiàn)模式得到對應(yīng)的元數(shù)據(jù)和數(shù)據(jù)結(jié)構(gòu),強(qiáng)度挖掘(Intension Mining),累積階段通過元數(shù)據(jù)對增量數(shù)據(jù)庫進(jìn)行預(yù)挖掘,得到濃縮知識(Knowledge Concentrate, KC)濃縮知識作為最終知識的中間表示形式,以濃縮知識窗口的形式為進(jìn)一步的數(shù)據(jù)挖掘服務(wù),強(qiáng)度挖掘(Intension Minin
5、g),挖掘階段用戶提交數(shù)據(jù)挖掘查詢或執(zhí)行數(shù)據(jù)挖掘應(yīng)用程序挖掘算法對濃縮知識進(jìn)行處理,得到用戶最終所需的知識,強(qiáng)度挖掘(Intension Mining),重要特征將KDD看作一個連續(xù)的過程,以固定的時間間隔對增量數(shù)據(jù)庫進(jìn)行周期性累積產(chǎn)生濃縮知識濃縮知識窗口是知識更新和知識共享的基礎(chǔ),I-MIN過程模型(Process Model),I-MIN模型基于強(qiáng)度挖掘概念的以用戶為中心的KDD過程模型支持對KDD過程的交互式探索和試驗
6、向下兼容傳統(tǒng)的KDD過程模型處理步驟分別標(biāo)記為IM1, IM2, ……, IM6,I-MIN過程模型(Process Model),I-MIN過程模型(Process Model),IM1對應(yīng)于強(qiáng)度挖掘中的計劃階段確定挖掘目標(biāo)以知識發(fā)現(xiàn)模式的形式表示挖掘目標(biāo)編譯知識發(fā)現(xiàn)模式得到元數(shù)據(jù),I-MIN過程模型(Process Model),IM2對應(yīng)于積累階段是一個復(fù)合過程IM2a, IM2b, IM2c分別對應(yīng)于傳統(tǒng)KDD
7、過程的數(shù)據(jù)選擇、數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換IM2d負(fù)責(zé)對預(yù)挖掘數(shù)據(jù)進(jìn)行分析和聚集不需人工干預(yù)而以固定的時間間隔自動執(zhí)行輸出濃縮知識(KC),I-MIN過程模型(Process Model),IM3標(biāo)志著挖掘階段的開始用戶提交挖掘查詢或自己開發(fā)的應(yīng)用程序在IM2中得到的濃縮知識在本步驟可以共享,I-MIN過程模型(Process Model),IM4真正的數(shù)據(jù)挖掘步驟知識發(fā)現(xiàn)模式中指定的數(shù)據(jù)挖掘算法被激活用戶期望的知識是從濃縮知
8、識中挖掘出來,I-MIN過程模型(Process Model),IM5對應(yīng)于知識表示IM6對應(yīng)于知識解釋/實施,I-MIN系統(tǒng)的功能組件,實現(xiàn)I-MIN模型需要為累積、挖掘、試驗和跟蹤開發(fā)相應(yīng)的組件不同類型的知識對應(yīng)的組件是不同的每個組件實現(xiàn)I-MIN模型的一個步驟或一個功能,I-MIN系統(tǒng)的功能組件,I-MIN系統(tǒng)的功能組件,實現(xiàn)I-MIN模型需要5種組件: K為使用算法A發(fā)現(xiàn)的知識類型?TM為合并算子,用于指定數(shù)據(jù)庫子集
9、FaccTM為累積組件FminTM為挖掘組件FexpTM為試驗組件FmonTM為跟蹤組件,I-MIN系統(tǒng)的功能組件,累積組件對數(shù)據(jù)進(jìn)行初步分析和局部聚集,實現(xiàn)IM2d由系統(tǒng)自動激活為增量數(shù)據(jù)庫構(gòu)建濃縮知識窗口對最終用戶而言是透明的,I-MIN系統(tǒng)的功能組件,合并組件用戶可以動態(tài)指定挖掘的數(shù)據(jù)目標(biāo)子集通過指定需要的時間間隔來達(dá)到合并的目的固定周期內(nèi)的濃縮知識需要合并產(chǎn)生一個合并的大窗口,I-MIN系統(tǒng)的功能組件,挖掘
10、組件由實際的挖掘算法組成用戶提交挖掘查詢或應(yīng)用程序時激活一個算法根據(jù)參數(shù)的不同可能對應(yīng)多個功能,I-MIN系統(tǒng)的功能組件,試驗組件支持以用戶為中心的數(shù)據(jù)探索和試驗通過不同的常數(shù)、數(shù)據(jù)子集和參數(shù)進(jìn)行重復(fù)的試驗通過用戶應(yīng)用程序的方式設(shè)計新的試驗滿足特別的挖掘需求,I-MIN系統(tǒng)的功能組件,跟蹤組件比較不同窗口中發(fā)現(xiàn)的知識來達(dá)到對數(shù)據(jù)特征進(jìn)行審查的目的可以有效發(fā)現(xiàn)模式的變化過程,I-MIN系統(tǒng)的功能組件,最后兩個組件可以有效體
11、現(xiàn)以用戶為中心的本質(zhì)如果忽略?TM、Fexp,和Fmon,I-MIN模型就還原為傳統(tǒng)的KDD過程模型,強(qiáng)度挖掘算子(Operators),用戶通過算子以強(qiáng)度挖掘查詢語言或API的方式訪問功能組件對應(yīng)的功能算子可以分為:基本算子累積算子(用戶透明)合并算子(用戶透明)挖掘算子 二級算子探索和比較多個數(shù)據(jù)子集知識的存儲和檢索 關(guān)聯(lián)規(guī)則的基本算子和二級算子已經(jīng)開發(fā)出來,I-MIN系統(tǒng)的三層體系結(jié)構(gòu),對整個KDD過程進(jìn)行抽象
12、,并為知識管理提供有效的環(huán)境獨立于數(shù)據(jù)庫系統(tǒng)和相應(yīng)平臺,支持知識發(fā)現(xiàn),知識保存,知識更新和知識共享層次結(jié)構(gòu)包括前后端層、核心層和存儲模式層每層都有一個引擎,用于維護(hù)該層的數(shù)據(jù)庫,協(xié)調(diào)層內(nèi)不同組件之間的通信元數(shù)據(jù)隊在三層之間是共享的數(shù)據(jù)交換接口提供了訪問數(shù)據(jù)源的機(jī)制,I-MIN系統(tǒng)的三層體系結(jié)構(gòu),I-MIN系統(tǒng)的三層體系結(jié)構(gòu),知識抽象存儲模式層描述稠密知識單元如何通過數(shù)據(jù)結(jié)構(gòu)和文件進(jìn)行保存,對知識提供最低層次的抽象中間層的知
13、識發(fā)現(xiàn)模式將稠密知識單元抽象為濃縮知識或窗口使用濃縮知識的應(yīng)用程序?qū)χR提供最高層次的抽象修改濃縮知識的物理數(shù)據(jù)結(jié)構(gòu)而對映射關(guān)系和應(yīng)用程序沒有影響的能力稱為數(shù)據(jù)的物理獨立性,I-MIN系統(tǒng)的三層體系結(jié)構(gòu),KDD過程抽象預(yù)挖掘和聚集,存儲結(jié)構(gòu)和濃縮知識的映射關(guān)系等具體細(xì)節(jié)對最終用戶而言是看不見的用戶的KDD過程由知識發(fā)現(xiàn)模式定義的一般KDD過程得到對最終用戶而言,提交一條挖掘查詢或應(yīng)用程序就定義了用戶自己的KDD過程通過改變預(yù)
14、挖掘功能或挖掘算法修改KDD過程而不影響應(yīng)用程序的能力稱為數(shù)據(jù)的邏輯獨立性,I-MIN系統(tǒng)的三層體系結(jié)構(gòu),前后端層提供了I-MIN系統(tǒng)的用戶接口主要包括如下組件強(qiáng)度挖掘查詢處理器知識發(fā)現(xiàn)模式編譯器表示管理器組件管理器庫管理器數(shù)據(jù)接口交換管理器,I-MIN系統(tǒng)的三層體系結(jié)構(gòu),核心層數(shù)據(jù)挖掘引擎激活累積組件對用戶查詢和應(yīng)用程序進(jìn)行響應(yīng)與數(shù)據(jù)交換接口通信,從目標(biāo)數(shù)據(jù)庫中檢索所需數(shù)據(jù)功能模塊有五個功能組件組成預(yù)挖掘功
15、能庫用于數(shù)據(jù)選擇、數(shù)據(jù)清洗和數(shù)據(jù)轉(zhuǎn)換,I-MIN系統(tǒng)的三層體系結(jié)構(gòu),存儲模式層支持濃縮知識的存儲支持濃縮知識的合并和檢索為用戶應(yīng)用程序提供數(shù)據(jù)的物理獨立性,I-MIN系統(tǒng)的三層體系結(jié)構(gòu),元數(shù)據(jù)和數(shù)據(jù)交換接口元數(shù)據(jù)用于知識發(fā)現(xiàn)、知識重用和知識共享數(shù)據(jù)交換接口用于實現(xiàn)KDD過程相對于數(shù)據(jù)源的獨立性,小結(jié),提出了針對KDD過程的以用戶為中心的模型提出基于該模型的數(shù)據(jù)挖掘管理系統(tǒng)體系結(jié)構(gòu)系統(tǒng)提供的操作算子用于開發(fā)數(shù)據(jù)挖掘應(yīng)用程序
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 教務(wù)管理系統(tǒng)中的數(shù)據(jù)挖掘.pdf
- 基于數(shù)據(jù)挖掘的學(xué)生管理指導(dǎo)系統(tǒng).pdf
- 基于數(shù)據(jù)挖掘的船舶安全管理系統(tǒng).pdf
- 數(shù)據(jù)挖掘系統(tǒng)框架及其元數(shù)據(jù)管理的研究.pdf
- 挖掘作業(yè)管理規(guī)范(塔里木油田)
- 大數(shù)據(jù)與數(shù)據(jù)挖掘?qū)嶒炏到y(tǒng)
- 38337.氣象災(zāi)害數(shù)據(jù)挖掘及管理系統(tǒng)設(shè)計
- 煤炭貿(mào)易管理系統(tǒng)開發(fā)及其數(shù)據(jù)挖掘.pdf
- 數(shù)據(jù)挖掘與GIS集成實現(xiàn)空間數(shù)據(jù)挖掘系統(tǒng).pdf
- 數(shù)據(jù)安全管理規(guī)范
- 圖書館系統(tǒng)數(shù)據(jù)挖掘
- 基于數(shù)據(jù)倉庫和數(shù)據(jù)挖掘的客戶關(guān)系管理系統(tǒng).pdf
- 學(xué)籍管理系統(tǒng)數(shù)據(jù)庫說明
- 庫存管理數(shù)據(jù)挖掘系統(tǒng)分析與設(shè)計.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的企業(yè)銷售管理系統(tǒng)設(shè)計.pdf
- 基于數(shù)據(jù)挖掘的碼頭能量管理系統(tǒng)研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的客戶關(guān)系管理系統(tǒng).pdf
- 基于數(shù)據(jù)挖掘和案例推理的知識管理系統(tǒng).pdf
- 數(shù)據(jù)挖掘技術(shù)在教務(wù)管理系統(tǒng)中的應(yīng)用.pdf
- 應(yīng)用本體論構(gòu)建數(shù)據(jù)挖掘知識管理系統(tǒng).pdf
評論
0/150
提交評論