版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)描述是一類特殊的數(shù)據(jù)挖掘任務(wù):根據(jù)用戶需求,將定義在符號(hào)域上的信息系統(tǒng)(數(shù)據(jù)集合)約簡(jiǎn)為人可閱讀的具有不同簡(jiǎn)潔程度的文本,同時(shí),對(duì)約簡(jiǎn)過(guò)程中產(chǎn)生的例外進(jìn)行分析.這個(gè)任務(wù)與認(rèn)知心理學(xué)的"規(guī)則+例外"原理一致,它有三個(gè)要點(diǎn):(1)根據(jù)用戶需求獲得解答;(2)不同簡(jiǎn)潔程度的文本;(3)例外分析.該文使用粗糙集理論中的reduct理論作為工具,形式化的闡述數(shù)據(jù)描述任務(wù),并解決相應(yīng)的計(jì)算問(wèn)題.直接使用正區(qū)域與邊緣區(qū)域描述規(guī)則與例外不符合人的認(rèn)
2、知,為了準(zhǔn)確刻畫"規(guī)則+例外"模型,該文將其修改為認(rèn)知正區(qū)域與認(rèn)知邊緣區(qū)域.由于正區(qū)域是reduct理論的基礎(chǔ),并且對(duì)給定信息系統(tǒng)唯一,而認(rèn)知正區(qū)域不滿足唯一性條件,因此,我們重新定義與證明了基于正區(qū)域定義的所有概念與性質(zhì).用戶通常希望給定需求下描述盡量簡(jiǎn)潔,我們用基于認(rèn)知正區(qū)域的reduct定義文本粒子,作為數(shù)據(jù)集合的簡(jiǎn)潔描述.傳統(tǒng)粗糙集理論的研究一般不關(guān)心邊緣區(qū)域的結(jié)構(gòu),而"例外"與邊緣區(qū)域密切相關(guān).因此,我們?cè)敿?xì)的研究了邊緣區(qū)域的
3、結(jié)構(gòu)與性質(zhì),以了解"例外"空間的結(jié)構(gòu),為例外分析奠定基礎(chǔ).為了有效鑒別例外,我們?cè)O(shè)計(jì)了一種特殊的差別矩陣來(lái)分析邊緣區(qū)域的結(jié)構(gòu)和例外的形成過(guò)程,并提出基于core屬性的例外鑒別方法.Core與reduct是Reduct理論中的兩個(gè)基本概念.Core有一個(gè)重要性質(zhì):如果一個(gè)屬性是core屬性,從信息系統(tǒng)中刪除這個(gè)屬性,必然導(dǎo)致邊緣區(qū)域的改變.這個(gè)性質(zhì)是計(jì)算例外的基礎(chǔ).此外,reduct與core之間存在一種特殊的關(guān)系:基于給定信息系統(tǒng)的re
4、duct構(gòu)成的新信息系統(tǒng),其中所有屬性均為core屬性.這暗示著,如果我們能夠計(jì)算出信息系統(tǒng)的reduct,那么從這個(gè)reduct中逐步刪除屬性,即可生成不同簡(jiǎn)潔程度的文本與派生例外.對(duì)大規(guī)模數(shù)據(jù)構(gòu)成的信息系統(tǒng),使用該方法進(jìn)行數(shù)據(jù)描述的先決條件是尋找快速的可以根據(jù)需求計(jì)算reduct的算法.該文在分析前人算法的基礎(chǔ)上,發(fā)現(xiàn)計(jì)算reduct空間的中間表示是影響算法效率的關(guān)鍵,為此,提出了一種樣本個(gè)數(shù)呈線性的計(jì)算reduct的樹表示算法,并
5、且,在這種表示下,計(jì)算reduct理論的其他概念同樣有效.我們證明,這個(gè)算法對(duì)reduct完備,且與基于屬性序reduct算法等價(jià).該論文的主要成果是:1.基于樹表示的reduct、core等基本概念的快速計(jì)算方法,其復(fù)雜性與樣本個(gè)數(shù)呈線性關(guān)系.2.提出"認(rèn)知正區(qū)域"與"認(rèn)知邊緣區(qū)域"以刻畫"規(guī)則+例外"模型,并證明了其性質(zhì).3.對(duì)邊緣區(qū)域進(jìn)行了詳細(xì)分析,證明其性質(zhì),并設(shè)計(jì)一種特殊的差別矩陣分析邊緣區(qū)域的結(jié)構(gòu)和例外產(chǎn)生的原因.4.提出基
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于信息理論學(xué)習(xí)的支持向量數(shù)據(jù)描述集成.pdf
- 基于不平衡數(shù)據(jù)分布的支持向量數(shù)據(jù)描述.pdf
- 基于支持向量數(shù)據(jù)描述的MEWMA控制圖.pdf
- 基于支持向量數(shù)據(jù)描述的分類算法研究.pdf
- 基于XML數(shù)據(jù)模式的構(gòu)架描述語(yǔ)言.pdf
- 浙江經(jīng)濟(jì)增長(zhǎng)的理論描述與實(shí)證研究:基于1978~2004年數(shù)據(jù)的考察.pdf
- 基于描述邏輯ALCO@的運(yùn)作理論的研究.pdf
- 基于元數(shù)據(jù)大綱的信息檢索服務(wù)描述研究.pdf
- 基于相對(duì)密度的支持向量數(shù)據(jù)描述算法研究.pdf
- 基于支持向量數(shù)據(jù)描述的說(shuō)話人識(shí)別研究.pdf
- 基于圖理論的圖像描述與匹配算法研究.pdf
- 基于STEP標(biāo)準(zhǔn)的船舶設(shè)計(jì)數(shù)據(jù)描述.pdf
- 基于支持向量數(shù)據(jù)描述的屬性約簡(jiǎn)算法研究.pdf
- 基于支持向量數(shù)據(jù)描述的分類識(shí)別算法研究.pdf
- 基于支持向量數(shù)據(jù)描述的累積和控制圖.pdf
- 基于支持向量數(shù)據(jù)描述的在線簽名認(rèn)證研究.pdf
- 基于XML的漁業(yè)資源異構(gòu)數(shù)據(jù)集成與元數(shù)據(jù)描述研究.pdf
- 定性數(shù)據(jù)的統(tǒng)計(jì)描述
- 基于圖理論的圖像描述與檢索方法研究.pdf
- 基于支持向量數(shù)據(jù)描述的故障診斷方法研究.pdf
評(píng)論
0/150
提交評(píng)論