2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、近年來,數(shù)據挖掘技術引起了信息技術領域的極大關注,這是因為數(shù)據收集和數(shù)據存儲技術的快速進步使得各組織機構積累了海量數(shù)據,這些數(shù)據可以被轉換成有用的信息知識進行廣泛使用。轉換后得到的的信息知識可以被應用到市場分析,商場統(tǒng)籌,工程規(guī)劃和科學探索等。數(shù)據挖掘是在大型數(shù)據存儲庫中,自動的發(fā)現(xiàn)有用信息的過程。它是一種將傳統(tǒng)的數(shù)據分析方法與處理大量數(shù)據的復雜算法相結合的技術。關聯(lián)規(guī)則技術作為數(shù)據挖掘技術的一個重要部分,在數(shù)據挖掘技術發(fā)展繁榮的情況下

2、也得到了蓬勃發(fā)展,并向著更加廣泛和深入的方向繼續(xù)發(fā)展。關聯(lián)規(guī)則挖掘的目的是為了從大量數(shù)據中發(fā)現(xiàn)項與項之間的直接有趣的關聯(lián)和相關關系。關聯(lián)規(guī)則無論從理論研究還是現(xiàn)實應用方面都有很寬廣的發(fā)展前景,從狹義購物籃分析到網站的設計及其優(yōu)化,甚至擴展到交通事故模式的分析或者是藥物成分的關聯(lián)分析等方面,它的理論研究為很多數(shù)據類型的挖掘提供了可行性,比方說從頻繁模式的挖掘到閉合模式挖掘,從主觀興趣度到其它相關模式的挖掘。因而,對關聯(lián)規(guī)則相關技術進行深入

3、的研究是非常必要的。近年來,由于能夠發(fā)現(xiàn)數(shù)據間的相關關系,并且發(fā)現(xiàn)的規(guī)則結構簡單、易于理解,因此,關聯(lián)規(guī)則成為數(shù)據挖掘領域的熱點課題之一。本文對關聯(lián)規(guī)則技術的優(yōu)缺點進行了分析,并針對其不足之處進行了相應的改進。主要研究工作包括以下幾個方面。
  (1)本文對經典的Apriori以及不產生候選集的FP-Growth算法進行了分析和研究:用Apriori算法挖掘頻繁項集,計算量很大,需要多次遍歷數(shù)據庫,增加了CPU開銷。FP-Grow

4、th算法雖然比Apriori算法在性能上有很大提高,它僅需要掃描兩次數(shù)據庫,并且避免了產生大量的候選項集。但FP-Growth算法主要的缺陷就是空間開銷大。為解決此問題,本文引入了概念格,說明了用概念格的哈斯圖進行頻繁項集的挖掘在結果相似的基礎上比Apriori算法更加簡捷直觀。
  (2)由于支持度-置信度框架下的關聯(lián)規(guī)則存在一定的缺陷,于是,本文引入了興趣度度量。首先,對現(xiàn)有的幾種關聯(lián)規(guī)則興趣度進行深入研究和分析,指出這些興趣

5、度度量方法各自存在的局限,提出了一個基于興趣度的關聯(lián)規(guī)則度量方法的改進,證明了該度量方法的一些性質,并對該方法與傳統(tǒng)方法進行了比較,指出了改進方法可以同時表示正負關聯(lián)規(guī)則的判別,又對都不購買的變量不敏感,實證了新方法的特征屬性。該方法較之原有方法有一定的優(yōu)勢。
  (3)由于在解決前后項集對稱型問題時,普通關聯(lián)規(guī)則存在著不足之處,因此,通過提出項項正相關關聯(lián)規(guī)則挖掘改進了這種不足。同時提出了一種挖掘算法:ItemCoMineAP算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論