基于仿射傳播聚類的數(shù)據(jù)挖掘算法研究.pdf_第1頁
已閱讀1頁,還剩54頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、隨著科學(xué)技術(shù)的迅速發(fā)展和網(wǎng)絡(luò)技術(shù)的普及,人類社會(huì)已經(jīng)進(jìn)入到大數(shù)據(jù)時(shí)代。在很多領(lǐng)域中人們需要從海量數(shù)據(jù)中得到有用的知識(shí)和信息,因此產(chǎn)生了數(shù)據(jù)挖掘的概念,仿射傳播聚類算法作為一種重要的數(shù)據(jù)挖掘算法,以相似度矩陣作為輸入,構(gòu)造吸引度矩陣和歸屬度矩陣,數(shù)據(jù)點(diǎn)之間通過吸引度和歸屬度交換有真實(shí)價(jià)值的消息,直到一個(gè)最優(yōu)的類代表點(diǎn)集合和聚類逐漸形成。仿射傳播聚類算法具有不用指定初始聚類中心及聚類的個(gè)數(shù)不需要設(shè)定等優(yōu)點(diǎn),但對結(jié)構(gòu)復(fù)雜和維數(shù)較高的數(shù)據(jù)集存在

2、聚類結(jié)果比較差、精度低、且聚類個(gè)數(shù)易受到偏向參數(shù)的影響。本文主要圍繞仿射傳播聚類算法的不足,從以下幾個(gè)方面展開分析與研究:
  1.針對仿射傳播聚類算法處理結(jié)構(gòu)復(fù)雜數(shù)據(jù)集時(shí)存在聚類效果差、精度低等問題,提出了一種基于核函數(shù)的半監(jiān)督仿射傳播聚類算法,該算法首先利用核函數(shù)將結(jié)構(gòu)復(fù)雜的輸入數(shù)據(jù)集映射到特征空間,改變相似性度量,且映射后的數(shù)據(jù)集呈現(xiàn)線性特征;然后計(jì)算映射到特征空間數(shù)據(jù)的相似度矩陣,通過半監(jiān)督學(xué)習(xí)進(jìn)行調(diào)整,使屬于同簇內(nèi)的數(shù)據(jù)

3、更容易成為近鄰;最后將得到的相似度矩陣作為仿射傳播聚類算法的輸入,迭代更新得到全局最優(yōu)。仿真結(jié)果比對,可以看出改進(jìn)后的算法處理結(jié)構(gòu)復(fù)雜數(shù)據(jù)集時(shí)聚類效果更好、精度更高。
  2.針對運(yùn)用半監(jiān)督仿射傳播聚類算法處理高維數(shù)據(jù)時(shí)存在聚類精度低和計(jì)算量大的問題,提出一種基于局部線性嵌入的半監(jiān)督仿射傳播聚類算法,該算法首先通過局部線性嵌入算法將輸入的高維數(shù)據(jù)集映射到低維空間得到低維數(shù)據(jù)集,且映射后的數(shù)據(jù)集呈現(xiàn)線性特征,計(jì)算低維數(shù)據(jù)集的相似度矩

4、陣,再用半監(jiān)督算法調(diào)整相似度矩陣,最后用仿射傳播聚類算法對低維數(shù)據(jù)進(jìn)行聚類分析。仿真結(jié)果表明改進(jìn)后的算法在處理高維數(shù)據(jù)時(shí)聚類效果更好、精度更高、迭代次數(shù)更少。
  3.由于仿射傳播聚類算法中偏向參數(shù)對聚類精度和聚類個(gè)數(shù)有著直接的影響,但其偏向參數(shù)通常都是經(jīng)驗(yàn)取值,很可能導(dǎo)致得不到最優(yōu)的聚類結(jié)果,針對這一問題提出了基于差分進(jìn)化的仿射傳播聚類算法,該算法首先進(jìn)行仿射傳播聚類分析,其偏向參數(shù)取經(jīng)驗(yàn)值;然后根據(jù)得到的聚類結(jié)果判斷偏向參數(shù)是

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論