版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、聚類分析是一種數(shù)據(jù)縮減技術(shù),即基于數(shù)據(jù)特征的相似性將數(shù)據(jù)聚集成不同的類,是數(shù)據(jù)挖掘中一種非常有效的工具,得到了人們廣泛的關(guān)注。本論文主要從聚類算法中的相似性度量和初始化敏感問題入手,采用新的基于流形距離的相似性度量替代傳統(tǒng)的基于歐氏距離的相似性度量,通過全局的方法選擇初始聚類中心,提出兩種方案解決引入流形距離帶來的計算量增大問題,并將這兩種聚類算法應(yīng)用到聚類分析和圖像分割當(dāng)中。本文取得的主要成果如下:
在本文中,我們提出了
2、一種流形聚類算法,稱為基于流形距離的全局原型聚類算法(Global Prototypical Clustering Algorithm based-on Manifold Distance,GPMC)。在新算法中,聚類中心選自數(shù)據(jù)集本身,在選擇每個聚類的聚類中心時,依據(jù)一種新的基于流形距離的相似性度量,該度量計算的是數(shù)據(jù)點間沿著流形的測地線距離。在確定初始聚類中心時,GPMC從優(yōu)化的角度出發(fā),使用全局的方法進行選擇。對于部分人工數(shù)據(jù)集和
3、UCI數(shù)據(jù)集的實驗表明,從聚類性能和魯棒性的角度來看,新算法在處理復(fù)雜、非凸的數(shù)據(jù)聚類問題時有效可行。
在第三章中,本文提出了一種用于復(fù)雜分布數(shù)據(jù)的二階段聚類算法(Two-PhaseClustering,TPC),TPC包含兩個階段:首先,將數(shù)據(jù)劃分為若干個球形分布的子類,每一子類用其聚類中心代表該類內(nèi)的所有數(shù)據(jù)點;然后,利用可以處理復(fù)雜分布數(shù)據(jù)的流形進化聚類算法(Manifold Evolutionary Cluster
4、ing Algorithm,MEC)對第一階段得到的聚類中心進行類別劃分;最后,綜合兩次聚類結(jié)果整理得到最終聚類結(jié)果。該算法基于改進的K均值算法和MEC算法。在進化聚類算法的基礎(chǔ)上加入了流形距離,使算法能勝任復(fù)雜數(shù)據(jù)聚類。同時,新算法降低了引入流形距離所帶來的計算量。我們在部分人工數(shù)據(jù)集和UCI數(shù)據(jù)集上測試了二階段聚類算法,實驗結(jié)果可以說明,無論對于簡單或復(fù)雜、凸或非凸的數(shù)據(jù),TPC都表現(xiàn)出良好的聚類性能。
在第四章中,我
5、們以基于流形距離的全局原型聚類算法為基礎(chǔ),結(jié)合形態(tài)學(xué)方法,提出一種用于圖像分割的新方法,稱為基于分水嶺與流形距離的全局原型聚類圖像分割算法(Global Prototypical Clustering Image Segmentation Algorithmbased-on Watershed and Manifold Distance,WGPMC)。新算法首先使用分水嶺算法的改進算法——內(nèi)外標(biāo)記的分水嶺算法,對圖像進行粗分割,將圖像分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于流形距離核的譜聚類算法研究及其應(yīng)用.pdf
- 基于流形距離和核函數(shù)的進化聚類算法研究及其應(yīng)用.pdf
- 基于流形距離和蜂群的聚類算法研究.pdf
- 流形聚類的算法研究及其應(yīng)用.pdf
- 基于點對稱距離的聚類算法及其應(yīng)用.pdf
- 基于流形的密度峰值聚類算法研究.pdf
- 基于語義距離的文本聚類算法研究.pdf
- 基于劃分聚類算法的研究及其應(yīng)用.pdf
- 基于密度調(diào)整和流形距離的近鄰傳播算法及其應(yīng)用研究.pdf
- 基于距離的邊緣拋棄聚類算法及其在入侵檢測中的應(yīng)用
- 基于距離的邊緣拋棄聚類算法及其在入侵檢測中的應(yīng)用.pdf
- 基于類內(nèi)類間距離的模糊聚類算法及圖像分割應(yīng)用.pdf
- 基于數(shù)據(jù)挖掘聚類算法的研究及其應(yīng)用.pdf
- 基于粒子群算法的聚類算法及其應(yīng)用研究.pdf
- 基于Memetic算法的聚類方法及其應(yīng)用.pdf
- 基于譜聚類的混合流形學(xué)習(xí)算法研究.pdf
- 演化聚類算法研究及其應(yīng)用.pdf
- 基于模糊聚類的大規(guī)模數(shù)據(jù)聚類算法及其應(yīng)用研究.pdf
- 基于聚類的高效包分類算法研究及其應(yīng)用.pdf
- 基于網(wǎng)格的密度峰值聚類算法研究及其應(yīng)用.pdf
評論
0/150
提交評論