2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩66頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、聚類分析是一種數(shù)據(jù)縮減技術(shù),即基于數(shù)據(jù)特征的相似性將數(shù)據(jù)聚集成不同的類,是數(shù)據(jù)挖掘中一種非常有效的工具,得到了人們廣泛的關(guān)注。本論文主要從聚類算法中的相似性度量和初始化敏感問題入手,采用新的基于流形距離的相似性度量替代傳統(tǒng)的基于歐氏距離的相似性度量,通過全局的方法選擇初始聚類中心,提出兩種方案解決引入流形距離帶來的計算量增大問題,并將這兩種聚類算法應(yīng)用到聚類分析和圖像分割當(dāng)中。本文取得的主要成果如下:
   在本文中,我們提出了

2、一種流形聚類算法,稱為基于流形距離的全局原型聚類算法(Global Prototypical Clustering Algorithm based-on Manifold Distance,GPMC)。在新算法中,聚類中心選自數(shù)據(jù)集本身,在選擇每個聚類的聚類中心時,依據(jù)一種新的基于流形距離的相似性度量,該度量計算的是數(shù)據(jù)點間沿著流形的測地線距離。在確定初始聚類中心時,GPMC從優(yōu)化的角度出發(fā),使用全局的方法進行選擇。對于部分人工數(shù)據(jù)集和

3、UCI數(shù)據(jù)集的實驗表明,從聚類性能和魯棒性的角度來看,新算法在處理復(fù)雜、非凸的數(shù)據(jù)聚類問題時有效可行。
   在第三章中,本文提出了一種用于復(fù)雜分布數(shù)據(jù)的二階段聚類算法(Two-PhaseClustering,TPC),TPC包含兩個階段:首先,將數(shù)據(jù)劃分為若干個球形分布的子類,每一子類用其聚類中心代表該類內(nèi)的所有數(shù)據(jù)點;然后,利用可以處理復(fù)雜分布數(shù)據(jù)的流形進化聚類算法(Manifold Evolutionary Cluster

4、ing Algorithm,MEC)對第一階段得到的聚類中心進行類別劃分;最后,綜合兩次聚類結(jié)果整理得到最終聚類結(jié)果。該算法基于改進的K均值算法和MEC算法。在進化聚類算法的基礎(chǔ)上加入了流形距離,使算法能勝任復(fù)雜數(shù)據(jù)聚類。同時,新算法降低了引入流形距離所帶來的計算量。我們在部分人工數(shù)據(jù)集和UCI數(shù)據(jù)集上測試了二階段聚類算法,實驗結(jié)果可以說明,無論對于簡單或復(fù)雜、凸或非凸的數(shù)據(jù),TPC都表現(xiàn)出良好的聚類性能。
   在第四章中,我

5、們以基于流形距離的全局原型聚類算法為基礎(chǔ),結(jié)合形態(tài)學(xué)方法,提出一種用于圖像分割的新方法,稱為基于分水嶺與流形距離的全局原型聚類圖像分割算法(Global Prototypical Clustering Image Segmentation Algorithmbased-on Watershed and Manifold Distance,WGPMC)。新算法首先使用分水嶺算法的改進算法——內(nèi)外標(biāo)記的分水嶺算法,對圖像進行粗分割,將圖像分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論