版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、生活中存在著各種各樣的高維數(shù)據(jù),高維數(shù)據(jù)不僅讓人難以理解,而且現(xiàn)有的數(shù)據(jù)挖掘算法處理起來也很困難,因此需要降維技術(shù)把高維數(shù)據(jù)降到低維子空間中,使得計算機容易處理。同時,高維數(shù)據(jù)特征間存在冗余和相關(guān)性,降維技術(shù)可以消除高維數(shù)據(jù)特征間的冗余和找到它們之間的相關(guān)性,使得子空間的特征更具代表性。
本文對現(xiàn)有降維算法進(jìn)行了歸類,主要回顧了兩類算法:一類是保持全局結(jié)構(gòu)的降維算法,包括主成分分析、線性判別分析、自適應(yīng)降維算法等;另一類是保持
2、局部結(jié)構(gòu)的降維算法,包括局部保持投影、局部線性嵌入、拉普拉斯映射等。在此基礎(chǔ)上,本文對數(shù)據(jù)挖掘中數(shù)據(jù)降維問題進(jìn)行了研究,主要工作包括:
(1)深入分析了基于K均值和判別分析的自適應(yīng)降維算法,發(fā)現(xiàn)該算法只考慮了全局結(jié)構(gòu)信息,但是忽視了局部結(jié)構(gòu)信息。為了克服上述缺點,提出了一種同時保持全局和局部聚類結(jié)構(gòu)的降維算法,該算法是適合于簇狀分布的無監(jiān)督線性降維算法。具體來說,該算法首先使用K均值得到原空間的聚類標(biāo)號,其次構(gòu)造出適合于簇狀分
3、布能保持聚類結(jié)構(gòu)特點的降維目標(biāo)函數(shù),然后求解該目標(biāo)函數(shù),利用求得的降維矩陣將高維數(shù)據(jù)映射到低維子空間,重復(fù)執(zhí)行上述步驟直到聚類標(biāo)號不再發(fā)生變化為止。在人工數(shù)據(jù)集、UCI數(shù)據(jù)集和AR人臉數(shù)據(jù)集上的實驗結(jié)果表明了本算法的有效性。
(2)針對現(xiàn)有降維算法無法保持原空間中的多流形聚類結(jié)構(gòu),提出了一種適合于流形結(jié)構(gòu)分布的降維算法。該算法先采用基于排序的流形聚類算法得到聚類標(biāo)號,再計算流形間離散性、流形內(nèi)緊湊性和流形局部的聚類相似性,構(gòu)造
4、出保持流形間離散、流形內(nèi)緊湊、局部近鄰的降維目標(biāo)函數(shù),將高維數(shù)據(jù)投影到低維子空間,然后在子空間再迭代執(zhí)行上述步驟直到聚類標(biāo)號不再發(fā)生變化為止。在UCI數(shù)據(jù)集、Coil數(shù)據(jù)集和Digit數(shù)據(jù)集上的實驗結(jié)果表明,該算法可在低維空間產(chǎn)生能反映多流形分布的降維投影,從而有效將流形的結(jié)構(gòu)特點保持到低維子空間。
(3)為了方便降維算法的應(yīng)用,利用Matlab和Java混合編程設(shè)計了一個降維方法工具箱。該工具箱提供了多個降維算法,如主成分分
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高維數(shù)據(jù)的降維及聚類方法研究.pdf
- 半監(jiān)督的聚類和降維研究及應(yīng)用.pdf
- 噪聲魯棒的自適應(yīng)降維聚類.pdf
- 高維數(shù)據(jù)流快速降維聚類算法研究.pdf
- 基于成對約束的聚類和降維算法研究.pdf
- 自適應(yīng)判別降維模糊聚類算法研究.pdf
- 基于模糊Fisher準(zhǔn)則的聚類與特征降維研究.pdf
- 基于免疫遺傳算法的聚類與特征降維研究.pdf
- 基于重構(gòu)信息保持的降維算法研究.pdf
- 商業(yè)數(shù)據(jù)流降維方法及其聚類算法研究.pdf
- 降維多核K-Means算法在文本聚類中的研究.pdf
- 基于局部信息保持的特征降維方法研究.pdf
- 基于特征降維與模糊聚類的自適應(yīng)點云壓縮研究.pdf
- 基于維層次聚類的OLAP存儲結(jié)構(gòu)的研究.pdf
- 板帶材表面缺陷組合特征的降維聚類識別算法研究.pdf
- CRM中基于聚類的客戶細(xì)分、獲取及保持研究.pdf
- 基于非線性降維的合成生物元件可視化及其聚類研究.pdf
- 基于稀疏表示的近鄰保持嵌入數(shù)據(jù)降維研究.pdf
- 高維分類數(shù)據(jù)聚類方法研究與實現(xiàn)
- 基于聚類的Java包重構(gòu)技術(shù)研究及實現(xiàn).pdf
評論
0/150
提交評論