版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、近些年來,最近鄰居的概念與對應(yīng)的鄰居搜索算法在數(shù)據(jù)挖掘、圖像處理以及模式識別等多個領(lǐng)域中有著廣泛的應(yīng)用基礎(chǔ)并取得了許多令人滿意的結(jié)果。最近鄰居概念中近鄰關(guān)系的定義是最近鄰居思想的根本基礎(chǔ),對該思想的各種方法起著決定性的作用。在眾多的近鄰關(guān)系中,最為廣泛應(yīng)用的無疑是 k-最近鄰居(KNN:k-Nearest Neighbor)和逆k最近鄰居(RkNN:Reverse k-Nearest Neighbor)。然而,無論是KNN還是RkNN,
2、最近鄰居的概念中始終縈繞著一個懸而未決的問題——如何選擇合適的鄰域大小。鄰域參數(shù)的最優(yōu)選擇并不固定,其取值通常依賴數(shù)據(jù)集自身的分布情況。比如在對數(shù)據(jù)集進行分類操作時,較大的鄰域參數(shù)能夠減少噪聲點對分類結(jié)果的影響,但同時會模糊不同類之間的差異性。特別是當數(shù)據(jù)集呈現(xiàn)流形分布時,過大的鄰域參數(shù)會造成短路的現(xiàn)象,對流形產(chǎn)生破壞。而與之相反,過小的鄰域參數(shù)會削弱數(shù)據(jù)間的鄰居關(guān)系,極端情況下則會將屬于同一個類的數(shù)據(jù)點分割到多個不同的區(qū)域中。
3、 因此,在當前基于最近鄰居思想的算法中,鄰域選擇問題成為了制約算法效率的重要部分。為了從根本上解決這個問題,本文提出了自然鄰居思想及其應(yīng)用。首先,論文提出了自然鄰居思想的基本概念。自然鄰居思想擺脫了鄰域參數(shù)選擇的難題,在自然鄰居的查找過程中自適應(yīng)的完成鄰居關(guān)系的構(gòu)建,同時獲得具有數(shù)據(jù)集特征信息的自然鄰居特征值和自然鄰居鄰域圖。
自然鄰居思想的主要特點為:
1)自然鄰居思想能根據(jù)不同數(shù)據(jù)集的局部特征創(chuàng)建對應(yīng)的自然鄰居
4、鄰域圖,其能夠直觀準確地呈現(xiàn)數(shù)據(jù)分布規(guī)律,特別是流形數(shù)據(jù)和噪聲數(shù)據(jù)。
2)自然鄰居思想能夠?qū)Σ煌瑪?shù)據(jù)集自適應(yīng)得到自然鄰居特征值,而自然鄰居特征值能夠動態(tài)的反映不同數(shù)據(jù)集的分布狀態(tài)。
3)自然鄰居思想中每個數(shù)據(jù)點的鄰居數(shù)量是可變的,鄰居的多少反映了數(shù)據(jù)點與數(shù)據(jù)集的真實關(guān)系。
在自然鄰居思想的概念之上,論文提出了自然鄰居思想對傳統(tǒng)算法中鄰域參數(shù)選擇問題的解決辦法。自然鄰居思想中的自然鄰居特征值反映了數(shù)據(jù)集的分布
5、情況,因此其可以作為傳統(tǒng)最近鄰居思想中的鄰域參數(shù)k?;谠撍悸罚撐奶岢隽俗匀秽従犹卣髦档目焖儆嬎闼惴?,高效地計算自然鄰居特征值,進而將其作為鄰域參數(shù)應(yīng)用于離群檢測、聚類分析等領(lǐng)域的多個算法中,并且取得了令人滿意的實驗結(jié)果。
除了自然鄰居特征值之外,反映自然鄰居關(guān)系的自然鄰居鄰域圖也具有極強的研究價值。論文在最后提出了一種基于加權(quán)自然鄰居鄰域圖的數(shù)據(jù)挖掘算法,將自然鄰居查找過程中的查找深度作為自然鄰居鄰域圖中邊的權(quán)值構(gòu)造加權(quán)自
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 淺析數(shù)據(jù)挖掘概念及技術(shù)
- 形式概念分析理論的研究及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 概念格在數(shù)據(jù)挖掘中的應(yīng)用研究.pdf
- 粗糙集理論在數(shù)據(jù)挖掘領(lǐng)域中的應(yīng)用.pdf
- 稀疏學(xué)習及其在數(shù)據(jù)挖掘的應(yīng)用.pdf
- 量子算法及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 遺傳優(yōu)化算法及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 在數(shù)據(jù)挖掘中概念格的理論研究.pdf
- 中介粗集及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 蟻群算法及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 河流自然生命的概念及其意義.pdf
- Rough Set理論及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 螞蟻算法及其在數(shù)據(jù)挖掘中的應(yīng)用研究.pdf
- 神經(jīng)網(wǎng)絡(luò)方法及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- Rough集理論及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 數(shù)據(jù)挖掘技術(shù)及其在證券領(lǐng)域的應(yīng)用.pdf
- 聚類分析在數(shù)據(jù)挖掘中的應(yīng)用.pdf
- 相關(guān)向量機及其在數(shù)據(jù)挖掘中的應(yīng)用研究.pdf
- 粗糙集及其在數(shù)據(jù)挖掘中的應(yīng)用研究.pdf
- 低秩稀疏屬性約簡及其在數(shù)據(jù)挖掘中的應(yīng)用.pdf
評論
0/150
提交評論