版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、在實(shí)際應(yīng)用中,受環(huán)境和人為因素的影響,所得的實(shí)驗(yàn)數(shù)據(jù)往往存在數(shù)據(jù)缺失的現(xiàn)象,影響了在此基礎(chǔ)上進(jìn)行的數(shù)據(jù)分析及理解。目前,不完備數(shù)據(jù)的聚類分析已成為模式識(shí)別的研究熱點(diǎn)之一,但現(xiàn)有算法大多只適用于相關(guān)性較弱的數(shù)據(jù)集,在子類重疊嚴(yán)重且相關(guān)性較強(qiáng)的數(shù)據(jù)集上難以得到理想的聚類結(jié)果?;诖?,本文從數(shù)據(jù)相關(guān)性角度出發(fā),將一致性作為相似性度量引入聚類分析,提出了多種不完備數(shù)據(jù)聚類方法。
本研究主要內(nèi)容包括:⑴針對(duì)不完備數(shù)據(jù)集中子類邊緣數(shù)據(jù)更易
2、錯(cuò)分的問題,提出了基于一致性的邊緣數(shù)據(jù)重劃分方法。所提方法首先利用經(jīng)典不完備數(shù)據(jù)聚類方法獲得初始聚類結(jié)果,在此基礎(chǔ)上依據(jù)近鄰原則,提出了一種可能誤判的邊緣數(shù)據(jù)篩選方法,并以一致性為相似性度量對(duì)這些數(shù)據(jù)的類屬進(jìn)行修正。所提算法在對(duì)子類重疊嚴(yán)重區(qū)域即子類邊緣的數(shù)據(jù)進(jìn)行重修劃分時(shí),充分考慮了數(shù)據(jù)間的相關(guān)性,因此有利于將可能誤判的邊緣數(shù)據(jù)重新劃分到正確的子類中,進(jìn)而提高不完備數(shù)據(jù)集的聚類精度。實(shí)驗(yàn)結(jié)果表明,所提算法在子類重疊嚴(yán)重且相關(guān)性較強(qiáng)的人
3、工數(shù)據(jù)集和實(shí)際數(shù)據(jù)集上均能取得更優(yōu)的聚類效果。⑵基于偽相似性度量并考慮缺失屬性值的不確定性,提出了缺失屬性值的一致性偽近鄰區(qū)間描述,并在此基礎(chǔ)上實(shí)現(xiàn)對(duì)不完備數(shù)據(jù)集的聚類分析。方法通過一致性偽相似度尋找不完備樣本的近鄰,進(jìn)而利用近鄰樣本的相應(yīng)屬性值信息,獲得缺失屬性值的一致性偽近鄰區(qū)間描述,并將不完備數(shù)據(jù)集轉(zhuǎn)化為區(qū)間型數(shù)據(jù)集實(shí)現(xiàn)聚類分析。所提方法使用一致性偽相似度尋找近鄰關(guān)系,能夠直接從原始數(shù)據(jù)獲得屬性值分布信息。在利用區(qū)間型的描述充分體
4、現(xiàn)缺失屬性值的不確定性的同時(shí),還能夠使得所選取的一致性偽近鄰樣本與不完備樣本中的完備屬性值體現(xiàn)出更相近的屬性特征。實(shí)驗(yàn)結(jié)果表明,所提算法在子類重疊嚴(yán)重且相關(guān)性較強(qiáng)的人工數(shù)據(jù)集和實(shí)際數(shù)據(jù)集上均能取得良好的聚類效果。⑶進(jìn)一步將數(shù)據(jù)集中樣本的分布信息引入聚類過程中,提出利用樣本加權(quán)改進(jìn)PIC-FCM算法。方法通過樣本加權(quán),通過削弱離群點(diǎn)對(duì)聚類的影響提高算法的聚類準(zhǔn)確度,并通過加強(qiáng)與聚類中心更相似的樣本在計(jì)算聚類中心時(shí)的影響力,減少算法的迭代次
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于軟集合的不完備不一致數(shù)據(jù)分析及決策方法研究.pdf
- 基于網(wǎng)絡(luò)數(shù)據(jù)包的數(shù)據(jù)一致性檢測(cè)方法研究.pdf
- 基于偽近鄰及區(qū)間距離的不完備數(shù)據(jù)聚類方法.pdf
- 基于度量學(xué)習(xí)和聚類的一致性預(yù)測(cè)器算法研究.pdf
- 兩類模糊判斷矩陣的一致性及其應(yīng)用.pdf
- 基于移動(dòng)數(shù)據(jù)庫的數(shù)據(jù)一致性研究.pdf
- 基于NOSQL的數(shù)據(jù)最終一致性策略研究.pdf
- 基于Copula方法的一致性風(fēng)險(xiǎn)測(cè)度研究.pdf
- 基于缺失屬性值概率模型的不完備數(shù)據(jù)聚類研究.pdf
- 基于tableau的數(shù)據(jù)記錄匹配及一致性研究.pdf
- 基于模型的代碼一致性檢測(cè)方法的研究.pdf
- RAID系統(tǒng)數(shù)據(jù)一致性的研究.pdf
- 模糊互補(bǔ)判斷矩陣的一致性及群體集結(jié)方法研究.pdf
- 非一致性數(shù)據(jù)管理研究.pdf
- 基于XML的類結(jié)構(gòu)完整性和一致性研究.pdf
- 基于數(shù)據(jù)倉庫實(shí)體化視圖的數(shù)據(jù)一致性維護(hù)方法研究.pdf
- 基于樣本加權(quán)及分散度的不完備數(shù)據(jù)聚類研究.pdf
- 移動(dòng)自組網(wǎng)決策支持系統(tǒng)中數(shù)據(jù)緩存一致性與決策一致性研究.pdf
- RFID射頻一致性測(cè)試方法研究.pdf
- CORBA平臺(tái)一致性測(cè)試方法研究.pdf
評(píng)論
0/150
提交評(píng)論