版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、數(shù)據(jù)挖掘中的一個(gè)重要模型是分類模型,傳統(tǒng)數(shù)據(jù)挖掘方法的目標(biāo)是獲得一個(gè)分類精度盡可能高的分類器。但是在實(shí)際問(wèn)題中,外部環(huán)境的各種不確定因素會(huì)導(dǎo)致決策不能順利達(dá)到預(yù)期目標(biāo),進(jìn)而帶來(lái)決策風(fēng)險(xiǎn)代價(jià),且分類模型中的誤分類代價(jià)不盡相同,存在代價(jià)敏感性。完全避免決策失誤是難以做到的,人們所期望的是使決策風(fēng)險(xiǎn)代價(jià)最小,而非期望利益最大化。追求決策知識(shí)與經(jīng)驗(yàn)數(shù)據(jù)的嚴(yán)格一致性容易給決策者提供錯(cuò)誤的決策信息,且忽略了決策者對(duì)預(yù)期風(fēng)險(xiǎn)的規(guī)避心理,已不適用于解決
2、實(shí)際問(wèn)題。三支決策將決策視為分類問(wèn)題,與數(shù)據(jù)挖掘處理的問(wèn)題模型相一致,建立了決策理論與數(shù)據(jù)挖掘方法之間的橋梁,其具有的誤差容忍與代價(jià)敏感機(jī)制可以使傳統(tǒng)的數(shù)據(jù)挖掘方法在分類中對(duì)不同代價(jià)的誤分類結(jié)果具有區(qū)分性與敏感性,以做出風(fēng)險(xiǎn)損失最低的分類結(jié)果。
針對(duì)一般的數(shù)據(jù)挖掘模型僅僅尋求分類器的精度,不能根據(jù)人們的期望處理現(xiàn)實(shí)中的決策問(wèn)題,本文將三支決策用于傳統(tǒng)的數(shù)據(jù)挖掘方法中,構(gòu)建了基于三支決策的代價(jià)敏感學(xué)習(xí)方法,使傳統(tǒng)的數(shù)據(jù)挖掘方法更
3、好地適應(yīng)具有代價(jià)敏感性的實(shí)際問(wèn)題。本文主要研究?jī)?nèi)容如下:
(1)針對(duì)典型的支持向量機(jī)增量學(xué)習(xí)算法對(duì)有價(jià)值的非支持向量的忽略,以及一般的支持向量機(jī)增量學(xué)習(xí)算法盡可能提升分類精度的客觀性,利用三支決策的代價(jià)敏感性和邊界域構(gòu)建了一種新的支持向量機(jī)增量學(xué)習(xí)算法。該算法首先根據(jù)支持向量機(jī)的學(xué)習(xí)原理來(lái)度量三支決策中的條件概率;然后采用三支決策劃分出邊界域,并基于支持向量機(jī)對(duì)其與新增樣本、原支持向量的并集進(jìn)行分類;最后,通過(guò)實(shí)驗(yàn)證明,該方法
4、不僅能夠篩選出有價(jià)值的非支持向量進(jìn)而提高分類的精確性,而且使支持向量機(jī)增量學(xué)習(xí)方法更適合于具有代價(jià)敏感性的實(shí)際問(wèn)題,并使三支決策中條件概率的構(gòu)建方式更切合于具體學(xué)習(xí)環(huán)境。
(2)針對(duì)現(xiàn)有的涉及k近鄰的top-n離群點(diǎn)檢測(cè)算法通常依賴于參數(shù)k,n,但用戶卻很難確定合適的參數(shù)值,基于三支決策的三支語(yǔ)義提出了一種基于三支決策的代價(jià)敏感離群點(diǎn)檢測(cè)方法。該方法首先采用k近鄰來(lái)度量三支決策的條件概率;其次,構(gòu)建使決策代價(jià)最小的最優(yōu)化問(wèn)題來(lái)
5、自適應(yīng)地尋找最優(yōu)條件概率;然后,采用三支決策遞歸地劃分離群點(diǎn);最后,通過(guò)實(shí)驗(yàn)證明,該方法不僅使條件概率的度量方法適用于離群點(diǎn)檢測(cè)問(wèn)題,而且可以在不需要用戶參與的前提下自動(dòng)地檢測(cè)離群點(diǎn)。
(3)針對(duì)傳統(tǒng)數(shù)據(jù)挖掘方法對(duì)不一致數(shù)據(jù)的忽視,以及一般的決策樹(shù)算法對(duì)不一致結(jié)點(diǎn)的處理缺乏理論支撐的缺陷,根據(jù)三支決策的代價(jià)敏感性和邊界域構(gòu)建了一種新的決策樹(shù)分類方法。該方法首先采用決策樹(shù)結(jié)點(diǎn)的正例比例來(lái)度量三支決策中的條件概率,進(jìn)而三支劃分決策
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 代價(jià)敏感的三支決策邊界域處理模型研究.pdf
- 改進(jìn)代價(jià)敏感的決策樹(shù)學(xué)習(xí)方法研究.pdf
- 自適應(yīng)代價(jià)敏感決策樹(shù)的學(xué)習(xí)方法.pdf
- 基于三支決策的重疊聚類方法研究.pdf
- 基于粗糙集的代價(jià)區(qū)間與多人三支決策的研究.pdf
- 混合型數(shù)據(jù)的代價(jià)敏感學(xué)習(xí)方法.pdf
- 基于測(cè)度論的三支決策理論研究.pdf
- 代價(jià)敏感決策樹(shù)構(gòu)建方法的研究.pdf
- 基于三支決策的中文微博觀點(diǎn)句識(shí)別研究.pdf
- 基于決策粗糙集模型的多類代價(jià)敏感學(xué)習(xí)研究.pdf
- 基于構(gòu)造性覆蓋算法的三支決策模型.pdf
- 三支決策邏輯基礎(chǔ)及模型研究.pdf
- 基于概率圖的三支決策模型及其應(yīng)用研究.pdf
- 合成集值決策表與三支決策.pdf
- 基于動(dòng)態(tài)代價(jià)敏感的機(jī)器學(xué)習(xí)研究.pdf
- 基于代價(jià)敏感學(xué)習(xí)的維數(shù)約簡(jiǎn)方法及其應(yīng)用研究.pdf
- 基于LGC算法的代價(jià)敏感分類方法研究.pdf
- 代價(jià)敏感決策樹(shù)算法研究.pdf
- 基于云計(jì)算平臺(tái)的代價(jià)敏感集成學(xué)習(xí)研究.pdf
- 帕金森語(yǔ)音特征提取軟件開(kāi)發(fā)及三支決策診斷方法研究.pdf
評(píng)論
0/150
提交評(píng)論