代價(jià)敏感的個(gè)性化郵件過濾技術(shù)研究.pdf

上傳人：奔*** IP屬地：河北更新時(shí)間：2024-03-09 格式：pdf 頁數(shù)：55 大小：6.87MB 人氣指數(shù)：12 舉報(bào) 版權(quán)申訴

已閱讀1頁，還剩54頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Internet飛速發(fā)展和普及，使得電子郵件成為信息交互的重要工具。但是，垃圾郵件的傳播卻嚴(yán)重干擾了用戶的日常生活和信息的正常通信，電子郵件成為各類廣告、政治反動(dòng)宣傳、病毒傳播及惡意攻擊的工具，占用大量帶寬資源，并經(jīng)常引起嚴(yán)重的郵件欺騙和安全問題。因此，研究郵件過濾技術(shù)具有舉足輕重的作用。
　　在郵件過濾中，分類的任務(wù)是期望建立誤分類最小的分類器，在傳統(tǒng)上都是基于分類錯(cuò)誤具有相同的代價(jià)假定上的。眾所周知，如果用戶查看大量垃圾郵

2、件會(huì)浪費(fèi)用戶的時(shí)間，相反如果漏掉用戶特別重要的郵件則會(huì)造成用戶損失。顯然，相對(duì)于前者，后者所付出的損失代價(jià)要遠(yuǎn)大于前者所付出的代價(jià)。對(duì)一批郵件而言，可能存在的情況是全部郵件中僅有極少數(shù)是用戶真正需要的，則在最糟糕的情況下，使用傳統(tǒng)分類方法產(chǎn)生的分類器只需要以大多數(shù)的郵件為標(biāo)準(zhǔn)作為分類即可獲得比較高精度的分類結(jié)果。但此時(shí)這個(gè)分類器也就失去了存在的價(jià)值。因此在處理分類不平衡數(shù)據(jù)時(shí)，單純以分類精度作為分類器的標(biāo)準(zhǔn)就顯得不恰當(dāng)。一種合理的解決方

3、法是以代價(jià)敏感來取代精度敏感的分類。因此，本文研究中，根據(jù)郵件過濾特點(diǎn)和用戶興趣，結(jié)合對(duì)分類結(jié)果的后處理代價(jià)敏感學(xué)習(xí)方法、可適應(yīng)推進(jìn)算法以及閾值過濾郵件的思想，給錯(cuò)誤分類的重要郵件賦予相應(yīng)的權(quán)值，以引起下一輪分類中更加重視，這樣當(dāng)學(xué)習(xí)完弱分類器后，按照閾值高低進(jìn)行過濾郵件，誤分類代價(jià)就會(huì)減小。實(shí)驗(yàn)結(jié)果表明：改進(jìn)后的方法能根據(jù)用戶興趣對(duì)分類器進(jìn)行設(shè)置，減少了誤分類代價(jià)。
　　信任覆蓋郵件過濾模型提供了分布式的過濾能力、實(shí)現(xiàn)了結(jié)點(diǎn)

4、間的相互推薦。在結(jié)合用戶興趣的差異性，還有待改進(jìn)，從而滿足用戶個(gè)性化的需求。本文分析了信任覆蓋模型的特點(diǎn)，提出了改進(jìn)的信任覆蓋郵件過濾模型。本模型能反映垃圾郵件趨勢(shì)，能根據(jù)用戶興趣過濾郵件，并把用戶對(duì)郵件的評(píng)判情況反饋給郵件服務(wù)器中的可信管理模塊?？蛻舳讼到y(tǒng)模擬表明，用戶能調(diào)整閾值過濾郵件，反饋后誤判率和漏判率有一定降低。
　　最后，本文將第三章的算法應(yīng)用于實(shí)際的郵件收發(fā)中，設(shè)計(jì)并實(shí)現(xiàn)了郵件過濾系統(tǒng)，測試表明系統(tǒng)基本上能夠?qū)崿F(xiàn)

眾賞文庫> 全部分類> 畢業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 眾賞文庫僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

代價(jià)敏感的個(gè)性化郵件過濾技術(shù)研究.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

代價(jià)敏感的個(gè)性化郵件過濾技術(shù)研究.pdf

文檔簡介

溫馨提示

最新文檔

評(píng)論

免費(fèi)下載