2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩66頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、隨著互聯(lián)網(wǎng)和電子商務的發(fā)展,互聯(lián)網(wǎng)信息與日俱增,產(chǎn)生了“信息過載”現(xiàn)象,用戶很難找到自己需要的信息。搜索引擎的問世節(jié)省了搜索時間,可以快速定位用戶需要的信息,但是缺少定制個性化檢索結(jié)果的能力。個性化推薦技術根據(jù)用戶歷史行為信息,提供個性化推薦服務,滿足用戶需求,可以有效解決信息過載問題。但是隨著個性化推薦系統(tǒng)規(guī)模越來越大,用戶歷史行為信息相對越來越少,評分矩陣極度稀疏,導致推薦質(zhì)量下降。為了緩解數(shù)據(jù)稀疏帶來的影響,目前的主要方法是維數(shù)約

2、簡,采用特征提取或者利用機器學習方法降低維度,還可以使用數(shù)據(jù)壓縮原理減少系統(tǒng)數(shù)據(jù)的維度?,F(xiàn)有的推薦技術在降低維度的過程中都會舍棄掉部分重要信息,使得相似度計算和近鄰查找的精度不高,從而影響推薦效果。
  本研究主要內(nèi)容包括:⑴當評分矩陣極度稀疏時,使用現(xiàn)有的相似度量方法計算用戶相似度的準確率不高,導致依據(jù)用戶相似矩陣查找最近鄰居以及計算評分預測值的精確度下降。對此,提出基于聚類和信任度的個性化推薦算法,定義信任相似度,將基于評分眾

3、數(shù)的用戶信任度融合到基于用戶評分的傳統(tǒng)相似度量算法中。在 MovieLens數(shù)據(jù)集上進行測試,實驗結(jié)果證明,提出的基于聚類和信任度的個性化推薦算法計算出的用戶相似度的精度更高,有助于尋找到適合的最近鄰居用戶,更加準確地填充評分預測值,避免用戶惡意評分的情況,在數(shù)據(jù)稀疏的情況下提高用戶相似度計算的準確率,提高推薦精度。⑵目前推薦系統(tǒng)的評分數(shù)據(jù)具有高維性和稀疏性,例如多媒體數(shù)據(jù)、購物數(shù)據(jù)等,現(xiàn)有針對高維稀疏數(shù)據(jù)的推薦算法大都基于維度約簡,在

4、降低維度的過程中舍棄了過多有用信息,導致查找近鄰的精度下降。為此,提出基于稀疏子空間聚類的個性化推薦算法,利用稀疏子空間聚類算法對用戶進行聚類,減少有用信息的舍棄,找到所屬聚類簇,計算相似度,利用KNN(K-Nearest Neighbor)方法查找最近鄰集合,根據(jù)近鄰集合的評分值計算預測評分值。在MovieLens數(shù)據(jù)集上進行測試,實驗結(jié)果證明,基于稀疏子空間聚類的個性化推薦算法可以積極緩解在數(shù)據(jù)稀疏情況下查找近鄰不精準的問題,提高推

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論