2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩160頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、隨著互聯(lián)網(wǎng)和萬維網(wǎng)(World Wide Web)的快速繁榮發(fā)展,萬維網(wǎng)逐漸成為人們生活中不可或缺的一種信息獲取來源。萬維網(wǎng)給信息檢索技術(shù)帶來了極大的機遇和挑戰(zhàn)。經(jīng)過最近十幾年的發(fā)展,信息檢索已經(jīng)由一個純粹的學(xué)術(shù)研究學(xué)科轉(zhuǎn)變成大多數(shù)人信息獲取的技術(shù)基礎(chǔ)。
   隨著Web2.0概念的普及和發(fā)展,萬維網(wǎng)不再僅僅是一個巨大的信息庫,更逐漸成為一個用戶參與和交流的平臺。Web2.0應(yīng)用網(wǎng)站的蓬勃發(fā)展將再次推動信息檢索技術(shù)的革新。本文認

2、為,在Web2.0時代,信息檢索技術(shù)主要有以下三方面的發(fā)展趨勢:1)更加靈活的個性化信息服務(wù)。隨著用戶的急劇增加,Web2.0網(wǎng)站迫切需要滿足用戶的個性化信息需求。然而,傳統(tǒng)的Web信息檢索技術(shù)并不擅長處理Web2.0應(yīng)用的復(fù)雜結(jié)構(gòu)數(shù)據(jù)。Web2.0需要更加靈活的個性化信息服務(wù),如信息推薦系統(tǒng)。2)更加有效的多媒體數(shù)據(jù)檢索技術(shù)。隨著Web2.0的普及,用戶可以很方便地上傳和分享多媒體信息。多媒體數(shù)據(jù)的迅速增多使得多媒體信息檢索技術(shù)成為人

3、們關(guān)注的焦點。3)檢索服務(wù)的專業(yè)化。當(dāng)前,Web2.0應(yīng)用中的用戶產(chǎn)生數(shù)據(jù)已經(jīng)成為萬維網(wǎng)這個巨大信息庫的重要組成部分之一。過于繁雜的Web數(shù)據(jù)使得Web信息檢索向領(lǐng)域化、專業(yè)化方向發(fā)展。
   很多Web數(shù)據(jù)呈現(xiàn)復(fù)雜的內(nèi)在關(guān)聯(lián)結(jié)構(gòu)。本文指出,為了更好地解決這些數(shù)據(jù)上的相關(guān)檢索問題、提升檢索效果,就需要充分利用蘊含在數(shù)據(jù)復(fù)雜關(guān)聯(lián)結(jié)構(gòu)中的知識。圖學(xué)習(xí)技術(shù)能夠?qū)?fù)雜關(guān)聯(lián)結(jié)構(gòu)進行較好地建模并捕捉其中蘊含的知識。因此,結(jié)合上述發(fā)展趨勢,本

4、文研究工作圍繞基于圖學(xué)習(xí)的Web信息檢索技術(shù)展開,具體在以下四個相關(guān)研究問題上進行深入研究并提出了新穎的圖學(xué)習(xí)算法:
   1)Web2.0社區(qū)化標(biāo)簽應(yīng)用中的個性化標(biāo)簽推薦:社區(qū)化標(biāo)簽應(yīng)用中用戶可以對資源任意地加標(biāo)簽。產(chǎn)生的標(biāo)簽標(biāo)注數(shù)據(jù)可以很自然地用圖來建模。本文提出一種新的基于圖的多類關(guān)聯(lián)對象查詢排序算法,以解決社區(qū)化標(biāo)簽應(yīng)用中的個性化標(biāo)簽推薦問題。
   2)Web2.0社區(qū)化標(biāo)簽應(yīng)用中的個性化文檔推薦;傳統(tǒng)的信息推

5、薦系統(tǒng)聚焦在評級打分數(shù)據(jù)上,而社區(qū)化標(biāo)簽應(yīng)用中的標(biāo)簽標(biāo)注數(shù)據(jù)是一種不同的且具有特殊圖結(jié)構(gòu)的數(shù)據(jù)。本文提出一種新的基于圖的多類關(guān)聯(lián)對象降維(語義空間學(xué)習(xí))算法,將用戶、標(biāo)簽和文檔映射到同一語義空間中,然后根據(jù)用戶與文檔之間的歐式距離來進行文檔推薦。
   3)人臉圖像檢索與識別:傳統(tǒng)的人臉檢索和識別研究利用降維技術(shù)(子空間學(xué)習(xí))來獲得人臉圖像的高層次特征表達。最近提出的一種基于圖的二階張量子空間學(xué)習(xí)算法在人臉圖像上表現(xiàn)比較出色,但

6、是其時間復(fù)雜度比較高。本文提出一種新的基于圖的高效二階張量子空間學(xué)習(xí)算法,在保證可接受的檢索、識別性能的同時,降低了學(xué)習(xí)子空間映射函數(shù)的時間復(fù)雜度。
   4)高質(zhì)量專業(yè)Web資源抓取:聚焦爬蟲是從Web上抓取主題相關(guān)信息資源的一種重要技術(shù)手段。對垂直搜索引擎來講,最重要的研究問題之一是如何從Web中把高質(zhì)量的相關(guān)資源找出來。本文提出一種新的基于Web圖的網(wǎng)頁主題質(zhì)量在線評估算法,并在此基礎(chǔ)上設(shè)計了一個獲取高質(zhì)量主題相關(guān)、Web

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論