版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、隨著中國(guó)互聯(lián)網(wǎng)的飛速發(fā)展,中文互聯(lián)網(wǎng)頁(yè)在5 年內(nèi)增長(zhǎng)了120 倍,可查網(wǎng)頁(yè)數(shù)已經(jīng)達(dá)到6 億。海量的網(wǎng)頁(yè)在為人們提供包羅萬(wàn)象、無(wú)比豐富的信息資源的同時(shí),也向人們提出了如何快速?gòu)闹蝎@取其所需信息的挑戰(zhàn)。搜索引擎的存在方便了人們對(duì)信息的查找,但是,人們通常無(wú)法用簡(jiǎn)單的幾個(gè)詞來(lái)描述自己的信息需求。對(duì)于一個(gè)檢索查詢?cè)~,搜索引擎往往會(huì)返回成千上萬(wàn)的文本結(jié)果,這些結(jié)果是動(dòng)態(tài)而簡(jiǎn)單的,但絕大部分對(duì)于某個(gè)特定的用戶而言都是不相關(guān)的。因此,用戶必須通過(guò)瀏覽
2、冗長(zhǎng)的列表才能找到自己需要的信息。此外,查詢?cè)~也往往具有歧義,不同用戶具有不同的背景、興趣以及使用目的。因此,我們對(duì)中文網(wǎng)頁(yè)搜索結(jié)果進(jìn)行聚類及可視化等方面的研究,為用戶提供更加智能的搜索服務(wù)。 同時(shí),門(mén)戶網(wǎng)站的新聞瀏覽也是用戶獲取進(jìn)行信息的重要途徑。國(guó)內(nèi)的新浪、搜狐、百度、中搜等網(wǎng)站每天發(fā)布上萬(wàn)條新聞,并提供了分類的層次目錄供用戶選擇。目前的新聞主要是按照要聞、國(guó)內(nèi)、國(guó)際、社會(huì)、體育、娛樂(lè)、互聯(lián)網(wǎng)的方式進(jìn)行分類。RSS 新聞聚
3、合服務(wù)的提出改變了新聞瀏覽的方式,用戶可以定制新聞,方便地利用RSS 閱讀器得到最新消息。但是,即使如此,用戶還是需要從特定的類別中分揀出自己真正需要的信息,閱讀負(fù)擔(dān)沉重。本文在目前機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘和人工智能理論的基礎(chǔ)上,提出新型的算法、理論和檢索模式來(lái)對(duì)中文Web 檢索結(jié)果進(jìn)行優(yōu)化,充分利用聚類技術(shù)對(duì)檢索結(jié)果進(jìn)行分析,并通過(guò)動(dòng)態(tài)交互的界面來(lái)可視化結(jié)果,有針對(duì)性地對(duì)搜索結(jié)果進(jìn)行過(guò)濾;對(duì)中文新聞進(jìn)行采用類似的聚類模型,提取出特征短語(yǔ)作為
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- Web搜索結(jié)果聚類研究.pdf
- 智能搜索中中文網(wǎng)頁(yè)分類和聚類的初步研究.pdf
- 基于統(tǒng)計(jì)的中文新聞網(wǎng)頁(yè)分類技術(shù)研究.pdf
- 藏文搜索和搜索結(jié)果聚類研究及系統(tǒng)實(shí)現(xiàn).pdf
- 搜索引擎搜索結(jié)果的聚類研究.pdf
- Web搜索結(jié)果聚類方法研究.pdf
- Web搜索引擎的搜索結(jié)果聚類研究.pdf
- 基于網(wǎng)頁(yè)與標(biāo)簽聚類的搜索方法研究.pdf
- 中文搜索引擎營(yíng)銷研究.pdf
- 基于形式概念分析的搜索結(jié)果聚類研究.pdf
- 基于聚類分析的中文新聞網(wǎng)頁(yè)關(guān)鍵詞提取方法研究.pdf
- 融合命名實(shí)體的搜索結(jié)果聚類研究.pdf
- 新聞網(wǎng)頁(yè)抽取技術(shù)的研究與實(shí)現(xiàn).pdf
- 基于關(guān)鍵字的搜索引擎搜索結(jié)果中文網(wǎng)頁(yè)分類研究.pdf
- 搜索引擎返回結(jié)果的聚類方法研究.pdf
- 基于多核技術(shù)的搜索結(jié)果聚類算法研究.pdf
- 搜索引擎結(jié)果的聚類系統(tǒng)研究.pdf
- 中文搜索引擎技術(shù)揭密
- 基于分塊的新聞網(wǎng)頁(yè)信息抽取算法研究.pdf
- 中文搜索引擎的快速檢索方法研究.pdf
評(píng)論
0/150
提交評(píng)論