版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、分類號(hào)密級(jí)UDC學(xué)位論文中文局域網(wǎng)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)中文局域網(wǎng)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)王穎王穎指導(dǎo)教師姓名魯珂魯珂副教授副教授電子科大成都成都孫紀(jì)方孫紀(jì)方高工高工樂(lè)山巨人監(jiān)理有限公司樂(lè)山巨人監(jiān)理有限公司樂(lè)山樂(lè)山申請(qǐng)學(xué)位級(jí)別碩士研究生專業(yè)名稱軟件工程軟件工程論文提交日期2009.5論文答辯日期2009.6學(xué)位授予單位和日期電子科技大學(xué)電子科技大學(xué)答辯委員會(huì)主席評(píng)閱人2009年6月2日注1注明《國(guó)際十進(jìn)分類法UDC》的類號(hào)摘要I摘要隨著互聯(lián)網(wǎng)的不
2、斷發(fā)展和日益普及,網(wǎng)上的信息量在爆炸性增長(zhǎng),要在巨大數(shù)量的網(wǎng)上信息中找到自己所需要的信息非常困難,而搜索引擎的出現(xiàn)極大方便了人們?cè)诰W(wǎng)上獲取信息。但是現(xiàn)在的大型通用搜索引擎有它的局限性,現(xiàn)在人們對(duì)信息的精細(xì)化、專業(yè)化、非商業(yè)性的強(qiáng)烈需求,迫使大量專業(yè)領(lǐng)域的垂直搜索引擎的出現(xiàn)。而另外一方面在一些通用搜索引擎無(wú)法覆蓋的區(qū)域,比如某某企業(yè)的內(nèi)部網(wǎng)絡(luò),內(nèi)部校園網(wǎng)絡(luò)等也迫切需要一個(gè)能在自身網(wǎng)絡(luò)內(nèi)部運(yùn)行的封閉性的便于部署的中輕量級(jí)的搜索引擎,即局域網(wǎng)
3、搜索引擎。本文完整的說(shuō)明了一個(gè)中輕量級(jí)的中文搜索引擎的設(shè)計(jì)與開發(fā)過(guò)程,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)信息的全文索引檢索。本文從需求分析入手,通過(guò)對(duì)需求的分析與描述概括出整個(gè)系統(tǒng)的大致輪廓,然后展開整個(gè)系統(tǒng)的設(shè)計(jì),定義了數(shù)據(jù)采集子系統(tǒng)(通過(guò)對(duì)網(wǎng)絡(luò)中存儲(chǔ)的各種文件數(shù)據(jù)的下載,將所有的數(shù)據(jù)文件信息存儲(chǔ)到本地磁盤)、預(yù)處理子系統(tǒng)(在后臺(tái)對(duì)其進(jìn)行信息凈化抽取,建立相應(yīng)的倒排索引)、中文分詞子系統(tǒng)(對(duì)中文數(shù)據(jù)進(jìn)行中文分詞),查詢子系統(tǒng)(建立查詢代理為前臺(tái)提供服務(wù),接
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 分詞算法優(yōu)化——局域網(wǎng)FTP搜索引擎設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于搜索引擎的局域網(wǎng)涉密信息檢測(cè)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于lucene.net的局域網(wǎng)全文搜索引擎的設(shè)計(jì)與開發(fā)
- 搜索引擎中文分詞原理與實(shí)現(xiàn)
- 基于nutch和lucene的局域網(wǎng)搜索引擎研究和應(yīng)用.pdf
- 移動(dòng)中文新聞搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 中文人名搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 站內(nèi)中文搜索引擎設(shè)計(jì)與實(shí)現(xiàn).pdf
- 深網(wǎng)搜索引擎
- 中文智能搜索引擎.pdf
- 搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
- 搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
- 企業(yè)網(wǎng)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 基于中文分詞的搜索引擎設(shè)計(jì)實(shí)現(xiàn).pdf
- 搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)
- [學(xué)習(xí)]搜索引擎優(yōu)化與搜索引擎營(yíng)銷
- 專業(yè)搜索引擎中文件服務(wù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn).pdf
- 垂直搜索引擎設(shè)計(jì)與實(shí)現(xiàn).pdf
- 校園網(wǎng)搜索引擎系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn).pdf
- 搜索引擎的設(shè)計(jì)與實(shí)現(xiàn).doc
評(píng)論
0/150
提交評(píng)論