基于NUTCH的網(wǎng)站資源智能分析系統(tǒng)設(shè)計與實現(xiàn).pdf_第1頁
已閱讀1頁,還剩68頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、廈門大學(xué)學(xué)位論文原創(chuàng)性聲明本人呈交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下,獨立完成的研究成果。本人在論文寫作中參考其他個人或集體已經(jīng)發(fā)表的研究成果,均在文中以適當方式明確標明,并符合法律規(guī)范和《廈門大學(xué)研究生學(xué)術(shù)活動規(guī)范(試行)》。另外,該學(xué)位論文為()課題(組)的研究成果,獲得()課題(組)經(jīng)費或?qū)嶒炇业馁Y助,在()實驗室完成。(請在以上括號內(nèi)填寫課題或課題組負責(zé)人或?qū)嶒炇颐Q,未有此項聲明內(nèi)容的,可以不作特別聲明。)聲明人(簽名):廛報羲≯【

2、V年f。月印日摘要隨著互聯(lián)網(wǎng)的不斷深入發(fā)展,目前互聯(lián)網(wǎng)正處在歷史發(fā)展的最快時期,各大網(wǎng)站的資源也越來越豐富,用戶訪問量大,導(dǎo)致服務(wù)器端壓力加大,響應(yīng)速度變慢。而解決這一關(guān)鍵問題的手段是緩存,也就是通過開源的squid,進行內(nèi)容的緩存。而緩存的內(nèi)容其實是有限制的,必須只對于靜態(tài)時間較長的域名和URL作緩存,故分析資源(域名和Ⅵ也)的可緩存成為了當務(wù)之急。目前緩存廠家對于網(wǎng)站的域名的動靜態(tài)分析還處于人工分析的階段,運維人員需要手工的撥測域名

3、,抽樣其中的部分針對性URL進行動靜態(tài)的分析,然后做出動靜態(tài)的人為判斷,這樣的做法,導(dǎo)致很多域名加入到緩存的白名單后,被客戶投訴,直接的原因就是對網(wǎng)站中域名的動靜態(tài)分析不準確。正確的做法是對網(wǎng)站進行全局的自動化分析,然后得到域名的動靜態(tài)分析報告。而基于NUTCH的網(wǎng)站資源分析系統(tǒng)是目前可以接受且最實用的解決方案論文的主要工作有:1、分析可緩存資源的可緩存規(guī)則,分析整理出合理的可緩存分析規(guī)則,分析規(guī)則包含域名的可緩存規(guī)則和URL的可緩存分

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論