版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、隨著互聯(lián)網(wǎng)發(fā)展的日趨成熟,人們淹沒在充斥著各種各樣信息的世界中,面對(duì)著紛繁復(fù)雜的信息世界卻無法有效的選擇、吸收和消化信息,陷入了所謂的“信息過載”。無處不在的信息資源的普遍性又增加了人們從大量繁雜信息中尋找自己感興趣的數(shù)據(jù)和信息的難度,用戶無法有效的選擇可以高效搜索自己所需信息資源的方法和工具,又會(huì)陷入“信息迷失”現(xiàn)象中。此外,目前檢索網(wǎng)上信息的主要手段還是利用搜索引擎來檢索,由于大部分搜索引擎都不具有主動(dòng)性搜索的特點(diǎn),與用戶的交互極少
2、甚至沒有,忽略了用戶的興趣偏好和用戶需求的差異,因此,基于搜索引擎的普遍檢索無法有效的解決“信息過載”和“信息迷失”現(xiàn)象。
隨著信息技術(shù)水平的不斷發(fā)展和成熟,從海量數(shù)據(jù)中抽取潛在的、用戶感興趣的知識(shí)成為數(shù)據(jù)挖掘領(lǐng)域中一個(gè)非常重要和有意義的研究課題。Web數(shù)據(jù)挖掘是將數(shù)據(jù)挖掘和萬維網(wǎng)這兩個(gè)領(lǐng)域中的多種技術(shù)和方法結(jié)合起來的熱門研究課題。一般來說,Web挖掘的研究領(lǐng)域包括Web內(nèi)容挖掘、結(jié)構(gòu)挖掘和使用挖掘。
本文系統(tǒng)的闡述
3、了從數(shù)據(jù)挖掘、Web數(shù)據(jù)挖掘到Web日志挖掘的整個(gè)過程,Web數(shù)據(jù)挖掘的預(yù)處理、Web日志模式發(fā)現(xiàn)以及Web日志模式分析等技術(shù)過程,在簡要的論述Web日志挖掘的概念、研究內(nèi)容、關(guān)鍵技術(shù)和目前國內(nèi)外研究狀況的基礎(chǔ)上,針對(duì)我校網(wǎng)站的訪問日志,采用數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)分析,重點(diǎn)研究了Web日志挖掘的數(shù)據(jù)預(yù)處理的改進(jìn),在理論改進(jìn)的基礎(chǔ)上提出了具體的實(shí)驗(yàn)方案,并設(shè)計(jì)了基于校園網(wǎng)日志分析的Web數(shù)據(jù)挖掘系統(tǒng),從而找出用戶訪問規(guī)律和內(nèi)容喜好,為改進(jìn)校
4、園網(wǎng)的網(wǎng)站結(jié)構(gòu)和內(nèi)容提供了決策支持和依據(jù),并通過實(shí)驗(yàn)驗(yàn)證了本研究所設(shè)計(jì)的Web數(shù)據(jù)挖掘系統(tǒng)的有效性和可行性。
論文所做的主要工作是:首先介紹了本文所做研究的現(xiàn)狀及趨勢,國內(nèi)外目前對(duì)Web日志挖掘研究的情況,然后闡述了數(shù)據(jù)挖掘和Web數(shù)據(jù)挖掘以及Web日志挖掘的基本概念和相互之間的聯(lián)系。接下來分析了Web日志挖掘過程中的數(shù)據(jù)預(yù)處理技術(shù),基于對(duì)傳統(tǒng)數(shù)據(jù)預(yù)處理階段中各項(xiàng)任務(wù)的完成方法和利用技術(shù)進(jìn)行詳盡的分析,然后提出了更新的數(shù)據(jù)與處
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向校園網(wǎng)日志分析的web數(shù)據(jù)控制技術(shù)研究.pdf
- 基于校園網(wǎng)用戶行為日志的數(shù)據(jù)挖掘研究.pdf
- 基于“WEB日志挖掘”技術(shù)的校園網(wǎng)絡(luò)日志分析與安全審計(jì).pdf
- 基于關(guān)聯(lián)規(guī)則的校園網(wǎng)Web日志挖掘研究與實(shí)現(xiàn).pdf
- 基于Web日志的數(shù)據(jù)挖掘技術(shù)研究.pdf
- 校園網(wǎng)Web使用挖掘技術(shù)的研究及應(yīng)用.pdf
- 面向Web日志數(shù)據(jù)挖掘的研究與應(yīng)用.pdf
- Web日志數(shù)據(jù)挖掘技術(shù)的研究.pdf
- 招生信息網(wǎng)的Web日志挖掘技術(shù)研究.pdf
- Web日志挖掘相關(guān)技術(shù)研究.pdf
- 淺析web日志數(shù)據(jù)挖掘技術(shù)
- 面向多站點(diǎn)Web日志挖掘中的數(shù)據(jù)采集與預(yù)處理技術(shù)研究.pdf
- 基于數(shù)據(jù)挖掘技術(shù)的校園網(wǎng)入侵檢測系統(tǒng)的研究.pdf
- Web日志挖掘的相關(guān)技術(shù)研究.pdf
- Web日志數(shù)據(jù)挖掘的研究.pdf
- Web日志挖掘技術(shù)研究與應(yīng)用.pdf
- 面向web的數(shù)據(jù)挖掘技術(shù)
- 校園網(wǎng)故障分析與定位技術(shù)研究.pdf
- 基于日志的Web挖掘相關(guān)技術(shù)研究.pdf
- 基于XML的Web日志挖掘技術(shù)研究.pdf
評(píng)論
0/150
提交評(píng)論