版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、電子商務(wù)在近二十年的蓬勃發(fā)展取得了世人矚目的業(yè)績,并以一種前所未有的方式改變著傳統(tǒng)的商務(wù)活動的模式和格局,更深刻地影響著人們對商務(wù)的認識和理解,改變著人們的生活和工作方式。隨著網(wǎng)絡(luò)規(guī)模在全球的迅猛發(fā)展,InteRNet上的Web站點及網(wǎng)頁數(shù)量在以爆炸性的趨勢增長同時隨著網(wǎng)絡(luò)技術(shù)的不斷進步,越來越多的Web數(shù)據(jù)庫需要通過網(wǎng)絡(luò)查詢?nèi)肟诓拍苓M行訪問,學(xué)術(shù)界稱其為深層網(wǎng)(Deep Web)。經(jīng)相關(guān)研究機構(gòu)和商業(yè)機構(gòu)的調(diào)查,萬維網(wǎng)中深層網(wǎng)的數(shù)據(jù)存
2、儲數(shù)量非常巨大,其中電子商務(wù)數(shù)據(jù)占了很大的比重。這些電子商務(wù)數(shù)據(jù)具有很高的商用價值。然而由于這些電子商務(wù)網(wǎng)站網(wǎng)頁形式與內(nèi)容開發(fā)的獨立性,造成了Web數(shù)據(jù)庫,特別是查詢?nèi)肟诘漠悩?gòu)性。正因為此原因,自動的從電子商務(wù)網(wǎng)站中獲取有價值的信息和數(shù)據(jù)變成了一件十分具有挑戰(zhàn)性的任務(wù)。
本文針對深層網(wǎng)挖掘中目前還沒有很好解決的如何讓機器從語義上理解深層網(wǎng)中的入口信息問題,充分分析了深層網(wǎng)中電子商務(wù)入口中文本標(biāo)簽和查詢元素之間的關(guān)系以及查詢
3、元素之間的關(guān)系。除此之外,從深層網(wǎng)入口的位置特征、布局特征和顯示特征三個方面分析了深層網(wǎng)入口的視覺特征。通過大量電子商務(wù)網(wǎng)站深層網(wǎng)入口的觀察的基礎(chǔ)上得到了一些置信度很高的啟發(fā)式規(guī)則,從而提出了基于深層網(wǎng)入口的可視化特征和本體工具WordNet分析深層網(wǎng)入口元素的語義關(guān)系來更好的挖掘出人們易于理解的深層網(wǎng)入口語義層次結(jié)構(gòu)的方法。該方法首先需要對深層網(wǎng)入口頁面數(shù)據(jù)進行預(yù)處理。然后,利用基于可視化特征的頁面分割算法構(gòu)建可視化模塊樹并利用可視化
4、對樹中的文本信息進行聚類及標(biāo)簽信息的識別。最后充分利用深層網(wǎng)入口中的標(biāo)簽信息間的語義關(guān)系構(gòu)建出合理的標(biāo)簽樹并通過查詢元素與標(biāo)簽之間的視覺特征關(guān)系對標(biāo)簽樹和查詢元素進行匹配,從而提高了挖掘語義信息的準(zhǔn)確度,進而提高了深層網(wǎng)信息的獲取效率和覆蓋率。此外本研究利用UIUC網(wǎng)站提供的研究數(shù)據(jù)對提出的方法進行了準(zhǔn)確度的實驗,實驗表明,相對于以往的深層網(wǎng)入口挖掘方法,本文提出的方法在準(zhǔn)確性方面具有更好的表現(xiàn)。最后對本研究進行了總結(jié),并提出了未來繼續(xù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 面向旅游電子商務(wù)的數(shù)據(jù)挖掘研究.pdf
- 面向電子商務(wù)的WEB數(shù)據(jù)挖掘研究.pdf
- 面向電子商務(wù)的Web數(shù)據(jù)挖掘的研究.pdf
- 面向電子商務(wù)的數(shù)據(jù)挖掘研究與應(yīng)用.pdf
- 面向電子商務(wù)的Web數(shù)據(jù)挖掘應(yīng)用研究.pdf
- 面向電子商務(wù)的Web數(shù)據(jù)挖掘技術(shù)的研究.pdf
- 面向電子商務(wù)的Web使用模式數(shù)據(jù)挖掘研究.pdf
- 面向電子商務(wù)的web挖掘中關(guān)聯(lián)算法的研究.pdf
- 面向電子商務(wù)的數(shù)據(jù)挖掘技術(shù)研究與實現(xiàn).pdf
- 面向電子商務(wù)粗分析理論數(shù)據(jù)挖掘方法研究.pdf
- 面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)的研究與設(shè)計.pdf
- 面向電子商務(wù)的web數(shù)據(jù)挖掘的研究與設(shè)計.pdf
- 面向電子商務(wù)海量數(shù)據(jù)的智能挖掘技術(shù)研究.pdf
- 面向智能電子商務(wù)的Web挖掘理論與方法的研究.pdf
- 面向電子商務(wù)的數(shù)據(jù)挖掘中聚類算法的研究.pdf
- 面向電子商務(wù)個性化推薦的序列關(guān)聯(lián)挖掘研究.pdf
- 面向電子商務(wù)信用管理的研究.pdf
- 面向電子商務(wù)個性化服務(wù)的Web挖掘應(yīng)用研究.pdf
- 電子商務(wù)潛在客戶挖掘.pdf
- 電子商務(wù)公司W(wǎng)eb數(shù)據(jù)挖掘研究.pdf
評論
0/150
提交評論