基于百度百科的隱性語義知識挖掘研究.pdf_第1頁
已閱讀1頁,還剩59頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、知識經(jīng)濟時代,越來越多的知識伴隨著人類信息技術的發(fā)展得以快速傳播并為人類所用。要想在這個復雜多變的環(huán)境中保持競爭優(yōu)勢,人類必須加快自己學習知識的步伐。通過對知識進行研究,我們不難發(fā)現(xiàn)知識分為顯性知識和隱性知識兩種,其中顯性知識我們可以通過日常自學得到,而隱性知識由于其內(nèi)隱性、難以模仿、難以復制的特性,則需要我們在相互的交流中習得。要想促進知識的轉(zhuǎn)化與創(chuàng)新,僅僅依靠顯性知識之間的推演遠遠不夠,因為更多有價值的知識都包含在隱性知識之內(nèi),需要

2、我們通過在較大容量的數(shù)據(jù)庫中充分的數(shù)據(jù)挖掘才可以獲得。因此,如何在知識經(jīng)濟時代,幫助人們獲取所需要的資源,挖掘有價值的隱性知識,成為學者們關注的重點。百度百科,是中國最大的百科全書和最有價值研究的語料庫,隨著科學的不斷發(fā)展不斷融入新的知識,作為一個不斷更新的知識庫,為人類隱性知識的挖掘提供平臺,相對于其他百科全書有著無可比擬的優(yōu)勢。但目前人們大多傾向于基于維基百科平臺的知識挖掘研究,而針對百度百科工具的知識挖掘研究相對較少。如何通過百度

3、百科對人類所擁有的主要資源進行準確地挖掘,使人們快速有效地發(fā)現(xiàn)自己所需要的知識,充分挖掘隱藏其中的有價值的隱性知識,提高信息的利用率已成為學者們研究的熱點。
  本文首先概述了隱性知識和數(shù)據(jù)挖掘的內(nèi)涵,指出隱性知識的定義和無可替代的重要性以及數(shù)據(jù)挖掘的內(nèi)涵;然后針對隱性知識顯性化的過程中可能出現(xiàn)的一些障礙進行總結概述,并提出了相對應的解決方案,同時在介紹數(shù)據(jù)挖掘的基本過程及分類的基礎上,簡要講解了幾種常用的數(shù)據(jù)挖掘技術,并在現(xiàn)有的

4、數(shù)據(jù)挖掘技術的基礎上,提出了基于案例的隱性知識挖掘方法、基于web的隱性知識挖掘方法、基于Microsoft三種算法的隱性知識挖掘方法、基于其他算法的隱性知識挖掘方法等四種隱性知識挖掘的方法;最后簡要比較分析了百度百科相對于其他百科全書的優(yōu)勢,并針對基于百度百科這個平臺進行知識挖掘提出了相對應的語義知識挖掘和語義相關度的研究,并在此基礎上,提出通過抽取語義相關詞來建立隱性語義詞典和語義百度百科系統(tǒng)的假設,提出了基于百科百科的隱性知識挖掘

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論