2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩62頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、由于科學技術的快速發(fā)展、文獻出版周期的大大縮短,文獻成果目前呈現數量龐大、主題多樣的特點,在這樣情況下,如何快速獲取當前領域的研究熱點、把握研究趨勢是擺在科研工作者及科研部門面前亟待解決的問題,也是數字圖書館需要解決的難題。數字圖書館作為知識經濟實現的基礎設施,是國民經濟運行不可缺少的必要條件;同時作為社會的公共信息存儲中心、信息中轉站,數字圖書館為社會公眾提供綜合的信息服務,發(fā)揮著素質教育、文化保護與傳播的作用。數字圖書館自上世紀 9

2、0 年代提出并付諸實施以來,經歷了近 20 年的理論研究及其實踐發(fā)展,現已進入相對成熟的階段,對其學術成果進行主題分析,將有助于發(fā)現學術發(fā)展脈絡、學術熱點及學術發(fā)展趨勢,有利于學者尋找新的研究切入點,也有助于延續(xù)和提升數字圖書館生命力與活力。LDA(Latent Dirichlet Allocation)作為一種經典有效的概率生成模型,包含文本-主題-詞項三層貝葉斯結構,能挖掘出文本中的潛在語義信息,已在文本分類、信息檢索、情感分析、話

3、題挖掘等領域廣泛應用,在科技文獻主題發(fā)現與演化研究中的作用也日益凸顯。同時,科技文獻中的題目、摘要、關鍵詞是一篇文獻的重要組成部分,通常代表了作者對文章內容要點的濃縮和總結,在進行文獻主題分析時能發(fā)揮巨大作用。遺憾的是,現有數字圖書館相關主題研究未能重視和利用這些元素。本文利用LDA模型對2007-2016近十年的國內數字圖書館研究論文進行內容挖掘,分析其主題結構,揭示熱點主題及主題演化過程,最后結合實際背景對演化結果進行討論,以期為數

4、字圖書館的相關研究及工作開展提供參考與支持,進而促進數字圖書館的健康發(fā)展。
  具體內容如下:(1)總結現有的主題識別演化分析方法,從基本原理、研究現狀、優(yōu)缺點等方面對這些方法進行詳細分析。對利用LDA進行建模的完整過程進行研究(其中包括:Gibbs參數估計方法、最優(yōu)主題數確定方法、基于信息熵的主題過濾技術、熱點主題選取方法、后離散主題演化方式以及主題演化度量方法等)。將其中關鍵問題進行提煉研究,在此基礎上提出了一種基于主題強度聚

5、類的主題趨勢的識別分析方法。(2)選取國內數字圖書館2007-2016十年的期刊論文,引入時間因素,運用LDA對其進行主題演化分析,識別出數字圖書館研究的主題結構(用戶研究、建設對策、評價研究、信息服務、教育與培訓、知識管理、資源組織、資源共享、版權研究、移動圖書館、資源存儲與安全、領域研究述評、應用技術研究、云計算下的數字圖書館),可以作為數字圖書館研究人員以及數字圖書館管理人員、建設人員的決策實施參考方案。(3)利用上述同樣數據,通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論