版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、我國林業(yè)是國民經(jīng)濟(jì)的基礎(chǔ)產(chǎn)業(yè),擔(dān)負(fù)著生態(tài)環(huán)境建設(shè)和促進(jìn)社會可持續(xù)發(fā)展的重大使命,人類是林業(yè)產(chǎn)業(yè)建設(shè)中的主要受益群體,當(dāng)林業(yè)產(chǎn)業(yè)結(jié)構(gòu)形成時,人們就在其中發(fā)揮其各自不同的作用。近年來,林業(yè)信息化推進(jìn),促進(jìn)了林業(yè)信息資源的共享,為公眾提供了便利,促進(jìn)了林業(yè)產(chǎn)業(yè)的發(fā)展。但是,林業(yè)信息化的發(fā)展還有其必要性,如何更好地利用林業(yè)信息資源,為我國林業(yè)科學(xué)領(lǐng)域廣大科研人員、教學(xué)工作者以及林農(nóng)服務(wù),就迫切需要對林業(yè)信息實(shí)現(xiàn)快速搜索與集成。
如
2、何從海量信息中快速查找到用戶所需要的信息,已經(jīng)成為公眾對特定領(lǐng)域信息的查找所面臨的主要問題?;ヂ?lián)網(wǎng)上林業(yè)信息越來越龐雜且無序,普通的搜索引擎已經(jīng)不能滿足大眾對個性化信息的需求。針對用戶在進(jìn)行林業(yè)主題信息查詢時,通用搜索引擎需要花費(fèi)大量時間及精力去查找所需要的信息,且主題信息的召回率和精確率都比較低,不能滿足用戶的需求,因此公眾急需一個分類精確、數(shù)據(jù)全面、更新及時的林業(yè)主題搜索引擎。
本論文的研究內(nèi)容來自導(dǎo)師主持的湖南省科技
3、計(jì)劃重點(diǎn)項(xiàng)目(2010nk2004)。本文以系統(tǒng)科學(xué)、林學(xué)、信息學(xué)和統(tǒng)計(jì)學(xué)等理論為指導(dǎo),對林業(yè)動態(tài)信息搜索與集成進(jìn)行了全面的研究。研究過程中,對國內(nèi)外林業(yè)動態(tài)信息搜索與集成等方面的研究進(jìn)行了綜述。主要從林業(yè)動態(tài)信息的需求分析與分類、主題爬蟲搜索器以及文本識別分類器等三個方面進(jìn)行了研究,主要研究工作如下:
(1)綜合分析了國內(nèi)外對于搜索引擎的既有理論和實(shí)踐成果,表明了目前建立一個林業(yè)主題搜索引擎的重要性和必要性,并對其中的關(guān)
4、鍵技術(shù)進(jìn)行了深入研究。本研究將林業(yè)主題搜索引擎分為數(shù)據(jù)收集層、數(shù)據(jù)存儲層以及數(shù)據(jù)表示層三個層次,并對這三個層次中涉及的相關(guān)方法進(jìn)行了探討和總結(jié)。
(2)利用網(wǎng)頁上公布的信息,結(jié)合各部門及公眾對林業(yè)動態(tài)信息的需求,明確對各部門及公眾真正有實(shí)際意義的林業(yè)動態(tài)信息類別,并對所需林業(yè)動態(tài)信息進(jìn)行分類、分塊,使各種林業(yè)動態(tài)信息具體化,主要分為以下七類:林業(yè)科技信息、林業(yè)生產(chǎn)資料、林產(chǎn)品市場供求信息、花卉信息、林業(yè)政策法規(guī)、林業(yè)勞務(wù)信
5、息、氣象與環(huán)境信息。
(3)根據(jù)已構(gòu)建的林業(yè)動態(tài)信息類別體系,搜集與之相關(guān)的林業(yè)專業(yè)網(wǎng)站,明確信息采集的網(wǎng)站來源。采集我們所需要的數(shù)據(jù)所提供的網(wǎng)站域名,并采集域名后的內(nèi)容,同時辨別所采集的網(wǎng)站類別,實(shí)現(xiàn)對林業(yè)動態(tài)信息源的搜集及分類。
(4)運(yùn)用基于內(nèi)容分析與基于鏈接結(jié)構(gòu)分析相結(jié)合的一種新型搜索策略,通過綜合分析評價,對候選URL所指向的頁面進(jìn)行主題相關(guān)度判斷以及對候選URL進(jìn)行排序,實(shí)現(xiàn)最優(yōu)的林業(yè)主題爬蟲搜索
6、器,從而使所下載的網(wǎng)頁按與林業(yè)主題相關(guān)且重要性突出遞減的順序排列。
(5)采用計(jì)算機(jī)智能的SVM自動文本分類技術(shù),對樣本數(shù)據(jù)進(jìn)行機(jī)器訓(xùn)練,實(shí)現(xiàn)對主題爬蟲搜索器所采集到的林業(yè)動態(tài)信息進(jìn)行分類存儲,達(dá)到對林業(yè)主題搜索引擎的數(shù)據(jù)收集層的構(gòu)建進(jìn)行優(yōu)化的目的。
林業(yè)動態(tài)信息搜索與集成是在對現(xiàn)有的搜索與集成技術(shù)進(jìn)行研究和優(yōu)化的基礎(chǔ)上,融合了公眾對林業(yè)動態(tài)信息的需求,使得公眾在獲取林業(yè)動態(tài)信息時的準(zhǔn)確率、全面率和成功率都得
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于JADE平臺的網(wǎng)絡(luò)信息搜索與集成系統(tǒng).pdf
- 信息集成中的動態(tài)信息源結(jié)合問題研究.pdf
- 企業(yè)集成中的組織集成與信息集成.pdf
- 加強(qiáng)林業(yè)資源保護(hù) 重視林業(yè)快速發(fā)展
- 動態(tài)信息與動態(tài)信息規(guī)律特征研究.pdf
- 基于語義的知識資源搜索與集成研究.pdf
- 基于動態(tài)電流信息的集成電路測試研究.pdf
- 動態(tài)搜索煙花算法的研究與應(yīng)用.pdf
- Deep Web動態(tài)搜索的研究——基于圖書網(wǎng)站的動態(tài)搜索.pdf
- 輸電斷面快速搜索與過載緊急控制策略研究.pdf
- 基于中介器-包裝器的動態(tài)信息集成研究.pdf
- 中斷與搜索作業(yè)類型對網(wǎng)絡(luò)信息搜索作業(yè)的影響.pdf
- 運(yùn)動估計(jì)快速搜索算法的研究與改進(jìn).pdf
- 多視點(diǎn)編碼快速搜索策略研究.pdf
- 快速OCT集成控制系統(tǒng)設(shè)計(jì)與開發(fā).pdf
- 基于ERP集成平臺的人的集成與信息集成的研究.pdf
- 基于動態(tài)信息集成鐵路調(diào)度指揮系統(tǒng)研究.pdf
- 面向移動視覺的快速搜索方法.pdf
- 專業(yè)信息定向采集與多維搜索系統(tǒng).pdf
- WiFi動態(tài)認(rèn)證與快速切換的研究與實(shí)現(xiàn).pdf
評論
0/150
提交評論