2023年全國碩士研究生考試考研英語一試題真題(含答案詳解+作文范文)_第1頁
已閱讀1頁,還剩13頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、1WEB中圖像的像的檢索技索技術研究研究第一章第一章前言前言1.11.1引言引言伴隨網絡技術的迅猛發(fā)展,圖片的來源不斷在擴大,容量超大的高速存儲系統(tǒng)給圖片的海量存儲給予了基本保障,各行業(yè)對圖像的趨于增多,圖像資源管理和搜索也愈發(fā)重要。但由于網絡本身架構、管理的種種問題,想在網絡精準、高效地找到所需的圖像,卻變成了件非常不易之事。由于網絡現在的問題:內容沒有良好的架構;網絡海量信息不斷的增多。由此,便出現了搜索引擎。雖然搜索引擎的出現給用

2、戶提供了不少的便捷,但是離精準、快速、全面的檢索到自己所想要的圖像還是有一段距離,所以對圖像搜索的研究還要下大力氣研究。依照現有的搜索引擎和國內外有關研究人員的種種資料表明,現在的網絡資源和搜索引擎的特點如下:(1)搜索的數據種類多樣,如視頻、圖片、文字等。存取協議也是種類繁多,如HTTP、FTP、News等等;(2)索引數據量巨大,從而導致不可能有某一個數據庫可以包括整個網絡的索引,當下最大的搜索引擎,其索引也僅僅覆蓋了網絡的一小部分

3、而已;(3)資源消耗過大,系統(tǒng)需將HTML文檔傳送到本地之后再進行分析,占用昂貴的網絡和CPU資源,從而增加被搜索結點的壓力。此外由于搜索引擎大多是集中式的,所以搜索引擎服務器對硬件配置的要求也極高,這樣才能處理巨大的數據量以及及時響應用戶的檢索請求;(4)不能有效解決搜索失效的問題,大多時候,搜索引擎會返回無用的查詢結果;(5)各種檢索工具各行其事,無法相互協作,共享資源,也是一種資源的浪費。1.21.2現今的圖像檢索技術現今的圖像檢

4、索技術近些年伴隨著用戶對圖像搜索需求不斷的增長,各類圖像搜索引擎由此誕生,它們以不同的搜索方式為用戶提供各類檢索途徑,使得網上圖像地檢索變得簡單,雖然還不太完善,但已經可以滿足大多數用戶的要求。1.2.11.2.1搜索引擎的搜索引擎的工作原理工作原理最初的搜索引擎結構,是讓Spider不停的從Web收集數據,存儲在搜索引擎數據庫當中。用戶靠搜索引擎服務器的Web接口,發(fā)出搜索請求,讓WebServer通過CGI或者其它技術訪問數據庫,并

5、且將用戶搜索請求變成相對應的數據存取語句,發(fā)送給引擎處理,然后把結果通過網頁顯示反饋給用戶。3包括兩種途徑:(1)基于圖片外部信息進行搜索。即依據圖片的文件名、目錄名、路徑名、以及圖像周圍文本的信息等等外部信息來進行檢索,這是當前圖片搜索引擎使用最多的方法。當找到圖像文件后,搜索引擎通過查看文件名或者路徑名來確定文件內容,當然也可以通過查看圖片標題來匹配檢索關鍵詞。(2)基于手工標注的檢索。通過手工對圖像的內容(如顏色對比、反差、景深等

6、)進行描述和分類,將圖像標注為一系列關鍵字,并且建立索引。檢索時,將主要在這些關鍵詞中搜索用戶輸入的關鍵字。這種查詢方法是比較準確的,大都可以獲得蠻好的查準率,但是需人工參加,勞動強度高,因此限制了可處理圖像的數量。此外,由于圖片所包含的信息量很龐大,不同類型用戶對同一張圖片的看法又不盡相同,就像一萬個讀者有一萬個哈姆雷特一般,從而導致了對圖像標注缺乏統(tǒng)一標準。2.圖像可視屬性檢索基于圖像內容的搜索主要是由圖片分析軟件自動提取圖片的顏色

7、、類型等特征,從而建立特征數據庫,其輸入的弱國為用戶要查找圖片的大致特征或示例,則通過一定相似匹配規(guī)則,輸出為與該圖片具有相近特征的圖片,按相似的程度來排列,以供用戶選擇,從而解決了在傳統(tǒng)圖像檢索技術中一般用戶難以完成的圖像特征描述、提取與識別等難題。這是基于圖片本身特征的檢索,適用于檢索明確目標的查詢要求,可是目前這種較為成熟的檢索技術主要是應用于圖片數據庫檢索。在圖片搜索引擎中應用這類檢索技術還有困難,但是有部分圖像搜索引擎開始嘗試

8、使用這種檢索方法。1.2.31.2.3對幾個基本引擎的簡單分析對幾個基本引擎的簡單分析(1)InfoSeek是一個簡單而又功能強大的索引,它的優(yōu)點是有面向主題搜索而且可擴展的分類。可以把搜索關鍵字和相似的分類目錄主題短語互相作為參照,而且那些主題短語會自動加入到你的查詢中。使你的檢索有更好的主題相關性。以此同時它也支持對圖片的查詢。能夠漫游Web、Use、UseFAQs等等。不過不支持布爾操作,但可以使用““和““。(2)AltaVis

9、ta是個大容量的,基于機器人索引的搜索引擎。能夠幫你在萬維網上搜索你所需的網頁,文本,圖像,視頻音頻。AltaVista支持多種語言和簡單的自然語言搜索查詢。AltaVista覆蓋面約為萬維網上可索引的網頁之30%(3)Scour自稱是第一個基于web的多媒體搜索引擎。嚴格講,它并非是個圖像搜索引擎,但是可以將檢索局限在圖像搜索上。Scour工作原理是在文件名、路徑名、ALT標簽中搜索關鍵詞。主要使用關鍵詞搜索,可以用符號“+“或“-“

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論