基于地理標(biāo)簽的社會媒體數(shù)據(jù)挖掘的智能旅游推薦研究.pdf_第1頁
已閱讀1頁,還剩122頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、在社會化媒體網(wǎng)站上(例如Flickr網(wǎng)站),用戶上傳的帶有地理標(biāo)簽的照片提供了大量的基于位置信息的數(shù)據(jù)。這些數(shù)據(jù)提供了豐富的有關(guān)用戶行為的信息,并且隨著帶有地理標(biāo)簽的照片變得越來越普遍,這些信息的潛在利用價值也在不斷增加。
   占據(jù)了網(wǎng)絡(luò)信息很大部分且時刻不斷增加及變換的照片和視頻為多媒體、數(shù)據(jù)挖掘以及與地理學(xué)相關(guān)的研究與應(yīng)用提供了新的研究機會和挑戰(zhàn)。這些多媒體數(shù)據(jù)(例如照片)不僅含有像標(biāo)簽、標(biāo)題以及一些表述信息;而且還含有時

2、間信息——照片拍攝的時間,以及空間位置信息——照片拍攝地點的經(jīng)緯度。
   近幾年來,在基于簡單假設(shè)——旅游景點常被頻繁拍照的情況下,通過挖掘社會化媒體網(wǎng)站中的大量照片的信息,尋找旅游景點并為游客推薦合適景點的相關(guān)研究已經(jīng)成為了研究熱點。游客所提供的帶有地理標(biāo)簽的照片集可看作是其已經(jīng)訪問過的景點序列。利用這些信息可為游客建立旅游歷程。在近幾年中,研究者已經(jīng)提出各種方法尋找有意義的景點位置信息或是有代表性的旅游景點序列,進一步解決

3、有關(guān)旅游方面的難題。另外,這些網(wǎng)站上提供的大量數(shù)據(jù)為研究游客在景點中的行為信息提供了一個有利條件,并且這些信息也有助于研究游客在旅游中對景點的態(tài)度、注意力以及興趣。
   對要去陌生城市旅游的游客而言,制定旅行計劃是最重要的。由于對旅游的城市比較陌生,游客通常需要查看旅游方面的書籍、個人旅游博客或者將網(wǎng)絡(luò)上的一些零碎信息進行整合并制定出旅行計劃。對游客而言,通過這些方式找到一些重要的旅游景點并將它們進行排序以確定旅行日程,這是非

4、常困難的、耗時的、也是比較辛苦的。在類似Flickr網(wǎng)站上,用戶上傳的大量展示他們旅游歷程的照片為我們建立旅行推薦系統(tǒng)提供了重要的條件,該旅行輔助系統(tǒng)具有如下特點:
   集體智慧:對剛到陌生地方而又缺乏旅游經(jīng)驗的游客而言,詢問了解該地方的人則是一個比較好的方法。游客通過這種方法可獲得更多準(zhǔn)確而又及時的信息。但是,該方法需要游客花費時間去消化并整合所收集到的信息,進而為其旅游所用。在類似Flickr網(wǎng)站上,我們將用戶所提供的帶有

5、地理標(biāo)簽的照片作為游客旅行歷程的源泉,借助集體的智慧完成兩個任務(wù):(1)利用照片的地理標(biāo)簽對照片進行分組,匯編出一個城市的旅游景點集;(2)確定游客在不同背景下對旅游景點的使用模式。
   個性化:在本文中,我們假設(shè)游客有特定的旅行偏愛,他們游覽一些具有相似特征的景點。通常,游客在景點拍照暗示其對該景點的喜愛。我們根據(jù)游客提供的照片及他們以往旅行歷程建立游客相似性模型,得到游客特定的旅行偏愛,進一步為其進行個性化旅游推薦。

6、>   情境感知:在特定的旅游景點序列中,游客對于景點的偏愛程度會受其當(dāng)時所處位置、時間以及周圍環(huán)境的影響。我們從含有地理標(biāo)簽的照片中獲得拍照的時間以及拍照的地點信息,利用這些信息估計游客在不同時間段中游覽景點的狀況。此外,各種在線天氣服務(wù)網(wǎng)站不僅提供了特定地理位置的當(dāng)前天氣狀況,而且也提供該地區(qū)以往天氣狀況。我們將該地區(qū)當(dāng)前天氣狀況的數(shù)據(jù)增加到該位置的當(dāng)前天氣背景信息中;利用該地區(qū)以往天氣狀況的數(shù)據(jù)過濾掉一些旅游景點,進一步為游客推

7、薦旅游景點。
   本文的任務(wù)是研究基于社會化媒體的數(shù)據(jù)挖掘技術(shù)。我們從社會化媒體以及可利用網(wǎng)絡(luò)資源中挖掘有用的信息,對旅游景點進行分析并為游客推薦合適的旅游景點。本文的主要研究內(nèi)容如下:
   1.景點分析:在本文中,我們在分析帶有地理標(biāo)簽的照片的基礎(chǔ)上,提出一種簡便且具有可擴展性的方法。該過程具體說明如下:(a)如何利用地理標(biāo)簽將用戶提供的照片進行分組,找到旅游景點;(b)如何將照片提供的文本信息進行聚集并增加由網(wǎng)絡(luò)

8、服務(wù)提供的信息,為景點提供更多的描述信息;(c)如何對景點進行概述以及如何獲得用戶對景點的偏愛程度。照片中的時間標(biāo)簽可用作推斷用戶對景點的游覽狀況。每個景點的配置屬性提供了有關(guān)用戶的游覽信息以及相關(guān)的背景信息。通過照片上的時間標(biāo)簽,我們可以確定游客游玩的時間信息,并結(jié)合在線天氣信息資源進一步確定游客游玩時的天氣狀況。在本文中,我們闡述了如何將零碎的背景信息與稀少的照片本身內(nèi)容信息以及在線信息資源結(jié)合起來的過程,進一步增加對旅游景點的描述

9、信息。為了對旅游景點進行時空數(shù)據(jù)分析,我們建立了景點分析概念基礎(chǔ)。我們使用該概念基礎(chǔ)提供景點信息。當(dāng)然,當(dāng)?shù)卣⒎?wù)提供商以及旅游代理也可以使用該概念基礎(chǔ)建立以用戶為中心的應(yīng)用并提供基于位置信息的服務(wù)。
   2.重要旅游景點推薦:通過對網(wǎng)絡(luò)上游客們提供的大量帶有地理標(biāo)簽的照片的分析,根據(jù)游客所在陌生城市的當(dāng)前背景信息,我們?yōu)橛慰屯扑]重要旅游景點。完成該任務(wù)的動機包含兩部分:首先,當(dāng)游客在陌生城市旅游時,該系統(tǒng)會為其推薦重要旅

10、游景點;其次,該系統(tǒng)會根據(jù)游客當(dāng)前所處的背景信息(例如:時間和天氣情況),為其推薦最合適的旅游景點。在本文中,我們使用基于概率的方法選擇城市中的景點以符合游客當(dāng)前背景信息?!傲餍小?、“重要”、“感興趣”都是主觀性術(shù)語,不同的人會有不同的定義?;谟慰驮u價模型,我們定義了合理函數(shù),例如我們將游客對特定景點游覽的次數(shù)作為衡量景點重要程度的標(biāo)準(zhǔn),為景點評分并將景點進行排序。
   3.個性化旅行推薦:利用帶有地理標(biāo)簽的照片,我們提出了

11、基于情境感知的個性化旅游景點推薦系統(tǒng)架構(gòu)。當(dāng)某游客到陌生城市旅游時,該系統(tǒng)根據(jù)游客的旅游偏愛以及該城市當(dāng)前背景信息為其推薦若干景點。我們根據(jù)游客在一個城市的以往游覽歷史獲得其旅游偏愛,然后利用該信息為游客在其它城市旅游時推薦景點。本文中所提方法將景點在不同背景下的流行度作為特征匹配標(biāo)準(zhǔn),結(jié)合游客當(dāng)前背景信息,為游客推薦出合適的旅游景點序列。
   4.個性化旅行線路推薦:當(dāng)游客面對城市中的眾多景點時,他需要選擇合適的旅行線路并制

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論