網絡信息與股票市場的相關性探究——基于股票論壇的文本挖掘分析.pdf_第1頁
已閱讀1頁,還剩65頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、隨著經濟的發(fā)展和信息技術的進步,互聯(lián)網已經成為當今網民進行情感交流、信息傳播的主要渠道,互聯(lián)網上每天都有海量的信息產生。信息是投資者做出投資決策的重要依據。投資者投資失敗在很大程度上是由于信息不對稱造成的。在這樣的背景下,研究網絡信息與股票市場的關聯(lián)機制,即探究如何高效獲得有效信息并通過分析、挖掘提煉出有價值的知識進行市場預測,為投資者的市場分析和投資決策提供有力的依據,具有重要的理論意義和現(xiàn)實意義。
  因為股吧論壇上的信息與股

2、票市場相關性最強,因此本文想要探究的是股吧論壇上的網絡信息是否會對股票市場的收益率、成交量、波動率等造成影響。具體的做法是,利用爬蟲軟件收集東方財富網股吧上上證50指數的50只成分股最近一年時間內的所有發(fā)帖數據共278萬條,然后利用樸素貝葉斯分類算法將這些帖子分成“積極”、“中立”、“消極”三類,并根據分類結果構建投資者情緒指標、投資者意見分散度等網絡信息變量。
  根據經驗數據及對原始數據做的統(tǒng)計性描述結果,本文提出了3個假設:

3、(1)股票市場的交易量與投資者在網絡上的發(fā)帖量存在正向相關關系;(2)股票市場的收益率與投資者情緒指標存在正向的相關關系;(3)股票市場的日內波動率與投資者的意見分散度存在正向相關關系。然后,以上證50指數為例,通過對投資者情緒指標、發(fā)帖量、投資者意見分散度這三個網絡信息變量與收益率、成交量、日內波動率這三個股票市場變量分別做相關性分析,根據相關性分析的結果我們初步判斷假設1和假設2成立,假設3不成立,即初步來看股票收益率與投資者情緒指

4、標正向相關;股票市場的成交量與股吧發(fā)帖量正向相關;但股票市場日內波動率與投資者情緒指數無關。
  為了進一步探索各變量之間是否存在領先滯后的關系,本文分別在股市處于上漲階段和下跌階段兩個時期內,以50只個股的數據對網絡信息變量與股票市場變量分別作了滯后期和不包含滯后期的面板數據回歸分析。面板數據回歸的結果,正好驗證了我們上述的初步判斷結果。綜合全文的檢驗分析,本文得出以下結論:(1)股吧論壇的發(fā)帖者行為特征比較獨特,發(fā)帖時間比較固

5、定。發(fā)帖量會在上午的10點和下午的2點出現(xiàn)日內的兩個高峰,之后會在晚上9點左右出現(xiàn)日內的第三個發(fā)帖高峰期。(2)網絡信息變量與股票市場變量存在相關性。投資者情緒指標和投資者意見分散度可以用于解釋股票市場的收益率。如果投資者情緒指標越高漲,或者投資者意見越統(tǒng)一,市場阻力就會越小,同期的股票收益率也越高。另外,股吧發(fā)帖量可以很好地用于對股票交易量的解釋,股吧發(fā)帖量越大,股票的成交量也越大。(3)網絡信息變量在某種程度上對股票市場具有預測的作

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論